新聞中心
電腦長時(shí)間使用之后,不可避免的會產(chǎn)生各種無用的文件,而這其中有很大一部分都是重復(fù)文件,這些重復(fù)文件可能是你出于臨時(shí)備份多次復(fù)制而產(chǎn)生的,也有可能是某些軟件程序自動生成的,本篇文章為大家分享一下Linux下尋找相同的文件具體方法。

專注于為中小企業(yè)提供做網(wǎng)站、網(wǎng)站建設(shè)服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)射洪免費(fèi)做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動了1000+企業(yè)的穩(wěn)健成長,幫助中小企業(yè)通過網(wǎng)站建設(shè)實(shí)現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。
所以如果你的電腦空間告急的話,可以試著去刪除這樣的文件,釋放一些空間。在 Linux 下,我們可以通過識別文件的 inode 值來找出系統(tǒng)中的相同文件。
inode 是一個(gè)數(shù)據(jù)結(jié)構(gòu),記錄了文件所有信息,除了文件名和文件內(nèi)容。如果兩個(gè)或多個(gè)文件具有相同的 inode 值,即使它們的文件名不一樣,位置不一樣,它們的內(nèi)容、所有者、權(quán)限其實(shí)都是一樣的,我們可以將其視有相同文件。
這類型的文件其實(shí)就是所謂的「硬鏈接」。硬鏈接具有相同的 inode 值,但文件名不一樣。而軟鏈接其實(shí)就是快捷方式,它指向目標(biāo)文件,但有著自己的 inode 值。
$ ls -l my*
-rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 myfile
lrwxrwxrwx 1 liangxu liangxu 6 Apr 15 11:18 myref -> myfile
-rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 mytwin
我們無法直接知道同一目錄下有哪些文件是有相同的 inode 值,但要識別起來也不難。其實(shí)我們只要使用 ls -i 命令,再以 inode 值進(jìn)行排序,就可以直接找到這些文件。
$ ls -i | sort -n | more
...
788000 myfile
在這個(gè)結(jié)果的第一列里,就是對應(yīng)的 inode 值。所以從這個(gè)結(jié)果里我們一眼就可以看出來,哪些文件具有相同 inode 值。
如果你只是想找到一個(gè)文件的對應(yīng)硬鏈接文件,我們可以使用 find 命令,再加個(gè) -samefile 選項(xiàng)即可快速找到。
$ find . -samefile myfile
./myfile
./save/mycopy
./mytwin
這些文件都是有相同的 inode 值,不信的話可以再使用 ls 命令來查看更多信息:
$ find . -samefile myfile -ls
788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 ./myfile
788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 ./save/mycopy
788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 ./mytwin
我們可以看到,除了文件名之外,這幾個(gè)文件名的信息完全一樣。細(xì)心的朋友可能會注意到,在第2列(硬連接數(shù))是4,而實(shí)際上我們找出來的文件只有3個(gè),這說明還有一個(gè)文件與他們共享 inode 值,只是我們通過這條命令沒有找出來而已。
作為一個(gè)懶人,每次敲命令多麻煩,直接上腳本找出目錄下的相同文件!
#!/bin/bash
# seaches for files sharing inodes
prev=""
# list files by inode
ls -i | sort -n > /tmp/$0
# search through file for duplicate inode #s
while read line
do
inode=`echo $line | awk '{print $1}'`
if [ "$inode" == "$prev" ]; then
grep $inode /tmp/$0
fi
prev=$inode
done $0
# clean up
rm /tmp/$0
運(yùn)行結(jié)果:
$ ./findHardLinks
788000 myfile
788000 mytwin
當(dāng)然了,你還可以使用 find 命令,根據(jù) inode 值,找到系統(tǒng)里所有相同文件。
$ find / -inum 788000 -ls 2> /dev/null
788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /tmp/mycopy
788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /home/liangxu/myfile
788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /home/liangxu/save/mycopy
788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /home/liangxu/mytwin
在這條命令里,我們將錯(cuò)誤提示重定向到 /dev/null 這個(gè)特殊文件里,這樣在搜索一些我們沒有權(quán)限訪問的路徑時(shí),不會滿屏的 permission denied 。
分享題目:Linux下尋找相同的文件具體方法
鏈接分享:http://m.5511xx.com/article/dhhpeje.html


咨詢
建站咨詢
