linux 中的文件查找技巧
which
which命令会在PATH变量指定的路径中,搜索某个系统命令的位置。例如:
which -a which #查看命令which所在位置,-a参数表示找出所有
/usr/bin/which
/bin/which
whereis
whereis命令用于搜索程序的二进制文件,源代码文件或帮助文档。例如:
whereis ls #如果上述三者有,则三者都会显示。
ls: /bin/ls /usr/share/man/man1/ls.1.gz
whereis -m ls #只查看ls的帮助手册
ls: /usr/share/man/man1/ls.1.gz
whereis -b ls #只查找ls的二进制文件
ls: /bin/ls
whereis stdio.h #查找stdio.h头文件,和帮助手册
stdio: /usr/include/stdio.h /usr/share/man/man3/stdio.3.gz
type
type用于查看命令类型,一般有以下类型:
alias:别名
keyword:关键字
builtin:内置命令
file:外部命令
而常见参数如下:
-t 输出类型名,如file
-p 如果是外部命令,则显示其所在路径
-a 对于外部命令,它会显示命令路径,命令类型等信息
我们来看几个例子:
type ls #ls是一个别名
ls is aliased to `ls --color=auto'
type cd #cd是一个内置命令
cd is a shell builtin
type find
find is /usr/bin/find
type function #function是一个shell关键字
function is a shell keyword
type -a which #显示所有路径
which is /usr/bin/which
which is /bin/which
locate
前面所说的命令都限于查找命令,帮助手册或源文件,而locate用于快速查找任何文件。它从一个系统数据库进行文件查找,而不需要遍历磁盘,因此速度极快。通常该系统数据库每天更新一次(可以查看系统的/etc/cron.daily/mlocate,不同系统可能不一样)。
常见选项如下:
-e 仅查找存在的文件
-q 安静模式,不会显示任何错误讯息
-n 至多显示 n个输出
-r 使用正规运算式
-i 查找忽略大小写
-c 打印匹配结果数量
假设当前目录早已存在以下文件:
locate.txt locate.log LOCATE.zip
我们来看一些实例。
快速查找文件
locate locate.txt #查找locate.txt
/home/hyb/workspaces/shell/locate/locate.txt
查找存在的文件
locate locate.txt #查找之前删除locate.txt
#虽然文件不存在,但是仍然被查找出来
/home/hyb/workspaces/shell/locate/locate.txt
locate -e locate.txt #-e参数可以查找只存在的文件
(由于该文件不存在,因此也不会被查找出来)
查找计算文件的数量
locate -c locate.log #只计算查找到的数量
1
忽略大小写查找
locate -i locate.zip
/home/hyb/workspaces/shell/locate/LOCATE.zip
使用正则表达式
普通的查找是模糊匹配的,因此只要目标名称中包含要搜索的名称,都会被搜索出来,但是我们可以利用正则表达式,来精确查找。
locate -r /locate.log$ #查找以/locate.log结尾的文件
结合正则表达式,locate有更丰富的查找方式,这里不展开。
locate查找存在的一个问题是,如果最近有文件被删除,它仍然能找出来,最近有文件增加,它却找不到。也就是说,它的查找并不具备实时性。当然我们可以手动执行updatedb命令来更新数据库(可能需要root权限)。
find
find命令是linux下一个强大的查找命令。与locate命令相比,它需要遍历磁盘文件,因此查找速度较慢,但正因如此,它的实时性比locate好得多。另外一方面,find命令的查找条件比locate丰富得多。
以名称为条件
最常用的恐怕就是以文件名为条件了,涉及参数-name,-iname,例如:
当前目录下查找以sort开头的文件:
find ./ -name "sort*"
./sort4.txt
./sort2.txt
./sort3.txt
./sort.txt
find ./ -iname "SORT.txt" #忽略大小写
./sort.txt
以权限为条件
有时候需要查找特定权限的文件,可以使用-perm参数,例如查找当前目录下权限为777的文件:
find ./ -perm 777
./test
./sort.txt
以文件类型为条件
涉及参数-type,例如要查找当前目录下的符号链接文件:
find ./ -type l
./test
ls -al test
lrwxrwxrwx 1 hyb hyb 8 11月 24 10:10 test -> home.zip
主要类型有:
- f 普通文件
- d 目录
- b 块设备文件
- c 字符设备文件
- l 符号链接
- s 套接字
- p 管道文件
以文件大小为条件
涉及参数-size,例如:
find ./ -size 1k #查找当前目录下小于1k的文件
./test
./sort4.txt
./sort2.txt
./sort3.txt
./test.sh
./sort.txt
find -size +1M #查找当前目录下大于1M的文件
./test.zip
常用单位有:
- k 千字节
- M 兆字节
- G 吉字节
- c 字节
- b 块,一般为512字节
- w 字大小,两个字节
以归属为条件
涉及参数-user,-nouser,-group,-nogroup等,例如:
find ./ -user root #查找当前目录下root用户的文件
find ./ -nouser #查找当前目录下root用户的被删除的文件
-group,-nogroup类似的用法,只不过条件是用户组。
以时间为条件
涉及参数-mtime,-atime,-ctime,-newer,-anewer,-cnewer,-amin,-cmin等,例如:
find ./ -mtime 3 #查找3天前更改过的文件
find ./ -mtime -3 #查找3天内更改过的文件
find ./ -mtime 0 #查找今天更改过的文件
find ./ -newer sort.txt #查找比sort.txt修改时间更新的文件
find ./ -anewer sort.txt #查找比sort.txt访问时间更新的文件
find ./ -amin 5 #查找5分钟之前访问过的文件
注:
- atime 最后访问时间
- mtime 最后修改时间
- ctime 最后修改时间,这里包括属性和权限
find命令的查找条件比较多,而其用法也非常丰富,本文仅简单介绍,后面的文章将会介绍find的一些高级用法。
find命令高级用法
查找空文件或空目录
有时候需要清理一些空的文件或者文件夹。这个时候就需要先找到它们。
查找空文件
我们利用之前介绍过的size参数,例如:
find ./ -size 0 #查找当前目录下大小为0的文件
./size_0_file
当然也可以利用-empty参数,例如:
find -type f -empty # -type f指明了要查找的是文件
./size_0_file
查找空目录
查找空目录只需要利用-empty参数即可。例如:
find -type d -empty
./test3
./find/test3
./find/test2
./test2
查找出这些空文件或者文件夹,通常要对其进行处理,最常见的操作就是删除。如何删除呢?我们后面再说。
查找时排除文件或目录
查找时排除文件
例如,我们按照名字查找某一类文件,但是又不想找到其中的.log文件时,可以使用!逻辑运算符查找,例如:
find ./ -name "*test*" ! -name "*.log" #排除.log文件
./find/test.sh
./find/test.zip
查找时排除目录
我们在查找某些文件时,可能已经知道某个目录有,但又不想浪费时间再次查找,可以使用-prune参数和-path参数,例如:
find . -path ./test -prune -o -name "*.txt"
这里查找txt文件,但是排除test目录下的txt文件。但是注意./test不能写成./test/,否则结果将不正确。测试的时候,发现./test仍然会出现在查找结果中。另外-prune不要和-depth(-delete)一起使用,否则-prune将不起作用。
如果需要排除多个目录呢?
find ./ ( -path "./test" -o -path "./home" ) -prune -o -name "*.txt"
注意,这里(和)前后都有空格。它是告诉shell后面的字符不解释,让find命令自己解释其作用。
当然了,排除目录还可以使用!逻辑符号。例如:
find ./ -name "*.txt" ! -path "./test"
对查找到的文件执行命令操作
在查找到文件之后,我们可能需要对它进行操作,例如删除,移动等。我们可以利用xargs。例如:
find -name "*.log" |xargs rm -f #找到.log文件后,删除
find -name "*test" |xargs chmod 755 #将找到文件的权限修改为755
find -name "*test" |xargs grep "hello" #查找包含hello字符串的test文件
xargs后面跟的是要执行的命令,这里只是简单举例。
我们还可以利用-exec参数。例如:
find ./ -name "*txt" -exec rm -f {} ;#找到后删除
find ./ -name "*txt" -exec cp {} ./test ;#找到后复制至test目录下
这里的{}指代了查找到的内容。;作为命令参数结束的标志,因此是必要的。小编提醒一下,删除需谨慎,都是泪啊。rm 带上-i参数,可进行交互式删除,即需要询问。
我们也可以利用-ok参数,它与-exec的差别在于,它会询问用户,很适合用于删除:
find ./ -name "*.log" -ok ls -al {} ;
< ls ... ./locate/locate.log > ?
删除查找到的文件
除了前面介绍的利用xargs和exec删除文件之外,还可以利用-delete参数。例如:
find ./ -name "*.log" -delete #删除以log为后缀的文件
多条件组合查找
在前面其实我们已经看到了条件组合的使用。常用的条件组合参数有-a(and),-o(or),!(not)。我们来看几个实例:
实例1.查找普通文件和符号链接文件:
find ./ -type f -o -type l #查找普通文件和符号链接文件
实例2.在当前目录下查找zip包和gz包:
find ./ -name "*.zip" -o -name "*.gz"
实例3.查找名为test的符号链接文件:
find ./ -name "*test" -a -type l
实例4.查找log文件以外的文件:
find ./ ! -name "*.log"
以上几个实例简单介绍了条件的组合使用。更丰富的用法可以自行探索。
查找比某文件新或某文件旧的文件
环境上日志文件太多,想删除某个时间之前的文件,该怎么处理?
可以利用以下参数:
- newer 修改时间更新的
- anewer 访问时间更新的
- ctime 修改时间更新的,包括属性的修改
find ./ ! -newer 1.log |xargs ls -al #列出比1.log更旧的文件
find ./ -newer 1.log |xargs ls -al #列出比1.log更新的文件
这里我只是列出,并没有删除,删除可参考前面介绍的删除找到的文件。而如果要查找出比文件1更新,比文件2旧的文件,只需要利用组合条件即可。
查找结果以特定格式输出
前面的多数查找结果只是列出路径和文件名,如何获取更多信息呢?当然我们可以利用xargs或者exec,结合ls -al获取文件的更多信息,但是我们还有更好的方法。例如,将查找到的log文件的文件名,访问时间,权限信息,大小等信息输出:
find ./ -name "*.log" -printf "%f %a %M %s"
locate.log Sat Nov 24 09:44:22.3078519090 2018 -rw-rw-r-- 69
test.log Sat Dec 15 15:09:33.9905929210 2018 -rw-rw-r-- 0
常见的格式控制输出如下:
- %f 文件名
- %a 访问时间
- %c 修改时间
- %M 权限信息
- %m 权限位信息
- %s 文件大小,单位为字节
- %d 文件所在目录层级
- %u 文件所属用户
- %p 带相对路径的完整名
- %y 文件类型
转自脚本之家