linux 中的文件查找技巧

which

which命令会在PATH变量指定的路径中,搜索某个系统命令的位置。例如:

which -a which  #查看命令which所在位置,-a参数表示找出所有
/usr/bin/which
/bin/which

whereis

whereis命令用于搜索程序的二进制文件,源代码文件或帮助文档。例如:

whereis ls  #如果上述三者有,则三者都会显示。
ls: /bin/ls /usr/share/man/man1/ls.1.gz

whereis -m ls #只查看ls的帮助手册
ls: /usr/share/man/man1/ls.1.gz

whereis -b ls #只查找ls的二进制文件
ls: /bin/ls

whereis stdio.h #查找stdio.h头文件,和帮助手册
stdio: /usr/include/stdio.h /usr/share/man/man3/stdio.3.gz

type

type用于查看命令类型,一般有以下类型:

alias:别名
keyword:关键字
builtin:内置命令
file:外部命令

而常见参数如下:

-t 输出类型名,如file
-p 如果是外部命令,则显示其所在路径
-a 对于外部命令,它会显示命令路径,命令类型等信息

我们来看几个例子:

type ls   #ls是一个别名
ls is aliased to `ls --color=auto'

type cd    #cd是一个内置命令
cd is a shell builtin

type find
find is /usr/bin/find

type  function  #function是一个shell关键字
function is a shell keyword

type -a which  #显示所有路径
which is /usr/bin/which
which is /bin/which

locate

前面所说的命令都限于查找命令,帮助手册或源文件,而locate用于快速查找任何文件。它从一个系统数据库进行文件查找,而不需要遍历磁盘,因此速度极快。通常该系统数据库每天更新一次(可以查看系统的/etc/cron.daily/mlocate,不同系统可能不一样)。
常见选项如下:

-e  仅查找存在的文件
-q  安静模式,不会显示任何错误讯息
-n  至多显示 n个输出
-r  使用正规运算式
-i  查找忽略大小写
-c  打印匹配结果数量

假设当前目录早已存在以下文件:

locate.txt  locate.log  LOCATE.zip

我们来看一些实例。

快速查找文件

locate locate.txt  #查找locate.txt
/home/hyb/workspaces/shell/locate/locate.txt

查找存在的文件

locate locate.txt  #查找之前删除locate.txt
#虽然文件不存在,但是仍然被查找出来
/home/hyb/workspaces/shell/locate/locate.txt 

locate -e locate.txt  #-e参数可以查找只存在的文件
(由于该文件不存在,因此也不会被查找出来)

查找计算文件的数量

locate -c locate.log #只计算查找到的数量
 1

忽略大小写查找

locate -i locate.zip
/home/hyb/workspaces/shell/locate/LOCATE.zip

使用正则表达式

普通的查找是模糊匹配的,因此只要目标名称中包含要搜索的名称,都会被搜索出来,但是我们可以利用正则表达式,来精确查找。

locate -r /locate.log$  #查找以/locate.log结尾的文件 

结合正则表达式,locate有更丰富的查找方式,这里不展开。

locate查找存在的一个问题是,如果最近有文件被删除,它仍然能找出来,最近有文件增加,它却找不到。也就是说,它的查找并不具备实时性。当然我们可以手动执行updatedb命令来更新数据库(可能需要root权限)。

find

find命令是linux下一个强大的查找命令。与locate命令相比,它需要遍历磁盘文件,因此查找速度较慢,但正因如此,它的实时性比locate好得多。另外一方面,find命令的查找条件比locate丰富得多。

以名称为条件

最常用的恐怕就是以文件名为条件了,涉及参数-name,-iname,例如:
当前目录下查找以sort开头的文件:

find ./ -name "sort*"
./sort4.txt
./sort2.txt
./sort3.txt
./sort.txt

find ./ -iname "SORT.txt" #忽略大小写
./sort.txt

以权限为条件

有时候需要查找特定权限的文件,可以使用-perm参数,例如查找当前目录下权限为777的文件:

find ./ -perm 777
./test
./sort.txt

以文件类型为条件

涉及参数-type,例如要查找当前目录下的符号链接文件:

find ./ -type l
./test
ls -al test
lrwxrwxrwx 1 hyb hyb 8 11月 24 10:10 test -> home.zip

主要类型有:

  • f 普通文件
  • d 目录
  • b 块设备文件
  • c 字符设备文件
  • l 符号链接
  • s 套接字
  • p 管道文件

以文件大小为条件

涉及参数-size,例如:

find ./ -size 1k  #查找当前目录下小于1k的文件
./test
./sort4.txt
./sort2.txt
./sort3.txt
./test.sh
./sort.txt

find -size +1M  #查找当前目录下大于1M的文件
./test.zip

常用单位有:

  • k 千字节
  • M 兆字节
  • G 吉字节
  • c 字节
  • b 块,一般为512字节
  • w 字大小,两个字节

以归属为条件

涉及参数-user,-nouser,-group,-nogroup等,例如:

find ./ -user root  #查找当前目录下root用户的文件
find ./ -nouser   #查找当前目录下root用户的被删除的文件

-group,-nogroup类似的用法,只不过条件是用户组。

以时间为条件

涉及参数-mtime,-atime,-ctime,-newer,-anewer,-cnewer,-amin,-cmin等,例如:

find ./ -mtime 3 #查找3天前更改过的文件
find ./ -mtime -3 #查找3天内更改过的文件
find ./ -mtime 0 #查找今天更改过的文件
find ./ -newer sort.txt #查找比sort.txt修改时间更新的文件
find ./ -anewer sort.txt #查找比sort.txt访问时间更新的文件
find ./ -amin  5 #查找5分钟之前访问过的文件

注:

  • atime 最后访问时间
  • mtime 最后修改时间
  • ctime 最后修改时间,这里包括属性和权限

find命令的查找条件比较多,而其用法也非常丰富,本文仅简单介绍,后面的文章将会介绍find的一些高级用法。

find命令高级用法

查找空文件或空目录

有时候需要清理一些空的文件或者文件夹。这个时候就需要先找到它们。

查找空文件

我们利用之前介绍过的size参数,例如:

find ./ -size 0 #查找当前目录下大小为0的文件
./size_0_file

当然也可以利用-empty参数,例如:

find -type f -empty # -type f指明了要查找的是文件
./size_0_file

查找空目录

查找空目录只需要利用-empty参数即可。例如:

find -type d -empty
./test3
./find/test3
./find/test2
./test2

查找出这些空文件或者文件夹,通常要对其进行处理,最常见的操作就是删除。如何删除呢?我们后面再说。

查找时排除文件或目录

查找时排除文件

例如,我们按照名字查找某一类文件,但是又不想找到其中的.log文件时,可以使用!逻辑运算符查找,例如:

find ./ -name "*test*"  ! -name "*.log" #排除.log文件
./find/test.sh
./find/test.zip

查找时排除目录

我们在查找某些文件时,可能已经知道某个目录有,但又不想浪费时间再次查找,可以使用-prune参数和-path参数,例如:

find .  -path ./test -prune -o -name "*.txt"

这里查找txt文件,但是排除test目录下的txt文件。但是注意./test不能写成./test/,否则结果将不正确。测试的时候,发现./test仍然会出现在查找结果中。另外-prune不要和-depth(-delete)一起使用,否则-prune将不起作用。

如果需要排除多个目录呢?

find ./ ( -path "./test" -o -path "./home" ) -prune -o -name "*.txt" 

注意,这里(和)前后都有空格。它是告诉shell后面的字符不解释,让find命令自己解释其作用。

当然了,排除目录还可以使用!逻辑符号。例如:

find ./ -name "*.txt" ! -path "./test"

对查找到的文件执行命令操作

在查找到文件之后,我们可能需要对它进行操作,例如删除,移动等。我们可以利用xargs。例如:

find -name "*.log" |xargs rm -f #找到.log文件后,删除
find -name "*test" |xargs chmod 755 #将找到文件的权限修改为755
find -name "*test" |xargs grep "hello" #查找包含hello字符串的test文件

xargs后面跟的是要执行的命令,这里只是简单举例。

我们还可以利用-exec参数。例如:

find ./ -name "*txt"  -exec rm -f {} ;#找到后删除
find ./ -name "*txt"  -exec cp {} ./test ;#找到后复制至test目录下

这里的{}指代了查找到的内容。;作为命令参数结束的标志,因此是必要的。小编提醒一下,删除需谨慎,都是泪啊。rm 带上-i参数,可进行交互式删除,即需要询问。

我们也可以利用-ok参数,它与-exec的差别在于,它会询问用户,很适合用于删除:

find ./ -name "*.log" -ok ls -al {} ;
< ls ... ./locate/locate.log > ? 

删除查找到的文件

除了前面介绍的利用xargs和exec删除文件之外,还可以利用-delete参数。例如:

find ./ -name "*.log" -delete #删除以log为后缀的文件

多条件组合查找

在前面其实我们已经看到了条件组合的使用。常用的条件组合参数有-a(and),-o(or),!(not)。我们来看几个实例:
实例1.查找普通文件和符号链接文件:

find ./ -type f -o -type l #查找普通文件和符号链接文件

实例2.在当前目录下查找zip包和gz包:

find ./ -name "*.zip" -o -name "*.gz"

实例3.查找名为test的符号链接文件:

find ./ -name "*test" -a -type l

实例4.查找log文件以外的文件:

find ./ ! -name "*.log"

以上几个实例简单介绍了条件的组合使用。更丰富的用法可以自行探索。

查找比某文件新或某文件旧的文件

环境上日志文件太多,想删除某个时间之前的文件,该怎么处理?
可以利用以下参数:

  • newer 修改时间更新的
  • anewer 访问时间更新的
  • ctime 修改时间更新的,包括属性的修改
find ./ ! -newer 1.log |xargs ls -al #列出比1.log更旧的文件
find ./  -newer 1.log |xargs ls -al #列出比1.log更新的文件

这里我只是列出,并没有删除,删除可参考前面介绍的删除找到的文件。而如果要查找出比文件1更新,比文件2旧的文件,只需要利用组合条件即可。

查找结果以特定格式输出

前面的多数查找结果只是列出路径和文件名,如何获取更多信息呢?当然我们可以利用xargs或者exec,结合ls -al获取文件的更多信息,但是我们还有更好的方法。例如,将查找到的log文件的文件名,访问时间,权限信息,大小等信息输出:

find ./ -name "*.log" -printf "%f %a %M %s"
locate.log Sat Nov 24 09:44:22.3078519090 2018 -rw-rw-r-- 69
test.log Sat Dec 15 15:09:33.9905929210 2018 -rw-rw-r-- 0

常见的格式控制输出如下:

  • %f 文件名
  • %a 访问时间
  • %c 修改时间
  • %M 权限信息
  • %m 权限位信息
  • %s 文件大小,单位为字节
  • %d 文件所在目录层级
  • %u 文件所属用户
  • %p 带相对路径的完整名
  • %y 文件类型

转自脚本之家