从 grep 的用法说起

我本不想写这篇文章,首先我觉得这些东西大家肯定都知道,其次就算真不知道还有手册。

直到那天面试的时候我碰到一个哥们,我问他grep你都知道哪些选项?他告诉我,只有-r。我当时就乐了,既然grep是你常用的命令,你凭什么只知道-r?他回答说,他只想把精力放到内核上,没有时间来学习这些东西。我笑,正是因为你没有时间,所以你才应该提高你的工作效率,而熟悉命令行显然是Linux上一种提高工作效率的方式。有句老话说得好:“磨刀不误砍柴功。”

有的同学可能觉得我在提倡死记硬背了,事实上我比你更反对中国教育的那种死记硬背。我的观点很简单:既然你用得多,那么有些东西,比如grep的一些选项,自然而然就应该记住了,无须刻意去背。

所以,我在这里以grep为例来展示一下。注意,以下内容没有参考一眼grep的手册。

grep最常用的选项可能是-i,-n和-r了,至少于我如此。-i是忽略大小写,-n可以告诉你找到的东西在文件的哪一行。-r或者-R(看你愿不愿意多按个shift键了),可以去递归一个目录。

-A和-B,你可能就用的比较少了,前者制定显示匹配到的那一行之后的几行,后者指定之前的,比如grep -A 3 -B 4就是说也要显示匹配到的那一行之前的4行和之后的3行,可见A是After,B是Before。用得着刻意去记嘛?显然不用。

-I(大写i)可能用得就更不多了,可惜啊,它非常有用。比如你编译出的内核二进制和你的源代码在同一个目录时,你grep一些字符串的时候会发现一些.o文件中也可以找到,很明显它不是我们想要的,这时候-I就派上用场啦!它告诉grep去忽略二进制文件。

这让我想到了另一个—exclude(我记得似乎没有短选项与之对应),顾名思义,它是用来排除一些文件。比如你编译的内核目录下还有.cmd这种文件的话,它不是二进制,所以-I排除不掉,这时候你就可以用—exclude “.cmd”了。

-H,这个用得更少了,你一般不会需要它,因为grep默认就会输出文件名。然而,当grep与find联手的时候就不会了(至于为什么,留给你作为课后作业),这时候你就要用到-H了。比如,我在内核源代码目录下查找CONFIG_DEBUG_KMEMLEAK定义在哪,我通常这么做:find . -iname ‘kconfig*’ -exec grep -Hwn DEBUG_KMEMLEAK ‘{}’ ;

我上面用到了另一个选项-w,看见了嘛?它可能是另外一个被严重忽视了的选项,仅次于-I啊!它的意思是告诉grep我所查找的是一个完整的单词,也就是说,当你找DEBUG_KMEMLEAK的时候它不会给你找出DEBUG_KMEMLEAK_EARLY_LOG_SIZE,你懂的。这可以省去你手工去加b了。

噢,我差点儿忘了亲爱的-e,多数情况下你也不需要它,因为grep后面接的就是一个regrex嘛!-e神马时候派上用场呢?我建议你在这里仔细想想,一个很特殊的情况——我要搜索的字符串以”-“开头时!比如我要搜索”-wangcong”这个字符串,直接grep “-wangcong”显然是不行滴!grep会认为那是”-w -a -n -g -c -o -n -g”,无论你怎么加引号!一种解决方法是加反斜线,而另一种方法就是-e “-wangcong”了。顺便说一句,使用多次-e就相当于进行一个“或”操作,所以grep “vmx|svm”就等价于grep -e vmx -e svm。

-o我估计用的人也不多,它的意思是只输出匹配到的东西,同一行的其它东西不输出。例如,我想搜索printk.c中全部的C语言字符串时,我会这么做:grep -o ‘“.*”‘ kernel/printk.c,有点儿类似于strings kernel/printk.o。

-b,知道这个人的灰常少了吧?如果你知道,恭喜你晋级grep高手级别了!我承认我只用过它一次,是在一个脚本中,我想知道某个“字符串”出现在文件的第几个字节。我印象中这里是有bug的,因为我当时总得不到正确的结果,当然也有可能是我理解不对,没看手册而且没有再次实验,所以这个问题就留给你了。:-)

-q嘛,大家都知道,脚本中常用。

-c嘛,比如统计CPU个数:grep -c ‘^processor’ /proc/cpuinfo,实在没必要多一个管道去 grep ‘^processor’ /proc/cpuinfo | wc -l。

好了,我就想起来这么多了,欢迎补充。我觉得一个好的Linux程序员应该对他/她敲出的每一行命令的每一个选项都精益求精,不多不少。

我知道有些人对此不屑一顾,嗤之以鼻,我只想告诉这些人一句话:“天下大事必做于细,天下难事必做于易。”你要是认为我这是在教育你,你就错大了,我对教育人,尤其是教育你这种人,没任何兴趣!你倒找给我钱我都不会稀罕去教育你!有他妈的多远给我滚他妈的多远!

附我窜改的《见与不见》:

你知,或者不知它/命令就在那里/不悲不喜

你看,或者不看它/手册就在那里/不来不去

你爱,或者不爱它/程序就在那里/不吵不闹

你用,或者不用它/二进制就在你的机器上/不亢不卑

去了解它们/或者/让它住进你的心里

人机合一/融为一体