@[toc]
如果想看更详细的Shell总结请到我之前写的博客
http://t.csdn.cn/cQArA
1.正则表达式入门
正则表达式使用单个字符串来描述、匹配一系列符合某个语法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。在 Linux 中,grep,sed,awk 等文本处理工具都支持通过正则表达式进行模式匹配。
1.1常规匹配
一串不包含特殊字符的正则表达式匹配它自己,例如:
[root@hadoop100 ~]# cat /etc/passwd | grep 00:
就会匹配所有包含 00:的行。
1.2常用特殊字符
1.2.1特殊字符:^
^ 匹配一行的开头,例如:
会匹配出所有以 a 开头的行
1.2.2特殊字符:$
$ 匹配一行的结束,例如
会匹配出所有以 h结尾的行
匹配空行
daily_archive.sh文件是在
http://t.csdn.cn/0Wpml
写的,想看的点这里看里面的内容
1.2.3特殊字符:.
匹配一个任意的字符,例如
1.2.4特殊字符:*
“*”不单独使用,他和上一个字符连用,表示匹配上一个字符 0 次或多次,例如
[root@hadoop100 ~]# cat /etc/passwd | grep ro*t
会匹配 rt, rot, root, rooot, roooot 等所有行
思考:.* 匹配什么?
匹配任意字符,可以和^$连用,放在他们中间用,就可以将下面的代码实现,以a开头,login结尾的行
[root@hadoop100 ~]# cat /etc/passwd | grep ^a.*login$
[root@hadoop100 ~]# cat /etc/passwd | grep ^a.
var.
login$
1.2.5字符区间(中括号):[ ]
[ ] 表示匹配某个范围内的一个字符,例如
[6,8]------匹配 6 或者 8
[0-9]------匹配一个 0-9 的数字
[0-9]*------匹配任意长度的数字字符串
[a-z]------匹配一个 a-z 之间的字符
[a-z]* ------匹配任意长度的字母字符串
[a-c, e-f]-匹配 a-c 或者 e-f 之间的任意字符
[root@hadoop100 ~]# cat /etc/passwd | grep r[a-z]*t
1.2.6特殊字符:\
\ 表示转义,并不会单独使用。由于所有特殊字符都有其特定匹配模式,当我们想匹配某一特殊字符本身时(例如,我想找出所有包含 '$' 的行),就会碰到困难。此时我们就要将转义字符和特殊字符连用,来表示特殊字符本身,例如
就会匹配所有包含 $ 的行。注意需要使用单引号将表达式引起来。
1.2.7匹配手机号
[root@hadoop100 scripts]# echo "13812345678" | grep ^1345780-90-90-90-9$
[root@hadoop100 scripts]# echo "13812345678" | grep -E ^134578{9}$
记得加大写的-E,因为目前grep不支持{9}的扩展的正则的,所以需要加上-E,表示支持扩展的正则表达式
如果想看更详细的Shell总结请到我之前写的博客
http://t.csdn.cn/cQArA
正则表达式是你所定义的模式模板。linux工具可以用它来过滤文本。
正则表达式利用通配符来描述数据流中第一个或多个字符。
正则表达式模式含有文本或特殊字符,为sed编辑器和gawk程序定义了一个匹配数据时采用的模板。