这篇博文很简单,只是因为我对Perl语言实在不熟悉,所以这里简单记录一下。
今天在写实验代码的时候,突然有了这样一个需求,就是用Perl将包含换行(或回车)的字符串变成一行,并且每一行用空格分隔,经过搜索,网友介绍了这样的写法:
$string=~ s/[\n\r]/ /g;
其实也很好理解,这里把网友的解释摘抄过来:=~ s/A/B/g 可以起到替换的作用,就是将内容A替换成内容B,后面的g是全局的意思,也就“全部替换”的意思。
[AB]意为A或者B两种情况。
Perl的转义字符和C很相似:
\n 换行
\r 回车
\t 水平制表符(Tab)
\b 退格
\e Esc (ASCII编码的转义字符)
\\ 反斜线
\" 双引号
所以上面这种写法就很好理解了。
另外在Perl中删除字符串前后空格的方法:
$string =~ s/^\s+//;
$string =~ s/\s+$//;
再举两个例子:
$str =~ s/\s\s+//g; #-----全局替换2个以上的空格为空
$AAA =~ s/[\n\r]*//g
[ AB ]表示出现在中括号的是任意的其中一个,\n和\r是换行符 ,[\n\r]*中的*号表示0个或以上
总结起来,上面这条语句的含义是:将$AAA中的所有的换行符全部替换为空,也就是将所有换行去掉。
另外转载一下网友介绍的Perl正则表达式匹配规则:
++++++++++++++++++++++++++++++++++++++++++
对于一些常用的匹配方式有时候不需要去编写复杂的匹配模式,正则表达式的\w \s \d \b与量词的组合能帮我们解决很多事情。
\w 匹配一个字母、数字或下划线字符,相当于[a-zA-Z_0-9]
\s 匹配一个空字符
\d 匹配一个数字
\b 匹配单词的首尾
这些修饰符的大写形式为它们匹配的相反情况。
这样我们要匹配连续的字符串可以用 \w+ 匹配一个单词用 \b\w+\b 匹配空白用\s+
匹配所有字符用[\d\D],匹配除换行符之外的所有字符用“.”
最开始我说过,
Perl
的最强大之处在于处理
文本
。然而,在前两篇(一、二)
中
,我只介绍了如何来匹配模式。本文
中
我将演示如何通过模式来改变
字符串
,即如何使用正则表达式来处理
文本
。
替换
s///:如果将m//看作“查询”,那s///操作则类似于“查询并
替换
”,它将
替换
模式所匹配上的部分。m//可以和任何
字符串
表达式进行比配,但显然s///只能修改被称为左值的数据,
其它一些编程语言
中
,有函数ltrim和rtrim分别用于从
字符串
开头和末尾
删除
空格
和制表符。 也有的提供了函数trim来
删除
字符串
两端的空白字符。
Perl
里没这些函数因为简单的正则表达式
替换
就能实现这个目的(不过我确信CPAN有很多模块实现了这些函数)。
事实上这太简单了以至于成了帕金森琐碎定理里的一个显著主题。
使用正则表达式分两步走:先去掉前面的: $a=~s/^ +//;在去掉后面的: $a=~s/ +$//;一步就可以:s/(^s+|s+$)//g;
删除
字符串
末尾的换行:chomp函数通常会
删除
变量里包含的
字符串
尾部的换行符。它是chop函数的一个略微安全些的版本,因为它对没有换行符的
字符串
没有影响。更准确地说,它根据了解$/的当前值
删除
字符串
终止符,而不只是最后一个字符。和chop不同,...
<br /><br />
替换
文件
中
的字符<br />将以下文件
中
的RF*****,<br /><br />>RF00001;5S_rRNA;DQ397844.1/16860-16979 414005:Cenarchaeum symbiosum B<br />CAAGCCGGCCAUAGCGUCAGGGUGCGACCCAAUCCCAUUCCGAACUUGGA<br />AGUCAAACCUGAUGUCGCUGUUGUGUUACUAAGAUGCGAGAGCUCUUGGG<br />AAGCAACAGUGCU
m//模式用来匹配
文本
,也就是说用来找数据。而s///用来查找并
替换
文本
,所以可以用来处理
文本
文件。在有了正则的基础之后,s///用起来会简单很多。
用法格式为:
$str =~ s/reg/replacement/FLAGS;
它表示用reg去搜索$str
中
的内容,并将搜索出来的内容
替换
为replacement。
1.s///的斜线可以
替换
为其他对称的符号(括号类)或相同的符号。
例如...