Perl中删除或替换字符串中特殊字符（如空格）的方法_perl 文本替换

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

坚韧的啤酒 · 表达式和函数 - Azure Data ...· 8 月前 ·

寂寞的登山鞋 · 如何：建立和使用unique_ptr實例 ...· 2 年前 ·

乐观的沙滩裤 · C++17之 ...· 2 年前 ·

英俊的木耳 · 三种批量删除PLSQL写法效率的比对 - ...· 3 年前 ·

这篇博文很简单，只是因为我对Perl语言实在不熟悉，所以这里简单记录一下。

今天在写实验代码的时候，突然有了这样一个需求，就是用Perl将包含换行（或回车）的字符串变成一行，并且每一行用空格分隔，经过搜索，网友介绍了这样的写法：

$string=~ s/[\n\r]/ /g;

其实也很好理解，这里把网友的解释摘抄过来：=~ s/A/B/g 可以起到替换的作用，就是将内容A替换成内容B，后面的g是全局的意思，也就“全部替换”的意思。

[AB]意为A或者B两种情况。

Perl的转义字符和C很相似：

\n 换行
\r 回车
\t 水平制表符(Tab)
\b 退格
\e Esc (ASCII编码的转义字符)
\\ 反斜线
\" 双引号

所以上面这种写法就很好理解了。

另外在Perl中删除字符串前后空格的方法：

$string =~ s/^\s+//;
$string =~ s/\s+$//;

再举两个例子：

$str =~ s/\s\s+//g;  #-----全局替换2个以上的空格为空

$AAA =~ s/[\n\r]*//g

[ AB ]表示出现在中括号的是任意的其中一个，\n和\r是换行符，[\n\r]*中的*号表示0个或以上
总结起来，上面这条语句的含义是：将$AAA中的所有的换行符全部替换为空，也就是将所有换行去掉。

另外转载一下网友介绍的Perl正则表达式匹配规则：

++++++++++++++++++++++++++++++++++++++++++

对于一些常用的匹配方式有时候不需要去编写复杂的匹配模式，正则表达式的\w \s \d \b与量词的组合能帮我们解决很多事情。
\w 匹配一个字母、数字或下划线字符，相当于[a-zA-Z_0-9]
\s 匹配一个空字符
\d 匹配一个数字
\b 匹配单词的首尾
这些修饰符的大写形式为它们匹配的相反情况。

这样我们要匹配连续的字符串可以用 \w+ 匹配一个单词用 \b\w+\b 匹配空白用\s+
匹配所有字符用[\d\D]，匹配除换行符之外的所有字符用“.”

最开始我说过， Perl 的最强大之处在于处理文本。然而，在前两篇（一、二）中，我只介绍了如何来匹配模式。本文中我将演示如何通过模式来改变 字符串 ，即如何使用正则表达式来处理文本。替换 s///：如果将m//看作“查询”，那s///操作则类似于“查询并替换 ”，它将替换模式所匹配上的部分。m//可以和任何 字符串 表达式进行比配，但显然s///只能修改被称为左值的数据，其它一些编程语言中，有函数ltrim和rtrim分别用于从 字符串 开头和末尾删除空格和制表符。也有的提供了函数trim来删除 字符串 两端的空白字符。 Perl 里没这些函数因为简单的正则表达式替换就能实现这个目的（不过我确信CPAN有很多模块实现了这些函数）。事实上这太简单了以至于成了帕金森琐碎定理里的一个显著主题。使用正则表达式分两步走:先去掉前面的: $a=~s/^ +//;在去掉后面的: $a=~s/ +$//;一步就可以：s/(^s+|s+$)//g; 删除 字符串 末尾的换行：chomp函数通常会删除变量里包含的 字符串 尾部的换行符。它是chop函数的一个略微安全些的版本，因为它对没有换行符的 字符串 没有影响。更准确地说，它根据了解$/的当前值删除 字符串 终止符，而不只是最后一个字符。和chop不同，... 替换文件中的字符 将以下文件中的RF*****， >RF00001;5S_rRNA;DQ397844.1/16860-16979 414005:Cenarchaeum symbiosum B CAAGCCGGCCAUAGCGUCAGGGUGCGACCCAAUCCCAUUCCGAACUUGGA AGUCAAACCUGAUGUCGCUGUUGUGUUACUAAGAUGCGAGAGCUCUUGGG AAGCAACAGUGCU m//模式用来匹配文本，也就是说用来找数据。而s///用来查找并替换文本，所以可以用来处理文本文件。在有了正则的基础之后，s///用起来会简单很多。用法格式为： $str =~ s/reg/replacement/FLAGS; 它表示用reg去搜索$str 中的内容，并将搜索出来的内容替换为replacement。 1.s///的斜线可以替换为其他对称的符号(括号类)或相同的符号。例如...