def
delete_boring_characters
(
sentence
)
:
return
re
.
sub
(
'[0-9’!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘’![\\]^_`{|}~\s]+'
,
""
,
sentence
)
if
__name__
==
'__main__'
:
clean_str
=
delete_boring_characters
(
'[Helloworld!!!!]'
)
print
(
clean_str
)
使用方法import redef delete_boring_characters(sentence): return re.sub('[0-9’!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘’![\\]^_`{|}~\s]+', "", sentence)if __name__ == '__main__': clean_str = delete_boring_characters('[Helloworld!!!!]')
import re
s = '1123*#$
中
abc国'
str = re.sub('[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~\s]+', "", s)
#
去除
不可见
字符
str = re.sub('[\001\002\003\004\005\006\007\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a]+', '', x)
print(str)
# 结果为:
中
国
# 通过re过滤除
中
英文及数字以外的其他
字符
def filter_string(des_string, re_string=''):
res = re.compile("[^\\u4e00-\\u9fa5^a-z^A-Z^0-9]")
return res.sub(re_string, des_string)
【1】py
这个例子比较简单,但是你运行之后,会发现会报错:异常错误解决办法:这是因为content不是一个
字符串
,需要将content转换成
字符串
类型或者将content定义成
字符串
类型。
程序运行结果:...
一、
去除
空格
strip()
去除
头尾的
空格
,
中
间部分不
去除
" xyz ".strip() # returns "xyz"
" xyz ".lstrip() # returns "xyz "
" xyz ".rstrip() # returns " xyz"
4-6 如何去掉
字符串
中
不需要的
字符
方法一,
字符串
strip() lstrip() rstrip() 去掉
字符串
两端
字符
方法二,删除单个位置的
字符
,可以使用切片 + 拼接的方式
方法三,
字符串
的replace()方法或者正则表达式re.sub删除任意位置
字符
方法四,
字符串
translate方法,可以同时删除多种不同的
字符
方法一,
字符串
strip() lstrip() rstrip() 去
strip()删除
字符串
前后(左右两侧)的
空格
或
特殊
字符
lstrip()删除
字符串
前面(左边)的
空格
或
特殊
字符
rstrip()删除
字符串
后面(右侧)的
空格
或
特殊
字符
注意:
python
中
的str是不可改变的(不可改变指的是:
字符串
一旦生成,其
字符
的序列就不能发生改变),因此这三种方法都是返回其改变后的副本,需要另一个量去接受
python
strip()方法
strip()方法用于删除
字符串
左右两边的
空格
、
特殊
windows系统
中
文件名不能包含 \ / : * ? " |想要创建必须过滤掉这些
字符
def setFileTitle(self,title):
fileName = re.sub('[\/:*?"<>|]','-',title)#去掉非法
字符
self.file = open(fileName + ".txt","w+")
python
去掉标点,
特殊
符号在网上找的正则表达式可以去掉左括号,没有去掉右括号,同时,不需要给问句进行编码工作,问号,
中
括号等标点有不同的输入法,其均不相同,需要都有
参考该连接http://blog.csdn.net/mach_learn/article/details/41744487
将其括号部分和一些标点和运算符号进行修改,更加完善,如下string = re.sub("[\s+\.