web信息中常会遇到“\u4f60\u597d”类型的字符。首先’\u‘开头就基本表明是跟unicode编码相关的,“\u”后的16进制字符串是相应汉字的utf-16编码。python里decode()和encode()为我们提供了解码和编码的方法。其中decode('unicode_escape')能将此种字符串解码为unicode字符串。
str1 = '\u4f60\u597d'
print str1.decode('unicode_escape')
有篇讲python编码的文章比较好,http://blog.csdn.net/liuxincumt/article/details/8183391
另附两个在线工具
1、汉字转换unicode编码
http://www.bangnishouji.com/tools/chtounicode.html
2、汉字编码查询
http://xn--p8s370b.xn--fiqs8s/
在Python中,\u002 是 Unicode 转义序列的一部分,用于表示 Unicode 字符。如果你在解码 Base64 字符串时遇到类似的情况,需要先将 Unicode 转义序列转换为相应的字符,然后再进行解码。来源于chatgpt。
4.python基础 Python对大小写敏感,缩进的好处就是强迫你写出缩进较少的代码 缺点就是复制代码功能失效了。 1)数据类型和变量 Python可以处理的数据类型:整数;浮点数;字符串; 布尔值(ture or fasle)布尔值可以用and、or、not运算;空值(none,不等于零) 变量:变量名必须是大小写英文、数字和_的组合,且不能用数字开头 常量:就是不能变的量 2)字符串和编码 字符编码: 捋一捋ASCII编码和Unicode编码的区别:ASCII编码是1个字节,而Unicode编码通常 是2个字节 UTF-8编码把一个Unicode字符根据不同的数字大小编码成1- 6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才 会被编码成4-6个字节。 "字符"ASCII "Unicode "UTF-8 " "A "01000001 "00000000 01000001 "01000001 " "中 "x "01001110 00101101 "11100100 10111000 10101101 " " " " " " Python的字符串 对于
GBK编码专门用来解决中文编码的,是双字节的。不论中英文都是双字节的。
由于ASCII编码不支持中文,因此,当中国人用到计算机时,就需要寻求一种编码方式来支持中文。于是,国人就定义了一套编码规则:当字符小于127位时,与ASCII的字符相同,但当两个大于127的字符连接在一起时,就代表一个汉字,第一个字节称为高字节(从0xA1-0xF7),第二个字节为低...
\u5927\u5bb6\u597d\uff0c\u6211\u662f\u0040\u65e0\u6240\u4e0d\u80fd\u7684\u9b42\u5927\u4eba\uff01\u8bdd\u8bf4\u5fae\u535a\u7c89\u4e1d\u8fc7\u767e\
这篇文章主要介绍了简单了解python字符串前面加r,u的含义,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
u/U:表示unicode字符串
不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码。
一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u;但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。
建议所有编码方式采用utf-8,即在py文件开头添加: # coding: utf-8
r/R:非转义的原始字符串
与普通字符相比,其他相对特殊的字符,其中可能包含转义字符
昨天在微信聊天时,被朋友的微信聊天代码给套路了!觉得这个特别有趣,简单好玩,用来花样表白女朋友也很不错!另外,这种隐藏的聊天语言简直就是表白神器,喜欢一个人又不好意思开口,说了又觉得尴尬,怎么办?表白代码用起来,被拒绝了也可以当做开开玩笑,下面我整理了一些。微信表白代码在微信聊天中,发送表白代码,对方点击翻译就可以看到目标文字啦!注意,翻译过程中有的代码需要二次翻译才能出现最终文字。操作...