我有一个问题,与python(IPython笔记本)中的编码问题有关。这类问题很常见,也很简单,但我还是不能真正解决它。
我有一个 CSV 文件,你可以看到我们在这个文件里有许多'\xa0'和其他'\n'字符。
I used
with io.open(train_fname) as f:
for line in f:
line = line.encode("ascii", "replace")
但它没有工作,我总是得到以下输出。
想象一下,你可以说,你知道吗,没有制裁,没有永远的IEAA条例听证会,没有更多的隐藏,没有友好核能的幌子。\你有2天的时间;也就是说,让检查员进来,停止杀害平民。
I tried other methods like
【替换代码1
这也不行,我也试过各种编码,在我的文本编辑器中打开这个CSV文件,sublime text。
我试过windows-1252、utf-8和其他所有的编码,但当我查看这个CSV文件时,我的文本编辑器总是显示为xa0。
这是否意味着
已经作为输入文本写在这个CSV文件中了?这不是python编码的问题吗?如果是这种情况,为什么我不能用替换方法来简单地替换这个字符串?The \xa0 表示该文件是以哪种编码方式编码的?这意味着这个文件是用utf-8写的,但我试图用ascii或其他情况打开它?
我搜索了许多问题,但它们似乎没有提供什么帮助。如果我的问题不是很清楚,请问我。
非常感谢您!