我在
UTF-16
中读取以下CSV数据时遇到了一些麻烦。
FullName, FullLabel, Type
TEST.slice, "Consideration":"Verde (Spar Verde, Fonte Verde)", Test,
据我所知,这对读者来说不应该是一个问题,因为有一个quote
的参数来处理这个问题。
df = spark.read.csv(file_path, header=True, encoding='UTF-16', quote = '"')
然而,这仍然会给我一个不正确的分割。
是否有一些方法来处理这些情况,或者我需要用RDD来解决这个问题?
预先感谢你。