如何在pyspark数据框中将字符串类型的列转换为int形式？

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

道上混的野马 · “感悟经典”政协委员社会宣讲活动· 6 月前 ·

温文尔雅的鸵鸟 · i9-13900h和r7-7840hs哪个处 ...· 7 月前 ·

大鼻子的书包 · 年轻人的第一台越野车 ...· 1 年前 ·

憨厚的长颈鹿 · 请问有跟《快穿系统：男神，你过来》类似的文嘛 ...· 1 年前 ·

私奔的铅笔 · 三星堆六大祭祀坑：新出土黄金面具、百根象牙及 ...· 1 年前 ·

腾讯云

备案控制台

开发者社区

TVP

文章/答案/技术大牛

写文章

如何在pyspark数据框中将字符串类型的列转换为int形式？

data_df = sqlContext.read.format("csv").load('data.csv',header=True, inferSchema="true")
data_df.printSchema()
data_df = data_df.fillna(0)
data_df.printSchema()

from pyspark.sql.types import IntegerType
data_df = data_df.withColumn("Plays", data_df["Plays"].cast(IntegerType()))
data_df = data_df.withColumn("drafts", data_df["drafts"].cast(IntegerType()))

data_df = df.withColumn("Plays", df.call_time.cast('float'))

from pyspark.sql.types import StructField,IntegerType, StructType,StringType
newDF=[StructField('CLICK_FLG',IntegerType(),True),
       StructField('OPEN_FLG',IntegerType(),True),
       StructField('I1_GNDR_CODE',StringType(),True),
       StructField('TRW_INCOME_CD_V4',StringType(),True),
       StructField('ASIAN_CD',IntegerType(),True),
       StructField('I1_INDIV_HHLD_STATUS_CODE',IntegerType(),True)
finalStruct=StructType(fields=newDF)
df=spark.read.csv('ctor.csv',schema=finalStruct)

root
 |-- CLICK_FLG: string (nullable = true)
 |-- OPEN_FLG: string (nullable = true)
 |-- I1_GNDR_CODE: string (nullable = true)
 |-- TRW_INCOME_CD_V4: string (nullable = true)
 |-- ASIAN_CD: integer (nullable = true)
 |-- I1_INDIV_HHLD_STATUS_CODE: string (nullable = true)

root

推荐文章

道上混的野马 · “感悟经典”政协委员社会宣讲活动

6 月前

温文尔雅的鸵鸟 · i9-13900h和r7-7840hs哪个处理器好 - 抖音

7 月前

大鼻子的书包 · 年轻人的第一台越野车宝骏“悦也”最全解析_文章_新出行

1 年前

憨厚的长颈鹿 · 请问有跟《快穿系统：男神，你过来》类似的文嘛，要虐的那种。? - 知乎

1 年前

私奔的铅笔 · 三星堆六大祭祀坑：新出土黄金面具、百根象牙及丝绸_古代艺术_澎湃新闻-The Paper

1 年前

如何在pyspark数据框中将字符串类型的列转换为int形式？

3 个回答