在 Pandas 中,可以使用
value_counts()
方法来统计某一列中各个值的出现次数。例如,假设你有一个 Pandas 的数据框
df
,并且想要统计其中名为 "Item" 的列中各个值的出现次数,你可以这样做:
counts = df['Item'].value_counts()
这样,变量 counts
就是一个 Pandas 的序列,它的索引是 "Item" 列中的所有值,对应的值就是这些值在 "Item" 列中出现的次数。你也可以使用 sort_index()
方法对索引进行排序,或者使用 sort_values()
方法对值进行排序。
例如,假设你想要按照值的大小对 "Item" 列中的值进行排序,并且只保留前 10 个值,你可以这样做:
top10 = df['Item'].value_counts().sort_values(ascending=False).head(10)
这样,变量 top10
就是一个 Pandas 的序列,它的索引是 "Item" 列中出现次数最多的前 10 个值,对应的值就是这些值在 "Item" 列中出现的次数。