添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
首页 > 脚本专栏 > python > Python pandas之多级索引取值

Python pandas之多级索引取值详解

作者:宿者朽命

这篇文章主要为大家介绍了Python pandas之多级索引取值,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助

最近发现周围的很多小伙伴们都不太乐意使用pandas,转而投向其他的数据操作库,身为一个数据工作者,基本上是张口pandas,闭口pandas了,故而写下此系列以让更多的小伙伴们爱上pandas。

windows 10

python 3.8

pandas 1.2.4

给定一份多级索引数据,查找指定值。

数据提取在pandas中,或者说在python中就是索引式提取,在单层索引中采用 .loc .iloc 方法已经非常常见了,然而在索引层次多了之后却有点不知所措,也只需要将各个索引看成整体进行提取就行。

这里先给出一个比较笨拙的方法,先将索引进行重置为列数据,通过列取得bool条件再进行提取

datac.reset_index(inplace=True)
datac[(datac['School'] == 'S_2') & (datac['Class'] == 'C_3')]

可以看到通过该类方法可以成功取到对应值

当然也可以采用.query方法进行条件筛选

datac.reset_index(inplace=True)
datac.query("School == 'S_1' and Class == 'C_3'")

既然为多级索引,pandas也会有对应的取值方式,既可以用链式调用的方式,也可以通过元组进行提取,首先看看多级索引的输出值:

是一个MultiIndex类型数据,其元素都是元组,即也能通过元组的方式进行索引调取

这两种都一个共同的特点,从左到右,要先外层再内层,否则会报KeyError错误

# 链式调用
datac.loc['S_1'].loc['C_1']
# 元组作为索引调用
datac.loc[('S_3', 'C_1'), :]

tips:

1.多层索引,即列名上方有层次结构也可以按这种方式进行提取。

2.想越过外层索引提取内层索引需要交换索引顺序才能顺利提取。