添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
相关文章推荐
打酱油的小刀  ·  c# monthCalendar ...·  1 年前    · 
风度翩翩的伤疤  ·  c# - How do I change ...·  1 年前    · 
精彩文章免费看

groupby取最大值对应的行

问题描述:

对带有时间戳的数据做分组( groupby) 后向想取到每组时间 (或id) 最大的一条

解决:

1. 其中一种方法是:先groupby 取到最大时间(或id),然后再做left join 此法适用于sql

2. 首先对数据做排序,然后groupby 取到的就是时间(或id) 最大(小) 的一条

3. pandas的做法 原理同2

df.sort_values('时间', ascending=False).groupby('聚合字段', as_index=False).first()

4. 同理 需要取top N 数据

df.sort_values('时间', ascending=False).groupby('聚合字段', as_index=False).head(N)

最后编辑于:2019-07-25 18:37