添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
相关文章推荐
帅呆的苦咖啡  ·  对象存储 COSCMD ...·  2 年前    · 
月球上的匕首  ·  php - linux ...·  2 年前    · 
旅途中的羊肉串  ·  Leyi Wei ...·  2 年前    · 
寂寞的牛肉面  ·  X-Forwarded-Host ...·  2 年前    · 
笑点低的肉夹馍  ·  unity3d - Memory ...·  2 年前    · 
精彩文章免费看

groupby取最大值对应的行

问题描述:

对带有时间戳的数据做分组( groupby) 后向想取到每组时间 (或id) 最大的一条

解决:

1. 其中一种方法是:先groupby 取到最大时间(或id),然后再做left join 此法适用于sql

2. 首先对数据做排序,然后groupby 取到的就是时间(或id) 最大(小) 的一条

3. pandas的做法 原理同2

df.sort_values('时间', ascending=False).groupby('聚合字段', as_index=False).first()

4. 同理 需要取top N 数据

df.sort_values('时间', ascending=False).groupby('聚合字段', as_index=False).head(N)

最后编辑于:2019-07-25 18:37