添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

本文介绍主要结介绍用isin函数提取和删除Dataframe指定行列:

isin函数(条件前加~表示isin函数的逆函数)

1. 返回含有具体条件的dataframe, 如返回 'A'列中含有 [4,8] 的dataframe( 用逆函数对筛选后的结果取余,起删除指定行作用 )

IN [1]: data
Out[1]: 
   A  B   C   D
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11
In [2]: data[data['A'].isin([4,8])] #返回值满足,{A列含有数值[4,8]}
Out[2]: 
   A  B   C   D
1  4  5   6   7
2  8  9  10  11
In [3]: data[~data['A'].isin([4,8])] #逆函数 剔除{A列含有数值[4,8]}的dataframe
Out[3]: 
   A  B  C  D
0  0  1  2  3

2. 返回含有多个条件的dataframe, 如返回 'A'列中含有 4,  'A'列中含有 5 的dataframe( 用逆函数对筛选后的结果取余,起删除指定行作用 )

In [4]: data[data['A'].isin([4]) & data['B'].isin([5])] #返回值满足,{A列含有4, B列含有5}
Out[4]: 
   A  B  C  D
1  4  5  6  7
#逆函数 剔除{A列含有4, B列含有5}的dataframe, 多个条件的逆函数,一定要记得用()将条件包含起来
In [5]: data[~(data['A'].isin([4]) & data['B'].isin([5]))] 
Out[5]: 
   A  B   C   D
0  0  1   2   3
2  8  9  10  11

3. 返回含有条件所在行的行号(Index)

In [6]: list(data[data['A'].isin([4,8])].index)
Out[6]: [1, 2]

loc和iloc函数提取指定行列,请阅读下面博文:
超链接:Pandas中loc和iloc函数用法详解(源码+实例)

Drop函数删除指定行列,请阅读下列博文:

超链接:Drop函数与isin函数(DataFrame删除指定行列)

更多原创PYTHON数据分析博文,请关注博文专栏超链接:PYTHON数据分析

本文介绍主要结介绍用isin函数提取和删除Dataframe指定行列:isin函数(条件前加~表示isin函数的逆函数)1. 返回含有具体条件的dataframe, 如返回 'A'列中含有 [4,8] 的dataframe( 用逆函数对筛选后的结果取余,起删除指定行作用 )IN [1]: dataOut[1]: A B C D0 0 1 2 31 ...
1. 背景概述 日常的数据分析,经常遇到需要根据各种不同的条件从数据集筛选相应的数据记录,再进行提取、分析、替换、修改等操作。因此,筛选是数据分析使用频率很高的功能。一般而言,通常是使用for循环在数据进行筛选,本文总结了在python常用的并且使用效率比较高的几种数据筛选函数如:isin(), query(), contrains(),以及它们的实践示例。 2. 筛选方法和函数简介 简单的筛选方法: 单一的筛选条件或值 df.loc[df[“column_name”] == value]
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandaspandas.DataFrame.isin方法的使用。 原文地址:Python pandas.DataFrame.isin函数方法的使用
1.一列挑选重复的值。 2.这里isin(a_list),只要列的值都在a里面,都可以将数据筛选出来 df[df.user_id.isin(df[df.duplicated('user_id' )].user_id)].sort_values(by='user_id', import pandas as pd import numpy as npcontries = { '俄罗斯': {'2013': 10, '2014': 20, '2015': 30}, '阿富汗': {'2013': 12, '2014': 25, '2015': 33}, '新加坡': {'
🚀【Python进阶】深入探索pandasisin()方法🚀 📚一文带你精通pandas强大的isin()方法!从基础到高级技巧,结合示例让你轻松掌握筛选DataFrame特定值的秘诀。🔍 📋快速筛选特定值、组合条件筛选,还能结合set数据结构提升效率!💡 🎉总结精要,让你快速回顾isin()方法的核心要点。📖 🤝期待与你共同进步,在数据处理的道路上越走越远!🌈 #pandas库 #isin方法 #数据筛选 #Python进阶 #数据处理
df = pd.read_excel('分类标准-新.xlsx') #list0=[7662,7667,7672,7677,7682,7688,7693,7698,7704,7662,7709,7714,7719,7725,7730,7735,7741,7709,7746,7751,7756,7762,7767,7772,7778,7746,7783,7783] list0=[7664,7669,7674,7679,7684,7690,7695,7700,770.
pandasisin函数用于判断一个序列的值是否在另一个序列出现,并返回一个布尔值序列。在使用时需要注意,被判断的序列和判断的序列数据类型要一致。isin函数还可以与布尔索引一起使用,实现对DataFrame的筛选。同时,isin函数还支持多个值同时匹配。 在使用isin函数的时候,可以向它传入一个包含待搜索元素的序列,或者一个元素形成的列表。如果需要同时匹配多个值,可以传入一个包含多个序列或一个元素列表的列表。在使用时也需要注意重复和缺失值的处理,可以使用unique()和dropna()方法对序列进行去重和处理缺失值。此外,在某些情况下,使用isin函数可能会引入一些性能问题,建议在使用过程注意这一点。 总之,pandasisin函数是一个非常实用的数据查询函数,可以很好地实现数据的筛选和匹配。同时,在使用时需要注意一些细节,避免出现错误,提高代码的运行效率。