Pandas中isin函数 Dataframe提取（删除）指定行列_isin()函数

link之家
链接快照平台
输入网页链接，自动生成快照
标签化管理网页链接
isin函数（条件前加~表示isin函数的逆函数）

1. 返回含有具体条件的dataframe, 如返回 'A'列中含有 [4,8] 的dataframe( 用逆函数对筛选后的结果取余，起删除指定行作用 )
IN [1]: data
Out[1]: 
   A  B   C   D
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11
In [2]: data[data['A'].isin([4,8])] #返回值满足，{A列含有数值[4,8]}
Out[2]: 
   A  B   C   D
1  4  5   6   7
2  8  9  10  11
In [3]: data[~data['A'].isin([4,8])] #逆函数 剔除{A列含有数值[4,8]}的dataframe
Out[3]: 
   A  B  C  D
0  0  1  2  3
2. 返回含有多个条件的dataframe, 如返回 'A'列中含有 4,  'A'列中含有 5 的dataframe( 用逆函数对筛选后的结果取余，起删除指定行作用 ) 
In [4]: data[data['A'].isin([4]) & data['B'].isin([5])] #返回值满足，{A列含有4, B列含有5}
Out[4]: 
   A  B  C  D
1  4  5  6  7
#逆函数 剔除{A列含有4, B列含有5}的dataframe, 多个条件的逆函数，一定要记得用()将条件包含起来
In [5]: data[~(data['A'].isin([4]) & data['B'].isin([5]))] 
Out[5]: 
   A  B   C   D
0  0  1   2   3
2  8  9  10  11 
3. 返回含有条件所在行的行号（Index） 
In [6]: list(data[data['A'].isin([4,8])].index)
Out[6]: [1, 2] 
loc和iloc函数提取指定行列，请阅读下面博文：
 （超链接：Pandas中loc和iloc函数用法详解（源码+实例）） 
Drop函数删除指定行列，请阅读下列博文： 
（超链接：Drop函数与isin函数（DataFrame删除指定行列）） 
更多原创PYTHON数据分析博文，请关注博文专栏（超链接：PYTHON数据分析）
                    本文介绍主要结介绍用isin函数提取和删除Dataframe指定行列：isin函数（条件前加~表示isin函数的逆函数）1. 返回含有具体条件的dataframe, 如返回 'A'列中含有 [4,8] 的dataframe( 用逆函数对筛选后的结果取余，起删除指定行作用 )IN [1]: dataOut[1]:    A  B   C   D0  0  1   2   31 ...
				1. 背景概述
日常的数据分析中，经常遇到需要根据各种不同的条件从数据集中筛选相应的数据记录，再进行提取、分析、替换、修改等操作。因此，筛选是数据分析中使用频率很高的功能。一般而言，通常是使用for循环在数据中进行筛选，本文总结了在python中常用的并且使用效率比较高的几种数据筛选函数如：isin(), query(), contrains()，以及它们的实践示例。
2. 筛选方法和函数简介
简单的筛选方法：
单一的筛选条件或值
df.loc[df[“column_name”] == value]
				Pandas是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.isin方法的使用。
原文地址：Python pandas.DataFrame.isin函数方法的使用
				1.一列挑选重复的值。
2.这里isin（a_list），只要列的值都在a里面，都可以将数据筛选出来
df[df.user_id.isin(df[df.duplicated('user_id'
                                   )].user_id)].sort_values(by='user_id',
import pandas as pd
import numpy as npcontries = {
    '俄罗斯': {'2013': 10, '2014': 20, '2015': 30},
    '阿富汗': {'2013': 12, '2014': 25, '2015': 33},
    '新加坡': {'
				🚀【Python进阶】深入探索pandas之isin()方法🚀
📚一文带你精通pandas库中强大的isin()方法！从基础到高级技巧，结合示例让你轻松掌握筛选DataFrame中特定值的秘诀。🔍
📋快速筛选特定值、组合条件筛选，还能结合set数据结构提升效率！💡
🎉总结精要，让你快速回顾isin()方法的核心要点。📖
🤝期待与你共同进步，在数据处理的道路上越走越远！🌈
#pandas库 #isin方法 #数据筛选 #Python进阶 #数据处理
df = pd.read_excel('分类标准-新.xlsx')
#list0=[7662,7667,7672,7677,7682,7688,7693,7698,7704,7662,7709,7714,7719,7725,7730,7735,7741,7709,7746,7751,7756,7762,7767,7772,7778,7746,7783,7783]
list0=[7664,7669,7674,7679,7684,7690,7695,7700,770.
				pandas库中的isin函数用于判断一个序列中的值是否在另一个序列中出现，并返回一个布尔值序列。在使用时需要注意，被判断的序列和判断的序列数据类型要一致。isin函数还可以与布尔索引一起使用，实现对DataFrame的筛选。同时，isin函数还支持多个值同时匹配。
在使用isin函数的时候，可以向它传入一个包含待搜索元素的序列，或者一个元素形成的列表。如果需要同时匹配多个值，可以传入一个包含多个序列或一个元素列表的列表。在使用时也需要注意重复和缺失值的处理，可以使用unique()和dropna()方法对序列进行去重和处理缺失值。此外，在某些情况下，使用isin函数可能会引入一些性能问题，建议在使用过程中注意这一点。
总之，pandas中的isin函数是一个非常实用的数据查询函数，可以很好地实现数据的筛选和匹配。同时，在使用时需要注意一些细节，避免出现错误，提高代码的运行效率。