本文介绍主要结介绍用isin函数提取和删除Dataframe指定行列:
isin函数(条件前加~表示isin函数的逆函数)
1. 返回含有具体条件的dataframe, 如返回 'A'列中含有 [4,8] 的dataframe(
用逆函数对筛选后的结果取余,起删除指定行作用
)
IN [1]: data
Out[1]:
A B C D
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
In [2]: data[data['A'].isin([4,8])] #返回值满足,{A列含有数值[4,8]}
Out[2]:
A B C D
1 4 5 6 7
2 8 9 10 11
In [3]: data[~data['A'].isin([4,8])] #逆函数 剔除{A列含有数值[4,8]}的dataframe
Out[3]:
A B C D
0 0 1 2 3
2. 返回含有多个条件的dataframe, 如返回 'A'列中含有 4, 'A'列中含有 5 的dataframe( 用逆函数对筛选后的结果取余,起删除指定行作用 )
In [4]: data[data['A'].isin([4]) & data['B'].isin([5])] #返回值满足,{A列含有4, B列含有5}
Out[4]:
A B C D
1 4 5 6 7
#逆函数 剔除{A列含有4, B列含有5}的dataframe, 多个条件的逆函数,一定要记得用()将条件包含起来
In [5]: data[~(data['A'].isin([4]) & data['B'].isin([5]))]
Out[5]:
A B C D
0 0 1 2 3
2 8 9 10 11
3. 返回含有条件所在行的行号(Index)
In [6]: list(data[data['A'].isin([4,8])].index)
Out[6]: [1, 2]
loc和iloc函数提取指定行列,请阅读下面博文:
(超链接:Pandas中loc和iloc函数用法详解(源码+实例))
Drop函数删除指定行列,请阅读下列博文:
(超链接:Drop函数与isin函数(DataFrame删除指定行列))
更多原创PYTHON数据分析博文,请关注博文专栏(超链接:PYTHON数据分析)
本文介绍主要结介绍用isin函数提取和删除Dataframe指定行列:isin函数(条件前加~表示isin函数的逆函数)1. 返回含有具体条件的dataframe, 如返回 'A'列中含有 [4,8] 的dataframe( 用逆函数对筛选后的结果取余,起删除指定行作用 )IN [1]: dataOut[1]: A B C D0 0 1 2 31 ...
1. 背景概述
日常的数据分析
中,经常遇到需要根据各种不同的条件从数据集
中筛选相应的数据记录,再进行
提取、分析、替换、修改等操作。因此,筛选是数据分析
中使用频率很高的功能。一般而言,通常是使用for循环在数据
中进行筛选,本文总结了在python
中常用的并且使用效率比较高的几种数据筛选
函数如:
isin(), query(), contrains(),以及它们的实践示例。
2. 筛选方法和
函数简介
简单的筛选方法:
单一的筛选条件或值
df.
loc[df[“column_name”] == value]
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
Pandas提供了大量能使我们快速便捷地处理数据的
函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下
Pandas中pandas.
DataFrame.
isin方法的使用。
原文地址:Python
pandas.
DataFrame.
isin函数方法的使用
1.一列挑选重复的值。
2.这里isin(a_list),只要列的值都在a里面,都可以将数据筛选出来
df[df.user_id.isin(df[df.duplicated('user_id'
)].user_id)].sort_values(by='user_id',
import pandas as pd
import numpy as npcontries = {
'俄罗斯': {'2013': 10, '2014': 20, '2015': 30},
'阿富汗': {'2013': 12, '2014': 25, '2015': 33},
'新加坡': {'
🚀【Python进阶】深入探索pandas之isin()方法🚀
📚一文带你精通pandas库中强大的isin()方法!从基础到高级技巧,结合示例让你轻松掌握筛选DataFrame中特定值的秘诀。🔍
📋快速筛选特定值、组合条件筛选,还能结合set数据结构提升效率!💡
🎉总结精要,让你快速回顾isin()方法的核心要点。📖
🤝期待与你共同进步,在数据处理的道路上越走越远!🌈
#pandas库 #isin方法 #数据筛选 #Python进阶 #数据处理
df = pd.read_excel('分类标准-新.xlsx')
#list0=[7662,7667,7672,7677,7682,7688,7693,7698,7704,7662,7709,7714,7719,7725,7730,7735,7741,7709,7746,7751,7756,7762,7767,7772,7778,7746,7783,7783]
list0=[7664,7669,7674,7679,7684,7690,7695,7700,770.
pandas库中的isin函数用于判断一个序列中的值是否在另一个序列中出现,并返回一个布尔值序列。在使用时需要注意,被判断的序列和判断的序列数据类型要一致。isin函数还可以与布尔索引一起使用,实现对DataFrame的筛选。同时,isin函数还支持多个值同时匹配。
在使用isin函数的时候,可以向它传入一个包含待搜索元素的序列,或者一个元素形成的列表。如果需要同时匹配多个值,可以传入一个包含多个序列或一个元素列表的列表。在使用时也需要注意重复和缺失值的处理,可以使用unique()和dropna()方法对序列进行去重和处理缺失值。此外,在某些情况下,使用isin函数可能会引入一些性能问题,建议在使用过程中注意这一点。
总之,pandas中的isin函数是一个非常实用的数据查询函数,可以很好地实现数据的筛选和匹配。同时,在使用时需要注意一些细节,避免出现错误,提高代码的运行效率。