columns
=
[
'a1'
,
'a2'
,
'a3'
,
'a4'
]
index
=
[
'b1'
,
'b2'
,
'b3'
]
data
=
np
.
random
.
randint
(
0
,
100
,
size
=
(
3
,
4
)
)
df
=
DataFrame
(
columns
=
columns
,
index
=
index
,
data
=
data
)
添加index索引标签名
一共有三种方法,name,names,set_name
df.index.name='y'
df.index.names=['y']
df.index.set_names='y'
df.index.set_names=['y']
import numpy as npimport pandas as pdfrom pandas import DataFramecolumns = ['a1','a2','a3','a4']index = ['b1','b2','b3']data = np.random.randint(0,100,size=(3,4))df = DataFrame(columns=columns, index=index, data=data)df添加index索引标签名一共有三种方法,nam
将数据某一列设为索引
将userid列设为索引列,inplace=True表示在原df上修改,drop=False表示保留userid列,默认删除userid列。
# 将userid列设为索引列
df.set_index('userid', inplace=True, drop=False)
# 若修改后可以这么查询u
目录1.重命名列名称2.重命名索引3.重置索引
df=pd.DataFrame(np.arange(16).reshape(4,4),columns=["one","two","three","four"],index=['a','b','c','d'])
1.重命名列名称
df.rename(columns={"one":"nj","two":"bj"},inplace=True)
2.重命名索引
df.rename(index={"a":"aaa","d":"ddd"},inplace=True
s = pandas.Series(numpy.random.rand(3),index = ['a','b','c'])
print(s)
# 方法类似下标索引,用[]表示,内写上index,注意index是字符串
print(s["b"])
# 如果需要选择多个标签的值,用[[]]来表示(相当于
作者 |东哥起飞来源 |Python数据科学在数据处理时,经常会因为index报错而发愁。不要紧,本次来和大家聊聊pandas中处理索引的几种常用方法。1.读取时指定索引列很多情况下,我们的数据源是 CSV 文件。假设有一个名为的文件data.csv,包含以下数据。date,temperature,humidity
07/01/21,95,50
07/02/21,94...
pandas.DataFrame 索引df.loc / df:选择行与列df:选择列df.loc:选择行df.iloc:按整数位置选择行布尔型索引多重索引
df.loc / df:选择行与列
df:选择列
默认一般用于选择列,但也可以选择行
import numpy
import pandas
df = pandas.DataFrame(numpy.random.rand(12).reshape(3,4),
index = ["one","two","three"],columns = list("abcd"))
print(df)
# 按照列名选择列,只选择一列则输出Series,选择多列
一、series对象
1.1定义
它是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。
1.2 生成series对象
pd.Series(data=None,index=None,dtype=None,name=None,copy=False,fastpath=False)
参数描述:index默认从0开始也可以自定义,可以为非整型。
name为表的