在输出一些编号类型的数字时,往往需要前面补0,比如这样的数字:
python中这样处理:
serial_num = 15
serial_num = str(serial_num).zfill(6)
print(serial_num )
输出结果:000015
pandas 中可以这样处理
要给这些流水号补齐0,可以直接用apply,里面用format就好
df['流水号'].apply(lambda x : '{:0>6d}'.format(x))
0 000001
1 000002
... ...
Name: 流水号, Length: 13248, dtype: object
:0>6d的意思是补成六位,用0补,>是向左补,
d是类型(注意和df列的类型保持一致)
附:Python format 格式化函数
在输出一些编号类型的数字时,往往需要前面补0,比如这样的数字:python中这样处理:# zfill() 方法返回指定长度的字符串,原字符串右对齐,前面填充0。serial_num = 15 serial_num = str(serial_num).zfill(6) print(serial_num ) 输出结果:000015pandas 中可以这样处理要给这些流水号补齐0,可以直接用apply,里面用format就好# pandas 的 apply() 函数可以作用于 Se
python中有一个zfill方法用来给字符串前面补0,非常有用n = "123"
s = n.zfill(5)
assert s == "00123"zfill()也可以给负数补0n = "-123"
s = n.zfill(5)
assert s == "-0123"对于纯数字,我们也可以通过格式化的方式来补0n = 123
s = "%05d" % n
assert s == "00123"
由于数据库存储日期数据时,年份,月份,日份这三个字段均保存成了整形(int),直接做拼接的话会导致结果出现诡异的情况。。
首先,不做转换的话,会直接变成数字相加:
year|month|day
2021|4|6
table[‘year’]+table[‘month’]+table[‘day’]出来的结果是2031。。
然后,做了强制转化:
year|month|day
2021|3|10
2021|4|6
table['date']=table['year'].astype('str')+table['mo
但是发现,这个填充方法并不全如我意.
仔细实验后发现,这其中有些需要注意的点.
fill_test = Series([111, 222, 533, 644, 299], index=[1, 2, 3, 7, 11])
print(fill_test)
fill_test_1 = fill_test.r...
insert into 表名 (字段名1,字段名2,字段名3.......) values(数据1,数据2,数据3........)
insert into `grade` (`gradename`) VALUES('一年级');
批量插入数据
insert into 表名 (字段1,字段2) values(数据1,数据2),(第二条数据1,数据2)
插入数据语句可以省略字段,但是值必须一一对应(主键可以省略)
insert into `student` values('.
pandas-profiling是一个基于Python Pandas库的数据探索性分析工具,可以自动生成数据报告和可视化分析结果。pandas-profiling可以自动生成数据集的统计信息、数据类型、缺失值、唯一值、相关性以及各种分布图表。使用pandas-profiling可以快速地了解数据集的特征和问题。
pandas-profiling的安装方法如下:
pip install pandas-profiling
使用pandas-profiling可以通过以下方式:
import pandas as pd
from pandas_profiling import ProfileReport
# 读取数据集
df = pd.read_csv('data.csv')
# 生成数据报告
profile = ProfileReport(df, title='Pandas Profiling Report')
# 输出数据报告为html格式
profile.to_file(output_file='report.html')
在Pandas Profiling Report中,我们可以看到数据集基本信息、数据摘要、变量分布、相关性、缺失值、唯一值、变量间关系、交互式的散点图和热力图等。pandas-profiling还提供了导出Excel、HTML、JSON和Markdown等格式的功能,方便我们将分析结果分享给其他人。
总之,pandas-profiling是一个非常方便和实用的数据分析工具,可以帮助我们快速地了解数据集的特征和问题,为后续分析和建模提供依据。