python怎么按条件把一组数据转化为两组数据 python按条件拆分csv_mob6454cc745a10的技术博客_

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

拉风的闹钟 · Android12 修改跳过开机向导 - ...· 8 月前 ·

小猫猫 · 小米澎湃OS架构图公布：就是自研系统，跟鸿蒙 ...· 8 月前 ·

有爱心的消防车 · 孕妇坠崖丈夫被判终身监禁妻子:恨透他 ...· 1 年前 ·

老实的回锅肉 · 重生只为追影帝(一色哈尼、星空社创作的原著漫 ...· 1 年前 ·

力能扛鼎的苦瓜 · 驻印尼大使章启月会见中爪哇省长等官员_中华人 ...· 1 年前 ·

10 # filename为文件路径，file_num为拆分后的文件行数 11 # 根据是否有表头执行不同程序，默认有表头的 12 def Data_split(filename,file_num,header=True): 13 if header: 14 # 设置每个文件需要有的行数,初始化为1000W 15 chunksize=10000 16 data1=pd.read_table(filename,chunksize=chunksize,sep=',',encoding='gbk') 17 # print(data1) 18 # num表示总行数 19 num=0 20 for chunk in data1: 21 num+=len(chunk) 22 # print(num) 23 # chunksize表示每个文件需要分配到的行数 24 chunksize=round(num/file_num+1) 25 # print(chunksize) 26 # 分离文件名与扩展名os.path.split(filename) 27 head,tail=os.path.split(filename) 28 data2=pd.read_table(filename,chunksize=chunksize,sep=',',encoding='gbk') 29 i=0 30 for chunk in data2: 31 chunk.to_csv('{0}_{1}{2}'.format(head,i,tail),header=None,index=False) 32 print('保存第{0}个数据'.format(i)) 33 i+=1 34 else: 35 # 获得每个文件需要的行数 36 chunksize=10000 37 data1=pd.read_table(filename,chunksize=chunksize,header=None,sep=',') 38 num=0 39 for chunk in data1: 40 num+=len(chunk) 41 chunksize=round(num/file_num+1) 43 head,tail=os.path.split(filename) 44 data2=pd.read_table(filename,chunksize=chunksize,header=None,sep=',') 45 i=0 46 for chunk in data2: 47 chunk.to_csv('{0}_{1}{2}'.foemat(head,i,tail),header=None,index=False) 48 print('保存第{0}个数据'.format(i)) 49 i+=1 51 filename='文件路径' 52 #num为拆分为的文件个数 53 Data_split(filename,num,header=True)

推荐文章

拉风的闹钟 · Android12 修改跳过开机向导 - CSDN文库

8 月前

小猫猫 · 小米澎湃OS架构图公布：就是自研系统，跟鸿蒙的技术路径类似

8 月前

有爱心的消防车 · 孕妇坠崖丈夫被判终身监禁妻子:恨透他胎儿已引产|上诉|死刑|法院_网易新闻

1 年前

老实的回锅肉 · 重生只为追影帝(一色哈尼、星空社创作的原著漫画)_搜狗百科

1 年前

力能扛鼎的苦瓜 · 驻印尼大使章启月会见中爪哇省长等官员_中华人民共和国驻印度尼西亚共和国大使馆

1 年前