我目前正在使用parquet文件,因为它的读入时间很短。但是现在我想稍微改变我的程序的功能。文件对内存来说会变得太大,而我希望只读入文件的特定行。
每个文件大约有15gb的数据(我将使用多个文件),有几百个列和几百万行。如果我想只读入例如第x行,对其进行操作,然后再读入新的行(重复数百万次),那么最有效的文件类型是什么?
我不太关心压缩问题,因为限制我的因素是内存,而不是存储。
谢谢你的专业知识。
![]() |
愉快的哑铃 · 博物学者段煦为你开启神秘南极之旅-中国科技网· 5 月前 · |
![]() |
不爱学习的高山 · 地铁建设整体降温:西安规划项目数减少,哈尔滨 ...· 9 月前 · |
![]() |
安静的人字拖 · 视频去哪了呢?_哔哩哔哩_bilibili· 1 年前 · |
![]() |
逆袭的豆腐 · 电池结构轻量化:铝托盘应用发展及设计关注点 ...· 1 年前 · |
![]() |
愉快的哑铃 · 博物学者段煦为你开启神秘南极之旅-中国科技网 5 月前 |
![]() |
安静的人字拖 · 视频去哪了呢?_哔哩哔哩_bilibili 1 年前 |
![]() |
逆袭的豆腐 · 电池结构轻量化:铝托盘应用发展及设计关注点 - 知乎 1 年前 |