我正在处理一个很大的(3.5GB).csv文件,我无法完全在内存中对其进行处理,并且希望:
最终结果将是一个单独的.csv,其中包含与条件匹配的所有行。
我发现以下对我有用。请注意,这还会为列表中的每个标准值生成一个单独的输出文件。
import csv
# criteria is the column number from the source data to check against the values list
criteria = 4
valueslist= ['criteria1','criteria2','criteria3']
for item in valueslist:
with open('sourcedata.csv', 'rb') as inf, open(item + '.csv','wb') as outf:
reader = csv.reader(inf)
writer = csv.writer(outf)
# -- Write Headers as first row
writer.writerow(["column1", "column2", "column3"])
for row in reader:
if row[criteria] == item:
writer.writerow(row)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句