我有一个出现鱼的csv文件,需要修剪掉只出现一次的鱼,然后将其输出为“修剪过的” csv。但是,我正在使用的函数在修剪过的csv中添加了无标题列,这弄乱了我需要对修剪过的文件进行的进一步计算。
该列包含来自的行号to_keep
,我相信是由于以下行而创建的:return df[df[colname].isin(to_keep)]
。我希望该脚本根本不创建此列;否则,我没有从修剪过的每个单个csv文件中手动删除它!
import pandas as pd
def trim_single_entries(fn, colname):
# remove all entries where colname's entry is unique to one row across the whole file
df = pd.read_csv(fn)
if colname in df.columns:
counts = df[colname].value_counts()
to_keep = [counts.index[i] for i in range(0,len(counts)) if counts.values[i] > 1]
return df[df[colname].isin(to_keep)]
else:
return False
x = trim_single_entries('fish_data.csv', 'catalognumber')
x.to_csv('trimmed_fish_data.csv')
添加index=False
到to_csv
方法
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句