如何阻止熊猫创建新列?

pop声

我有一个出现鱼的csv文件,需要修剪掉只出现一次的鱼,然后将其输出为“修剪过的” csv。但是,我正在使用的函数在修剪过的csv中添加了无标题列,这弄乱了我需要对修剪过的文件进行的进一步计算。

该列包含来自的行号to_keep,我相信是由于以下行而创建的:return df[df[colname].isin(to_keep)]我希望该脚本根本不创建此列;否则,我没有从修剪过的每个单个csv文件中手动删除它!

import pandas as pd

def trim_single_entries(fn, colname):
# remove all entries where colname's entry is unique to one row across the whole file
df = pd.read_csv(fn)
if colname in df.columns:
    counts = df[colname].value_counts()
    to_keep = [counts.index[i] for i in range(0,len(counts)) if counts.values[i] > 1]  
    return df[df[colname].isin(to_keep)]
else:
    return False

x = trim_single_entries('fish_data.csv', 'catalognumber')

x.to_csv('trimmed_fish_data.csv')
布莱恩·彭德尔顿

添加index=Falseto_csv方法

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章