如何将Python数据框的信息输出与唯一计数列表结合在一起

opt135

我像这样将CSV读入数据框并运行info()

dlqcsv = pd.read_csv(a1, sep=',', encoding ="ISO-8859-1", low_memory=False, index_col=False)
dd = dlqcsv.info(verbose=True)
dd.describe()

它产生:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 504334 entries, 0 to 504333
Data columns (total 288 columns):
Unnamed: 0                 int64
rowno__loan               float64
..... the rest of the 288 features

然后,我运行以下命令以计算唯一性(从该网站窃取他人的代码)

col_uni_val={}
for i in dlqcsv.columns:
    col_uni_val[i] = len(dlqcsv[i].unique())
import pprint
col_uni_val

得到了,这很棒

{'Unnamed: 0': 504334,
 'rowno_loan': 55851,
.. the rest of the 288 pairs..

我想将详细info输出与unique count输出结合起来显然,这是一个简单的一对一唯一内部​​联接,匹配键中没有重复项。

如何在两个表中调用功能名称的列?似乎都没有列名?

另外,可以将计数直接写到数据框而不是字典中吗?谢谢。

Roshan Santhosh

熊猫有一个内置的方法来计算唯一值。您可以使用以下命令获取输出dlqcsv.nunique()

对于您所要求的整体任务,操纵df.info是一项艰巨的任务。一个更简单的选择是使用类似于以下代码的内容来计算您的列的所有必需值。


output = []

for col in df.columns:

    nonNull  = len(df) - np.sum(pd.isna(df[col]))
    unique = df[col].nunique()
    colType = str(df[col].dtype)

    output.append([col, nonNull, unique, colType])

output = pd.DataFrame(output)   
output.columns = ['colName','non-null values', 'unique', 'dtype']


输出如下:

     colName  non-null values  unique    dtype
0      le_id               20       5    int64
1    run_seq               20       5    int64
2      cp_id               20       8    int64
3    cp_name               20       8   object
4   products               20       7   object
5  tran_amnt               20      17    int64
6   currency               20       6   object
7    current                1       1  float6

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何将数据框总结为与ID结合在一起的列表?

如何将文字信息与系统信息结合在一起?

如何将两个数据框与R中的项目数量结合在一起?

R:如何将几个数据集结合在一起

如何将python asyncio与线程结合在一起?

Python:如何将for循环和while循环结合在一起?

如何使用python将头文件与数据文件结合在一起?

如何将2张纸与基于单个值的列表结合在一起?

如何将typedef的结构与实例创建结合在一起?

如何将“最终形式计算”与“最终形式数组”结合在一起

如何将原位转换和复制转换结合在一起?

如何将5个以上的PDF与imagemagick转换结合在一起?

如何将聚合查询与不同联接结合在一起?

如何将Bash的流程替换与HERE文档结合在一起?

如何将PrettyPrintingJsonGeneratorDecorator和MaskingJsonGeneratorDecorator结合在一起?

如何将EventEmitter与动态组件结合在一起?

如何将back_inserter与转换结合在一起,C ++

如何将Axios调用循环与等待功能结合在一起?

如何将时基轮询与等待的任务结合在一起

如何将分组的输入与对齐的表单结合在一起?

如何将RequireJS路径和require-css结合在一起?

如何将输入与字符串结合在一起?

如何将.toggleClass()与.appendTo()结合在一起?

如何将这两个查询结合在一起?(MySQL)

如何将列与R中的条件结合在一起?

如何将DataTables与其他匹配器结合在一起?

如何将NavigationDrawerPageSlidingTabStrip与StickyListHeaders库结合在一起?

如何将“ IF FOR批处理”与“ FOR DELIMS批处理”结合在一起?

如何将JavaScript代码和html代码结合在一起?