提取新列并根据python中的分类值数据框填充值

萨尔曼

我有一个数据框,其中一列是分类字符串,下一列是与之对应的值:

df = pd.DataFrame(list((['a', 'b', 'c', 'buy', 5],
                      ['f', 'b', 'a', 'buy', 2],
                      ['a', 'b', 'c', 'sold', 6],
                      ['a', 'b', 'f', 'buy', 4],
                      ['a', 'b', 'c', 'returned', 'yes'])), columns = ['attr1', 'attr2','attr3','status','value'])

初始df有太多重复的行

我想基于df.status创建新列,并用填充空白列np.nan,需要在多个列上进行旋转:

在多个索引上旋转后的结果df

我正在寻找适用于大型数据帧的有效解决方案。

Mayank porwal

IIUC,您想要:

In [255]: df.pivot(index=['attr1', 'attr2', 'attr3'],columns='status', values='value').rename_axis(None, axis=1).reset_index()
Out[255]: 
  attr1 attr2 attr3 buy returned sold
0     a     b     c   5      yes    6
1     a     b     f   4      NaN  NaN
2     f     b     a   2      NaN  NaN

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

熊猫:将新列插入数据框,然后根据if逻辑在新列中填充值

Python pandas:如何在数据框列中的现有值之间填充值?

根据值在数据框的所有行中填充值

如何在多种情况下在数据框的新列中填充值

根据数据框中的条件填充新列

根据数据框中的2列提取信息并创建一个新列-Python

用分类列中的随机值填充缺失数据 - Python

R数据框中的条件填充值

数据框中的条件填充值

Python根据另一个数据框值中存在的列索引填充数据框值

如何根据 Pandas 数据框中另一列的条件将值填充到新列中?

Python 在数据框中填充日期并根据值

根据多个列中的值创建新的数据框列

根据其他列中的值在python 3(pandas)数据框中创建新列

根据python pandas数据框中其他列的值计算新列

Pandas - 根据新列中的值复制数据框

根据其他列的行值填充新的pandas数据框列

如何根据 Python 数据框中现有的值向新列添加值?

使用熊猫操作数据框,创建新列,并根据在数据框中查找现有数据的值填充它们

根据其他两列中的值,用另一个数据中的值填充一个数据框中的新列?(Python /熊猫)

根据分类列中dinstict值的计数从pandas数据框中删除所有行

为数据框中的所有分类列提取不同的值

根据使用另一列的正则表达式提取的内容,有条件地在spark数据框中填充新列

使用 NA 的条件语句从数据框中的列中填充值 - R

如何根据值对熊猫数据框的列进行分类?

根据列值为数据框创建分类变量

根据分类列的值对熊猫数据框进行排序

如何根据数据框的列中的数字分配分类值?

填充数据框列Python中的缺失值