熊猫-将列替换为单独列中的位置编号

AK91 发表于 Dev

25

AK91

数据集

df = pd.DataFrame({'a': [0,3,4], 'b': ['0101010', '0100010', '0111100']})

基本上尝试创建一个列，该列采用列的长度1的子字符串，该子串从列b中的位置编号开始a

尝试

position = df['a']
df['c'] = df['b'].str[position]

期望的输出

a    b        c
0    0101010  0
3    0100010  0
4    0111100  1

耶斯列尔

使用list comprehension有zip：

df['c'] = [b[a] for a, b in zip(df.a, df.b)]

df['c'] = df.apply(lambda x: x['b'][x['a']], axis=1)

print (df)
   a        b  c
0  0  0101010  0
1  3  0100010  0
2  4  0111100  1

性能有所不同：

#[3000 rows x 2 columns]
df = pd.concat([df] * 1000, ignore_index=True)

In [236]: %timeit df['c'] = [b[a] for a, b in zip(df.a, df.b)]
557 µs ± 25.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

In [237]: %timeit df['c'] = df.apply(lambda x: x['b'][x['a']], axis=1)
57.3 ms ± 358 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-16

我来说两句

0 条评论

登录后参与评论

上一篇：如何在Kotlin的forEach上引用外部

相关文章

将熊猫中的日期时间索引转换为单独的列

熊猫将列中的字符串替换为int

将现有列.csv熊猫中的日期“ /”替换为“-”

如何将字典中的一列转换为熊猫中的单独列？

如何将包含列表的列转换为熊猫数据框中的单独列？

将熊猫JSON行转换为单独的列

熊猫：将列中的所有值替换为列中的最大值

将列的值替换为在熊猫的其他列中具有特定值的均值

熊猫：将数据框中的一列替换为两列

熊猫选择单独的列

替换熊猫列中的图案

替换熊猫列中的值

替换熊猫中的列值

替换熊猫列中的字符

将熊猫列替换为已排序的索引

将大熊猫中的字典拆分为单独的列

将分组结果统计到熊猫的单独列中

将索引分为大熊猫中的单独列

将单独的熊猫数据框中的列相乘

将值映射到单独的列 - 熊猫

根据熊猫中的日期条件，将一列的值替换为NaN

熊猫：将列值替换为空（如果预定义列表中不存在）

熊猫：根据对应于该值的行数，将列中的值替换为“其他”

将匹配的记录替换为熊猫下一列中的记录

熊猫-替换列值

熊猫多列替换

熊猫列值替换

从输出分组到熊猫中的单独列

熊猫将两个单独的列转换为单个日期时间列？

TOP 榜单

文章

热门标签

归档