熊猫:如何在数据框架中创建新列并考虑其他现有列在其中添加值

林恩

我有一个表示一些餐馆及其名称的数据框。

  • 我想做的是在is_chain我的初始Dataframedf添加一列,表示餐厅是否是食物链。这个新列取0或1。值1表示该餐厅是一条链的一部分(例如,麦当劳)。如果数据库中还有另一家同名餐厅,则该餐厅被视为一条链的一部分。
data = {
        'restaurant_id':  ['1', '2','3','4','5','6','7','8','9','10','11','12'],
        'restaurant_name':  ['Dennys', 'Dennys','Pho U','Pho U','Dennys','Japanese Cafe','Japanese Cafe','Midori','Midori','xxx','yyy','zzz'],
        }

df = pd.DataFrame (data, columns = ['restaurant_id','restaurant_name'])

df.head(15)

因此,例如xxxyyyzzz都不是链的一部分。

我不确定使用pandas实现类似这样的正确语法。如果需要任何澄清,请询问。

谢谢。

广晃

这听起来像duplicated

 df['is_chain'] = df['restaurant_name'].duplicated(keep=False).astype(int)

输出:

   restaurant_id restaurant_name  is_chain
0              1          Dennys         1
1              2          Dennys         1
2              3           Pho U         1
3              4           Pho U         1
4              5          Dennys         1
5              6   Japanese Cafe         1
6              7   Japanese Cafe         1
7              8          Midori         1
8              9          Midori         1
9             10             xxx         0
10            11             yyy         0
11            12             zzz         0

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何在 Pandas 中创建逻辑以根据其他列中的现有值创建新列?

在数据框中的不同日期之间添加日期点,并在其他列中创建空白 (NA) 是在 r 中创建的那些新行

如何根据 Python 数据框中现有的值向新列添加值?

如何根据 julia 中的其他列值有条件地在数据框中创建新列

如何根据 Jupyter 中的现有列在数据框中创建新列?

根据现有数据框中的其他列创建一个新列

如何基于其他列的排列在数据框中创建新列?

如何根据其他列的条件在数据框中创建新列?

如何根据熊猫中的其他列添加新列?

如何使用条件从现有列在数据框中创建新列?

如何在Pandas数据框的新列中添加值?

如何在其他列的所有组合中变异新列?

如何根据其他两列中的值在熊猫数据框中添加新列

如何基于在熊猫数据框中具有NaN的现有列创建新列?

如何通过使用python中的现有列创建以其他列为条件的新列

熊猫:在数据框中创建两个新列,并使用从现有列中计算出的值

熊猫:在数据框中创建两个新列,并使用从现有列中计算出的值

向熊猫中的现有列添加值

向熊猫中的现有行/列添加值

如何在其他数据框上添加带有条件的列?

如何在具有分层索引的熊猫数据框中添加和计算(基于其他列)子列?

熊猫:从旧创建新列,添加值

如何根据 Pandas 中其他列的增加值添加新列排名

如何基于MySQL中的条件创建新列并向其中添加值?

在其他所有列的Pandas数据框中创建新的字典列,并结合其标题

根据其他列中的值,在数据框中创建具有递增值的新列

如何在数据框中创建新列,其中新列的每一行都是所有先前行的乘法

如何在不列出其他现有列的情况下将新列添加到MySQL表

如何在 R 的数据框中添加新列并使用现有列?