熊猫:将一列中的单词数按另一列的值排序

马特·霍夫

我有两列:df[upvotes]df[headline]标题列包含带有标题字符串的行,而upvotes列只是具有整数的行。

我想使用熊猫来找出标题中最多的单词投票最多。

做这个的最好方式是什么?

到目前为止,我已经知道了这一点,但是apply方法将一系列传递给x,所以很显然我不明白这是如何工作的。

df.groupby('upvotes')['headline'].apply(lambda x: len(x.split(' '))).sort_index(ascending=False)

前5行数据:

   upvotes                                           headline                  
0        1  Software: Sadly we did adopt from the construc...                  
1        1   Google’s Stock Split Means More Control for L...                  
2        1  SSL DOS attack tool released exploiting negoti...                  
3       67       Immutability and Blocks Lambdas and Closures                  
4        1         Comment optimiser la vitesse de Wordpress?      
pp

如果我了解您的问题,则可以使用groupby.mean此方法。您可以groupby.sum根据需要替换为

一般来说,最好避免使用lambda函数。

df = pd.DataFrame({'upvotes': [1, 1, 1, 67, 1],
                   'headline': ['Software: Sadly we did adopt from the', 'Google’s Stock Split Means More Control for',
                                'SSL DOS attack tool released exploiting', 'Immutability and Blocks Lambdas and Closures',
                                'Comment optimiser la vitesse de Wordpress? ']})

df['wordcount'] = df['headline'].str.split().map(len)

df = df.groupby('wordcount', as_index=False)['upvotes'].mean()\
       .sort_values('upvotes', ascending=False)

print(df)

#    wordcount  upvotes
# 0          6       23
# 1          7        1

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

熊猫按另一列中的值对一列进行排序

熊猫按另一列的平均值对一列的值进行排序

将熊猫数据框列中的单词按另一列分组以获得频率/计数

熊猫按一列分组将另一列的值连接为定界列表

使用差异对列进行分组并在熊猫中按另一列对另一列进行排序

按一列的值排序,使行按另一列的值分组

posgresql:为按日期排序的另一列中的每个不同值选择一列中的滞后值

熊猫:按多列分组,将一列串联,同时添加另一列

熊猫Slinear插值按另一列分组

熊猫:按日期将一列分组,并在另一列中计算特定值的累计数量

SQL按值对另一列进行排序

在Pandas Dataframe中按一列排序,然后按另一列分组?

按一列分组,然后在熊猫中查找另一列的总和和最大值

根据一列中的值(以另一列为条件)按顺序对数据进行排序

根据另一列中的值将值添加到熊猫数据框的一列中

使用另一列(熊猫)的值将一列变成两列

根据熊猫中的另一列对唯一值进行排序

如何基于熊猫中的另一列数组对一列数组排序?

熊猫-按一列分组,按另一列排序,从第三列获取价值

熊猫:将一列的起始值乘以组中另一列的每个值

将多列除以熊猫中的另一列

将某些列除以熊猫中的另一列

如何在熊猫中按一列或另一列分组

如何在熊猫中另一列的值之间汇总一列中的值

Pandas - 按 2 列排序並比較另一列中的值

熊猫根据另一列中的值替换值

熊猫将一列中的列表项与另一列中的单个值进行比较

R:计算一列中的值的分数,按另一列中的值分组

在R中按组比较一列的值与另一列中的多个值