如何在 Pandas 中使用 apply 进行嵌套循环

sariii 发表于 Dev

萨里

我有一个这样的数据框：

text,                pos
No thank you.        [(No, DT), (thank, NN), (you, PRP)]
They didn't respond  [(They, PRP), (didn't, VBP), (respond, JJ)]

我想应用一个函数pos并将结果保存在一个新列中。所以输出看起来像这样：

text,                pos                                           score
No thank you.        [(No, DT), (thank, NN), (you, PRP)]        [[0.0, 0.0, 1.0], [], [0.5, 0.0, 0.45]]
They didn't respond  [(They, PRP), (didn, VBP), (respond, JJ)]  [[0.0, 0.0, 1.0], [], [0.75, 0.0, 0.25]]

所以函数为列表中的每个元组返回一个列表（但函数的实现不是这里的重点，为此我只是调用get_sentiment）。我可以使用嵌套循环来做到这一点，但我不喜欢它。我想使用更 Pythonic 和 Pandas Dataframe 的方式来做到这一点：

这是我迄今为止尝试过的：

df['score'] = df['pos'].apply(lambda k: [get_sentiment(x,y) for j in k for (x,y) in j])

但是，它会引发此错误：

ValueError: too many values to unpack (expected 2)

有几个问题，但答案是在 R 中。

为了更清楚：

get_sentiment函数是一个函数，NLTK它为每个单词分配一个分数列表（列表是[positive score, negative score, objectivity score]）。总的来说，我需要在pos我的 Dataframe 列的顶部应用该函数。

贝尼

在你的情况下

df['score'] = df['pos'].apply(lambda k: [get_sentiment(j[0],j[1]) for j in k ])

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-09-18

我来说两句

0 条评论

登录后参与评论

上一篇：很好地将曲线拟合到 gnuplot 或其他程序中的点？

TOP 榜单

文章

如何在 Pandas 中使用 apply 进行嵌套循环

如何在 Pandas 中使用 apply 进行嵌套循环

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接