如何在Python数据框中的每一行上使用split函数？

Goutam 发表于 Dev

212

古塔姆

我想计算复习字符串中一个单词被重复的次数

我正在读取csv文件并将其存储在使用以下行的python数据框中

reviews = pd.read_csv("amazon_baby.csv")

当我将其应用于单个审阅时，以下各行中的代码有效。

print reviews["review"][1]
a = reviews["review"][1].split("disappointed")
print a
b = len(a)
print b

以上行的输出是

it came early and was not disappointed. i love planet wise bags and now my wipe holder. it keps my osocozy wipes moist and does not leak. highly recommend it.
['it came early and was not ', '. i love planet wise bags and now my wipe holder. it keps my osocozy wipes moist and does not leak. highly recommend it.']
2

当我使用以下行将相同的逻辑应用于整个数据框时。我收到错误消息

reviews['disappointed'] = len(reviews["review"].split("disappointed"))-1

错误信息：

Traceback (most recent call last):
  File "C:/Users/gouta/PycharmProjects/MLCourse1/Classifier.py", line 12, in <module>
    reviews['disappointed'] = len(reviews["review"].split("disappointed"))-1
  File "C:\Users\gouta\Anaconda2\lib\site-packages\pandas\core\generic.py", line 2360, in __getattr__
    (type(self).__name__, name))
AttributeError: 'Series' object has no attribute 'split'

霍兰

您正在尝试拆分数据框的整个检查列（这是错误消息中提到的系列）。您要做的是将一个函数应用于数据框的每一行，您可以通过在数据框上调用apply来实现：

f = lambda x: len(x["review"].split("disappointed")) -1
reviews["disappointed"] = reviews.apply(f, axis=1)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-2

我来说两句

0 条评论

登录后参与评论

上一篇：如何删除PhpStorm上的现有服务器？

如何在数据框的每一行上应用函数？

如何在熊猫数据框的每一行上使用.rolling（）？

如何在Python中为数据框的每一行创建唯一的XML

使用Python如何在Pandas数据框中的每一行的范围内生成随机数？

如何在Scala / Spark数据框中的每一行使用withColumn带条件

如何在数据帧的每一行上运行函数，同时使用该数据帧中的多个参数，并在列表中输出新数据帧

如何将函数应用于R中的每一行数据框？

如何在pyspark的数据框中的每一行中查找字符串

使用Apply函数取消列出数据框中的每一行

如何删除熊猫数据框中的每一行？

如何在熊猫数据框中从当前行中减去前一行并将其应用于每一行；不使用循环？

如何在JavaScript中的forEach循环的每一行上执行数学函数？

如何在python上读取csv，tp得到一个数据框，但每3行只有一行？

如何转换在每一列的每一行中包含列表的数据框

如何获取数据框中每一行的每一列的值和类型？

使用存储在列表中的数据框名称在数据框列表的每一列和每一行上执行多种功能

如何在python3中的循环创建的每一行上添加静态值？

如何在python中对pandas数据帧的每一行进行计算？

如何在Python中获取每一行？

如何在一列中的每一行上重复一个谷歌脚本函数？

如何有效地将 rbinom 函数应用于数据框中的每一行？

在pyspark [non pandas]中为数据框的每一行调用一个函数

如何在巨大数据框的每一行中查找前n个值的列索引

如何在不迭代每一行的情况下访问熊猫数据框中的值

如何在删除异常值的情况下找到数据框中每一行的均值？

如何在从R数据框中删除重复项时保留上一行

如何将今天的日期放在Python数据框的每一行的第一列中？

Python：将函数应用于Pandas DataFrame的每一行并返回新数据框

为数据框中的每一行运行函数

TOP 榜单

文章

如何在Python数据框中的每一行上使用split函数？

如何在Python数据框中的每一行上使用split函数？

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）