Python - Pandas - 导入 Excel 文件,遍历每一行,添加新值,并添加到数据帧

黑暗的寂静

我有一个 Excel 文件,其中包含需要导入的项目代码和抽象字段,以便我可以在摘要上运行一个简单的文本摘要器,然后添加到数据框中。

我的 Excel 数据集如下所示:

[Proj_Number] | [Abstract]

JJF-123          | Diabetes is a serious chronic condition.  
JFR-223          | Cardiovascular disease is also a chronic condition. 
JF3-334          | Don't forget about asthma and how much it sucks. 

一旦我导入数据,我想应用我的文本摘要器并得到这个:

[Proj_Number] | [Abstract]                        [Ab_keywords]

JJF-123       | Diabetes is a chronic condition.  |Diabetes, chronic condition                                                                 
JFR-223       | COPD is a also chronic condition. | COPD, chronic condition
JF3-334       | Don't forget about asthma too.    | asthma, forgot

我知道我的代码是错误的,但我只是不知道如何遍历每一行,从摘要中获取抽象关键字,将其添加到数据帧中,然后将其导出。

from gensim.summarization.summarizer import summarize
from gensim.summarization import keywords
import pandas as pd

dataset = pd.read_excel('abstracts.xlsx',encoding="ISO-8859-1")
df = pd.DataFrame(dataset)
cols = [1,2]
df = df[df.columns[cols]]

for d in df:
d =  keywords(d, ratio=0.15, split=True))
print(d)
希尔顿92

你不想迭代 df 中的每一行 for d in df:

Pandas 有一种方法可以将函数应用于数据帧的每一行并通过该apply函数返回一个系列

如果您适当地重命名数据框的列,

df['Ab_keywords'] = df['Abstract'].apply(lambda text: keywords(text, ratio=0.15, split=True))

应该管用。

这里的 lambda 函数应用于每一行,df['Abstract']以每一行的值作为其参数。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

从Excel导入数据后,Python Pandas删除白色空格

Python Pandas-具有许多列的数据集-想要遍历每列,仅从非null的字段将行值添加到新列表

将excel文件导入Python

遍历if语句的行并添加到新列[Pandas / Python]

在 Pandas 中导入 excel 文件会出错

Python Pandas:遍历日期并将它们作为新行添加到数据框中?

在Python Pandas中从Excel导入,并将元数据标题重新排列为列数据

如何导入excel文件并使用python和pandas搜索特定记录?

将多个Excel文件导入python pandas并将它们串联到一个数据框中

将大型Excel文件导入Python

Python:如何从网上导入Excel文件?

如何使用Pandas和Python创建新变量并将其添加到数据框以打印为excel?

从 excel 导入坐标 - Python

Python 导入 Excel 列表

无法使用 Pandas 在 Python 中导入数据

pandas.read_excel 为列导入错误的值

将数据从excel导入Python时排除第一行

遍历数据框将行添加到列pandas python

使用python将数据从excel文件导入SQL Server

在python的Excel工作表的每一行中为MIN值添加额外的列

将相同的列表添加到新列的pandas DataFrame中的每一行

在 Python 3.10 中使用 concat 将字典添加到 Pandas DataFrame 中的一行

从excel导入url到python

将Excel文档导入Python

Python pandas dataframe将元素添加到先前的行值并创建一个新列

如果另一个是 NaN,则 Python Pandas 将值添加到新行

如何将PANDAS数据帧的一行添加到其余行?

验证Excel导入的数据

SSIS导入Excel数据