将 Pandas 数据帧行作为纯文本进行迭代

亚历克斯

我想逐行读取数据帧(其中包含推文)以分析文本。

import csv
import pandas as pd

df = pd.read_csv('tweets2.csv')
df.head()

for row in df.iterrows():
    print (row)

我写的这段代码没有完成这项工作,因为“行”还包括索引。相反,我想要简单的文本,我将进一步处理。

cs95

你可以使用df.values

for row in df.values:
    print(row)

例子:

df = pd.DataFrame({'Col1': [1, 2, 3, 4, 5], 'Col2' : ['a', 'b', 'c', 'd', 'e']})

print(df)

   Col1 Col2
0     1    a
1     2    b
2     3    c
3     4    d
4     5    e

for row in df.values:
    print(row)

[1 'a']
[2 'b']
[3 'c']
[4 'd']
[5 'e']

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

将 Pandas DataFrame 的行作为字典进行迭代

使用Pandas将数据帧作为JSON编码字典写入文本文件

如何将DataFrame的行作为Pandas中的Series进行迭代?

Python / Pandas / XML - 将 Pandas 数据帧行写回 LXML

使用Python将Pandas数据帧中的行作为单个文档插入mongodb集合中

使用 Pandas 数据帧将变量作为文件处理

将 Pandas 数据帧行移动到最近的时间步

将for循环的输出写入pandas数据帧

PANDAS:将数据帧与 ID 相结合

将输出转换为 Pandas 数据帧

将数据帧行值迭代(循环)作为 Python 函数中的参数传递

pandas 将 3 个数据帧元素迭代为一个函数

将向量作为Pandas数据框元素

如何使用行级迭代从单个时间序列数据帧中对多个 Pandas 数据帧进行子集化?

迭代时如何让pandas数据帧在不同的行开始迭代?

Pandas 将文件行作为列读取

将 dict 转换为 Pandas 数据帧,将键保持在一行中

通过 Pandas 数据帧将值读入新数据帧

将csv文件作为浮点数读取到pandas数据帧

我可以将 spark 数据帧作为参数发送给 Pandas UDF

Pandas:将数据帧的内容合并到单个列中(作为 dict / json 列表)

Pandas - 合并 2 个数据帧,仅将第一个数据帧中的列作为输出

将每个迭代保存在for循环中作为数据帧

如何将 json 文本字符串从 API 请求转换为 Pandas 数据帧?

Pandas - 将数据附加到数据帧会导致比文件源更多的行

将每第二行作为 R 数据帧中的特定列值进行操作

将Py Pandas数据框附加到单个.csv中,并通过单独的列表进行迭代

Pandas 尝试将一行附加到数据帧,但不断覆盖现有行

如何将PANDAS数据帧的一行添加到其余行?