遍历目录中的文件并将结果写入带有熊猫的数据帧的新行

艾丽西亚·普利戈

我想从目录中迭代文件,提取一些信息并使用 Pandas 将其写入 Excel 工作表。我有这段代码,但只有在我遍历一个文件(没有循环)时才有效,当我使用循环并尝试迭代所有文件时,输出是一个空的 Excel 工作表。

import re
import os
import pandas as pd
files=[i for i in os.listdir("path") if i.endswith("txt")]
for file in files:
    f=open((file), 'r')
    data=f.read()
    a=re.findall(r'Company Name(.*?)Type',data,re.DOTALL)
    a1="".join(a).replace('\n',' ')
    b=re.findall(r'Sector(.*?)Sub Sector',data,re.DOTALL)
    b1="".join(b).replace('\n',' ')
    w={'Company Name': [a1], 'Sector': [b1]}
    df=pd.DataFrame(data=w)
    print (os.path.join(file))
df.to_excel(r'/Users/nameuser/info.xlsx') 

我看到它遍历所有文件,但这样输出为空。

我该怎么做才能使我从每个文件中获取的所有信息都累积起来并存储到 Excel 文件的新行中?

import re
import os
import pandas as pd

files=[i for i in os.listdir("path") if i.endswith("txt")]

w={'Company Name': [], 'Sector': []}

for file in files:

    f=open((file), 'r')
    data=f.read()
    a=re.findall(r'Company Name(.*?)Type',data,re.DOTALL)
    a1="".join(a).replace('\n',' ')
    b=re.findall(r'Sector(.*?)Sub Sector',data,re.DOTALL)
    b1="".join(b).replace('\n',' ')
    w['Company Name'].append(a1) 
    w['Sector'].append(b1)

    print (os.path.join(file))

df=pd.DataFrame(data=w)
df.to_excel(r'/Users/nameuser/info.xlsx')

通过这种方式,您可以将所有数据填充为 dict,然后将其转换为 DataFrame。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

在带有熊猫的for循环内的CSV数据帧中添加新行

跟踪数据框中的文件并将位置放在带有熊猫的另一列中

添加新行以计算现有熊猫数据帧的总和和平均值

循环遍历结果并将行写入文件

从Windows和UNIX上的子目录中读取带有熊猫的CSV文件

尝试比较两个数据帧,并将逻辑结果写入 R 中的新数据帧

带有熊猫的DataFrame中的每小时数据

如何将熊猫数据帧的两列相乘(行乘法)并将结果存储在新列中?

如何摆脱某些列并将其写到另一个带有熊猫的文件中?

使用带有熊猫的 for 循环创建多个数据帧

在带有熊猫的数据帧末尾附加 1 系列(列)

遍历带有熊猫的数据框时使用if / else语句的最快方法

循环遍历目录中的每个文件并将输出写入文本

如何遍历目录中的所有文件,运行脚本并将其写入其他目录中的匹配文件

返回带有熊猫的hdf文件中所有数据集的列表

在Python中基于带有熊猫的索引在新列中添加值

在Python中使用带有熊猫数据框的布尔数组选择行

循环遍历temp目录中的多个文件,并将文件插入到具有现有行/ ID的MS SQL数据库中

从带有熊猫的网络抓取变量中每 3 行选择第二行

在熊猫中,如何收集所有行中的数据并将新数据分成一行?

如何基于带有熊猫的索引列表将字符串的数据帧分为多列?

熊猫在两个具有相同列的数据帧中减去值创建新的数据帧来存储结果

带有熊猫分组数据的seaborn中的多个单图

比较行中的值并将结果写入新列

如何选择带有熊猫的组中的上一行?

带有熊猫数据框绘图功能的颜色图

带有熊猫数据框的 ARIMA 模型

使用带有熊猫的数据框进行概率测试

选择带有熊猫的分组数据框的特定组