Python读取多个.txt文件并使用pandas行绑定

gh0strider18

我来自R(和SAS),在读取大量.txt文件(都存储在同一目录中)并在熊猫中创建一个大数据框时遇到问题。到目前为止,我已经尝试过合并代码-所有这些都不幸失败了。我认为这是一个简单的任务,但缺乏python的经验...

如果有帮助,我将使用以下数据创建一个大型数据框:http ://www.ssa.gov/oact/babynames/limits.html-特定于状态的集合(总共50个,以其状态缩写命名)。文本)

请帮忙!

import pandas as pd

import glob

filelist = glob.glob("C:\Users\Dell\Downloads\Names\*.txt")

names = ['state', 'gender', 'year', 'name', 'count']

然后,我正在考虑使用pd.concat,但不确定-本质上我想读取每个数据集,然后将它们绑定在一起(假设它们都具有相同的列)。

坦克内普

concat很不错,因为默认情况下“ join”被设置为“ outer”(即索引的并集)。您可以轻松地使用df.join(),但必须将“如何”指定为“外部”。无论哪种方式,您都可以非常简单地构建数据框:

import pandas as pd
from glob import glob as gg

data = pd.DataFrame()
names = ['state', 'gender', 'year', 'name', 'count']

for f in gg('*.txt'):
    tmp = pd.read_csv(f,columns=names)

    data = pd.concat([data,tmp],axis=0,ignore_index=True)

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Python映射读取多个.txt文件

如何使用python读取多个(超过2个).txt文件

Python搜索多个目录并读取选择的文件

在python中读取多个csv文件

如何优化在python中读取多个文件

读取python中多个按钮的特定行

Python-读取多个文件并写入多个新文件

从 Python 中的多个文件夹读取多个 CSV 文件?

Python pandas 读取 .txt 文件并使用分隔列导出 .csv

Python Pandas-读取包含多个表的csv文件

读取多个 CSV 文件并合并 Python Pandas

使用 Python 在循环中使用生成器读取多个 txt 文件

Python:从.txt文件读取行并使用它们进行计算

Python Panda使用不同的日期读取多个excel文件

跳过行,并在使用Python读取文件期间将行保存到多个数组中

Python读取多个.txt并在同一图中绘图

使用 Python / Pandas 读取多个 JSON 文件并附加到数据集

Python读取txt文件中的行并写入新的txt文件

在Python中使用多重处理读取多个文件并连接读取值

从与Python文件夹按顺序读取多个Excel文件

的Python:读取多个文件和存储特定文件的输出

Python:从文件夹中读取多个json文件

Python Pandas:读取具有多个表的csv重复的序言

Python在JSON文件中读取具有多个值的Dict

在python中一次读取多个文件

一次读取多个文件的Python程序

在 Azure ML Python 脚本中读取多个 CSV 文件

如何从python中的.xls文件读取多个表?

Python struct模块从文件中读取多个浮点数