从文件名中提取日期并创建一个新列,并在Python中自动填充该日期

阿比

我正在将100个CSV与诸如XXX_XX_20112020.csv之类的名称连接起来,以创建一个文件,例如master.csv

我可以从每个文件名中提取日期并创建一个新列,并自动为该文件中的所有记录填充该日期吗?我应该在连接之前还是之后执行此操作,以及如何进行?

动物瘤
import os
import pandas as pd

master_df = pd.DataFrame()
for file in os.listdir('folder_with_csvs'):
    # we access the last element after an underscore and all before the dot before csv
    date_for_file = file.split('_')[-1].split('.')[0]
    date_for_file = datetime.datetime.strptime(date_for_file, "%d%m%Y").date()
    df = pd.read_csv(file)
    # Following line will put your date in the `POST_DATE` column for every record of this file
    df['POST_DATE'] = date_for_file 
    master_df = pd.concat([master_df, df])

# Eventually
master_df.to_csv('master.csv')

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

每个日期只创建一个与该日期对应的文件名的文件

如何从python中的文件名中提取日期?

检查几列中的日期,并在python中创建一个新列

从python中扩展前的最后一个索引中的文件名中提取年份

从文件名PHP中提取日期

监视第一个实体中的日期字段,并在该日期之前在另一个实体中创建记录

使用python中的import re从文件名中提取日期

从一个列中提取第一个和最后一个日期,然后插入到两个新列中

将Word创建日期提取到文件名中

创建一个函数以使用 bash 中的分隔符从多个文件名中提取文件名

获取创建文件的日期,使用该日期创建一个文件夹并移动文件

如何在詹金斯管道中创建一个以日期戳作为文件名的目录?

从文件名可变的文件中提取日期

将子文件夹中的多个 CSV 文件合并到一个唯一的文件中,并在新列中添加文件名

如何从不同的文件中提取特定的列并在一个文件中输出?

在python中创建一个由变量名填充的新列

Excel VBA 从文件名中提取日期

从CSH脚本的文件名中提取日期?

如何从 json 中提取属性并在 python 中创建一个列表?

如何使用python仅提取列中提供的两个日期之间的一个日期

JQuery - 新的日期格式并在数组选项中创建一个 var 变量

从CSV文件中提取最后几行,并将其放入Python中具有文件名的另一个文件中

在另一列中显示文件的日期,并在gridview中显示文件名

添加日期并在javascript中创建一个函数

将文件名中包含日期的文件复制到该日期的文件夹中

如何使用Python从hdf格式的文件名中提取日期?

使用Shell脚本从UNIX中的文件名中提取日期

从字符串中删除日期后,从文件名中提取字符串

在 Pandas Dataframe 中创建一个新列,从 URI 中提取域