将两个csv数据合而为一

马丁·布希耶(Martin Bouhier)

我需要在1中混合使用2个csv。我将它们都转换为列表,因为我认为这是最好的方法!另外,请记住,ClientDate位于不同的列中,也许两个文件中的数据顺序都不相同!

list1 csv:

Cliente     Fecha       Status
interlatin  01/01/2018  Alerta Revenue: aumento Subastadas - descenso eCPM y Fillrate
interlatin  31/12/2017  Alerta Fillrate -- Incremento Revenue - Imp Vendidas - Subastadas: Precaucion Fillrate buena Mejora
mmmm        01/01/2018  Alerta Revenue: aumento Subastadas - descenso eCPM y Fillrate
mmmm        31/12/2017  Alerta Fillrate -- Incremento Revenue - Imp Vendidas - Subastadas: Precaucion Fillrate buena Mejora
KKKKK       01/01/2018  Alerta Revenue: aumento Subastadas - descenso eCPM y Fillrate
KKKKK       31/12/2017  Alerta Fillrate -- Incremento Revenue - Imp Vendidas - Subastadas: Precaucion Fillrate buena Mejora

list2 csv:

Fecha   Cliente Subastas    Impresiones_exchange    Fill_rate   Importe_a_pagar_a_medio ECPM_medio
31/12/2017  interlatin  2141801 303970  14.19   339.12  1.12
01/01/2018  interlatin  308759  70938   22.98   41.9    0.59
31/12/2017  mmmm    2141801 303970  14.19   339.12  1.12
01/01/2018  mmmm    308759  70938   22.98   41.9    0.59
31/12/2017  KKKKK   2141801 303970  14.19   339.12  1.12
01/01/2018  KKKKK   308759  70938   22.98   41.9    0.59

我在寻找什么:

Cliente Fecha   Subastas    Impresiones_exchange    Fill_rate   Importe_a_pagar_a_medio ECPM_medio Status
interlati 01/01/2018 2141801 303970 14.19 339.12 1.12 Alerta Revenue: aumento Subastadas - descenso eCPM y Fillrate
interlati 31/12/2017 308759 70938 22.98 41.9 0.59 Alerta Fillrate -- Incremento Revenue - Imp Vendidas - Subastadas: Precaucion Fillrate buena Mejora
mmmm     01/01/2018 2141801 303970 14.19 339.12 1.12 Alerta Revenue: aumento Subastadas - descenso eCPM y Fillrate
mmmm     31/12/2017 308759 70938 22.98 41.9 0.59 Alerta Fillrate -- Incremento Revenue - Imp Vendidas - Subastadas: Precaucion Fillrate buena Mejora
KKKKK     01/01/2018 2141801 303970 14.19 339.12 1.12 Alerta Revenue: aumento Subastadas - descenso eCPM y Fillrate
KKKKK     31/12/2017 308759 70938 22.98 41.9 0.59Alerta Fillrate -- Incremento Revenue - Imp Vendidas - Subastadas: Precaucion Fillrate buena Mejora

码:

import csv
with open('list1.csv', 'rb') as f:
    reader = csv.reader(f)
    list1 = list(reader)


with open('list2.csv', 'rb') as f:
    reader = csv.reader(f)
    list2 = list(reader)


list1[:] = [','.join(item).split(',') for item in list1]
list2[:] = [','.join(item).split(',') for item in list2]

for i, item in enumerate(list2):
    list1[i].append(item[-1])


with open("output.csv", "wb") as f:
    writer = csv.writer(f)
    writer.writerows(list1)
恩索

最好将csv文件读入数据帧df1和df2。

import pandas as pd
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')

然后创建一个公共列:

# CREATE A MERGED COLUMN OF CLIENTE AND FECHA IN BOTH DATAFRAMES:
df1['cl_fecha'] = df1['Cliente']+"_"+df1['Fecha']
df2['cl_fecha'] = df2['Cliente']+"_"+df2['Fecha']

并合并两个数据框(将自动在公共列上合并,条目顺序无关紧要):

# MERGE 2 DATAFRAMES TO GET DESIRED OUTPUT:
df_merged = pd.merge(df1, df2)
print(df_merged)

输出(空条目由Nan填充):

      Cliente       Fecha                                             Status  \
0  interlatin  01/01/2018  Alerta Revenue: aumento Subastadas - descenso ...   
1  interlatin  31/12/2017  Alerta Fillrate -- Incremento Revenue - Imp Ve...   
2        mmmm  01/01/2018  Alerta Revenue: aumento Subastadas - descenso ...   
3        mmmm  31/12/2017  Alerta Fillrate -- Incremento Revenue - Imp Ve...   
4       KKKKK  01/01/2018  Alerta Revenue: aumento Subastadas - descenso ...   
5       KKKKK  31/12/2017  Alerta Fillrate -- Incremento Revenue - Imp Ve...   

                cl_fecha        Subastas  Impresiones_exchange  Fill_rate  \
0  interlatin_01/01/2018          308759              70938.00      22.98   
1  interlatin_31/12/2017  2141801 303970                 14.19     339.12   
2        mmmm_01/01/2018          308759              70938.00      22.98   
3        mmmm_31/12/2017  2141801 303970                 14.19     339.12   
4       KKKKK_01/01/2018          308759              70938.00      22.98   
5       KKKKK_31/12/2017  2141801 303970                 14.19     339.12   

   Importe_a_pagar_a_medio  ECPM_medio  
0                    41.90        0.59  
1                     1.12         NaN  
2                    41.90        0.59  
3                     1.12         NaN  
4                    41.90        0.59  
5                     1.12         NaN  

如注释中所建议,用于to_csv写入新的csv文件:

df_merged.to_csv('df_merged.csv')

编辑:实际上,不需要创建合并列。简单地合并两个数据框pd.merge(df1, df2)也会产生正确的输出。熊猫merge函数还具有几个可以根据需要使用的选项:https : //pandas.pydata.org/pandas-docs/stable/generation/pandas.DataFrame.merge.html

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章