连接两个具有重复值的数据框

水库投资

有两个数据框:

df1 =

    Col Date        Days
0   A   20180830    30
1   A   20180927    58
2   A   20181025    86
3   B   20180830    30
4   B   20180927    58
5   B   20181025    86
6   C   20180802    2
7   C   20180809    9
8   C   20180816    16
9   C   20180823    23

df2 =

    Col Lot     Pct
13  A   4000    16.19
184 B   600     7.51
206 C   250     5.00
...

如何制作单个数据框:

df =

    Col Date        Days    Lot     Pct
0   A   20180830    30      4000    16.19
1   A   20180927    58      4000    16.19
2   A   20181025    86      4000    16.19
3   B   20180830    30      600     7.51

df1.join(df2,on ='Col')给出KeyError:'Col'#检查重复项

阿比·帕达(Abhay Padda)

相反,您可以pd.merge用来在Pandas中加入数据框。

下面的例子:

import pandas as pd

data_1 = {'Col': ['A', 'A', 'B', 'B', 'C', 'C'], 'Date': [20180830, 20180927, 20180830, 20180927, 20180809, 20180816], 'Days':[1,2,3,4,5,6]}

df1 = pd.DataFrame(data=data_1)

df1

df =

   Col  Date    Days
0   A   20180830    1
1   A   20180927    2
2   B   20180830    3
3   B   20180927    4
4   C   20180809    5
5   C   20180816    6

创建df2

data_2 = {'Col': ['A', 'B', 'C'], 'Lot': [4000, 600, 250], 'PCT': [16.19, 7.51, 5.00]}

df2 = pd.DataFrame(data=data_2)

df2 =

    Col Lot     PCT
0   A   4000    16.19
1   B   600      7.51
2   C   250      5.00

您可以使用以下方法将上述两个数据框连接起来:

pd.merge(df1, df2, on="Col")

输出将是:

    Col Date       Days Lot     PCT
0   A   20180830    1   4000    16.19
1   A   20180927    2   4000    16.19
2   B   20180830    3   600      7.51
3   B   20180927    4   600      7.51
4   C   20180809    5   250      5.00
5   C   20180816    6   250      5.00

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

合并两个具有重复条目但值不同的数据框

在具有多个值的列上连接两个 pyspark 数据框

Python Pandas连接或整形数据以添加两个具有重复值的新列

连接两个仅具有结束日期的熊猫数据框

如何合并/连接两个具有部分字符串匹配的列的数据框?

如何在pydatatable中连接两个具有不同键列名称的数据框?

如何在熊猫中连接两个具有不同列名的数据框?-蟒蛇

如何在熊猫中连接两个或多个具有不同列名的数据框

提取具有两个其他值之间的值的数据框行

从两个具有相同值的表中选择数据后,结果重复

比较两个没有重复的数据框

用 pandas 数据框列重复值拆分为两个数据框,一个有重复,一个没有重复

比较具有重复输入值的两个文件

相交两个具有重复值的List <int>

加入两个具有重复行的数据帧

连接具有相同列的两个panda数据框并合并具有相同索引的行

合并两个不同列中具有匹配值的数据框-Pandas

合并两个具有相似值但日期熊猫不同的不同数据框

熊猫:合并两个具有不同索引和缺失值的数据框

两个 Pandas 数据框的相关矩阵,具有 P 值

Python 数据框中的名称可以同时具有两个值

合并两个具有相似列的数据框

传播具有两个分组列的数据框

合并两个具有多索引的数据框

Python连接两个数据框以查找相同的行值,在相应的行中具有不同的值

如何在Python中划分两个具有不同长度和重复索引的数据框

联接两个具有共同的重复索引的熊猫数据框,而无需执行笛卡尔乘积

从多级熊猫数据框中删除行列表,其中前两个级别具有重复的索引

如何合并两个具有重叠列的数据框,更新现有值并添加新值