在单独的数据框中匹配具有多个标签的数据

NclsK 发表于 Dev

NclsK

我有两个表，或者更确切地说，熊猫Dataframes，calls并且tags看起来像：

calls
id | tags
--------
01 | [tag1]
02 | [tag1, tag2]
03 | []

tags
id | tag_name
-------------
01 | tag1
02 | tag2

我想要一个结果 DF，如：

matching table
id | calls_id | tag_id
----------------------
01 | 01       | 01
02 | 02       | 01
02 | 02       | 02
03 |          |

所以基本上我试图在单独的 DF 中将每个调用与其各自的标签匹配

到目前为止，我最好的方法是：

def match_tags(x):
insert_df = pd.DataFrame(columns=['call_id', 'tag_id'])
for y in x['tags']:
    insert_df = insert_df.append({'call_id':x.id, 'tag_id': tags_df['id'].loc[y]}, ignore_index=True)
insert_df.head()
return insert_df

calls_df.apply(lambda x: pd.concat([tag_matching_df, match_tags(x)]), axis=1)

我不确定这里的 lambda 函数是否是正确的解决方案。

忘记了

您可以结合使用爆炸和合并。Explode 为嵌入列表中的每个项目创建一行。

import pandas as pd
calls = pd.DataFrame([
[1 , ["tag1"]],
[2 , ["tag1", "tag2"]],
[3 , []]
], columns=["callid","tag"])

tags = pd.DataFrame([
[1 , "tag1"],
[2 , "tag2"]
], columns=["tagid","tag"])

pd.merge(calls.explode("tag"),tags, on="tag").drop(columns=["tag"])

给予

    callid  tagid
0   1       1
1   2       1
2   2       2

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-29

我来说两句

0 条评论

登录后参与评论

上一篇：为什么 jQuery 将单选按钮的值返回为“ON”？如何纠正？

如何根据输入变量在 r 中创建多个具有单独名称的数据框

在单独的数据框中匹配具有多个标签的数据

在单独的数据框中匹配具有多个标签的数据

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用