两个列表的Python比较

Yousaf 发表于 Dev

优素福

我正在从事NLP项目。我已从“简历”中提取了关键字并将其存储在列表中。另一个列表包含我从JSON中提取的所有技术关键字。这两个列表都包含许多关键字，下面仅作参考。

list_of_keys=['azure', 'job', 'matlab', 'javascript', 'http', 'android', 'amazon', 'apache spark']

result=['apache http server', 'angularjs', 'azure bot service', 'amazon s3', 'android sdk', 'android studio', 'amazon cloudfront']

码：

with open('rawtext.json','r', encoding='utf-8') as f:
    data = json.load(f)
result = [x["name"].replace("@", " ").lower() for x in data]
print(result)

print ("List of Matched Keywords are:\n")
# Comparing Lists

for item in list_of_keys: 
    for item1 in result: 
        if item == item1: 
            print("Word from Resume: ", item, ", Word from JSON data: ", item1)
print ("****************\n")

电流输出

简历中的单词：框，JSON数据中的单词：框简历中的单词：arduino，JSON数据中的单词：arduino简历中的单词：arduino，JSON数据中的单词：arduino简历中的单词：浏览器，JSON数据中的单词：浏览器Word中的单词简历：黑色，JSON数据中的单词：黑色简历：地址中的单词，JSON数据中的单词：地址简历：地址中的单词，JSON数据中的单词：地址

我通过比较仅匹配精确单词的两个列表并打印它们，尝试了一种非常简单的方法。但是，我想要的是两个列表中是否有匹配项，例如，如果“ apache spark”与结果列表“ apache http server”匹配，则它应作为输出打印：简历中的单词：apache spark，JSON数据中的Word： apache http服务器。同样，如果匹配了亚马逊，则应将其打印为输出：简历中的单词：亚马逊，JSON数据中的单词：亚马逊s3，亚马逊云

要求的输出：

简历中的单词：apache spark，JSON数据中的单词：apache http服务器简历中的单词：amazon，JSON数据中的单词：amazon s3，amazon cloudfront简历中的单词：http，JSON数据中的单词：apache http服务器

有人可以帮我吗。谢谢。

比塔那

我认为您要实现的目标与简单的相等性检查有所不同，'azure' == 'azure bot service'即将始终返回False。

比较检查可能更复杂，但是从您的预期行为来看，我相信您正在寻找以下内容：

from collections import defaultdict

res_dict = defaultdict(list)
for item in list_of_keys: 
    for item1 in result: 
        if item in item1:
            res_dict[item].append(item1)

for k,v in res_dict.items():
    print("Word from Resume: ", k, ", Word from JSON data: ", ",".join(v))
print ("****************\n")

我已经用=check替换了check in，这意味着如果azure在内部进行比较，则比较将返回true，azure bot service但对于结果数组中的所有其他字符串，则返回false。

我还建议查看Python是否具有字符串“包含”子字符串方法？进行更复杂的子字符串匹配，因为您可能想检查单词list_of_keys和results数组之间是否同时出现单词。

另外，您也可以查看模糊搜索，因为它看起来非常接近您的预期行为https://pypi.org/project/fuzzysearch/

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-27

我来说两句

0 条评论

登录后参与评论

上一篇：React-挂钩-多个按钮-如何将按下的按钮的ID传递给父组件

TOP 榜单

文章

两个列表的Python比较

两个列表的Python比较

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID