如何在所有行的python列表中找到开始和结束索引

贝拉特里克斯

我的代码 -

df=pd.read_csv("file")
l1=[]
l2=[]
for i in range(0,len(df['unions']),len(df['district'])):
    l1.append(' '.join((df['unions'][i], df['district'][i])))
    l2.append(({"entities": [[(ele.start(), ele.end() - 1) for ele in re.finditer(r'\S+', df['unions'][i])] ,df['subdistrict'][i]],}))

TRAIN_DATA=list(zip(l1,l2))
print(TRAIN_DATA)

结果 - [('Dhansagar Bagerhat', {'entities': [[(0, 8)], 'Sarankhola']})]

我的预期输出 -[('Dhansagar Bagerhat', {'entities': [[(0, 8)], 'Sarankhola'],[[(10, 17)], 'AnyLabel']})]如何获得所有行的输出?我只得到一行的结果。好像我的循环不起作用。任何人都可以指出我的错误吗?

我的 csv 文件看起来像这样。“AnyLabel”是另一列。我有大约 500 行 -

unions        subdistrict   district 
Dhansagar     Sarankhola    Bagerhat 
Daibagnyahati Morrelganj    Bagerhat 
Ramchandrapur Morrelganj    Bagerhat 
Kodalia       Mollahat      Bagerhat
U12-转发

尝试使用str.join

df=pd.read_csv("file")
l1=[]
l2=[]

for idx, row in df.iterrows():
    l1.append(' '.join((row['unions'], row['district'])))
    l2.append(({"entities": [[[ele.start(), ele.end() - 1], ele.group(0)] for ele in re.finditer(r'\S+', ' '.join([row['unions'] ,row['subdistrict']]))]}))
    

TRAIN_DATA=list(zip(l1,l2))
print(TRAIN_DATA)

输出:

[('Dhansagar Bagerhat', {'entities': [[[0, 8], 'Dhansagar'], [[10, 19], 'Sarankhola']]}), ('Daibagnyahati Bagerhat', {'entities': [[[0, 12], 'Daibagnyahati'], [[14, 23], 'Morrelganj']]}), ('Ramchandrapur Bagerhat', {'entities': [[[0, 12], 'Ramchandrapur'], [[14, 23], 'Morrelganj']]}), ('Kodalia Bagerhat', {'entities': [[[0, 6], 'Kodalia'], [[8, 15], 'Mollahat']]})]

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何在python字典中找到开始和结束索引?

如何在所有蓝图中找到东西?

在熊猫数据框中找到连续的开始和结束索引

如何在python中自动查找列表中元素的开始和结束索引

如何在列表中找到所有连接的子列表?Python

如何在Python列表中找到元素[-1]的正索引

如何在python中找到列表的排序位置/索引?

如何在Python的嵌套列表中找到给定值的索引?

如何在 Python 的列表中找到最大值的索引?

如何在PostgreSQL中找到CIDR输入的开始和结束IP地址

如何在列表中找到所有局部最大值和最小值

如何在元组列表中找到所有最小元素?

如何在边缘列表中找到所有集团

python set列表在所有元素中找到对称差异

如何在列表中找到子集的索引?

如何使用Python从一行开始以[开头和]结束的所有字符串?

如何在Python中找到相交的索引和值?

如何找到列表中元素的开始和结束的单词索引?蟒蛇

如何在单个类悬停时在所有类中找到相同的名称?

如何在所有Linux发行版中找到更新命令?

如何在熊猫中找到所有满足条件的行

python - 如何在pandas python中找到具有完全相同的列和索引但值不同的数据框列表的交集?

如何在python protobuff中找到所有消息

如何在Python中找到ID的所有子代?

在python中找到列表的所有组合

给定X,Y,宽度和高度变量,如何在Google App脚本中找到形状的开始和结束值?

找到所有可能的结束和开始重叠的组合

如何在所有Windows平台(win7,win8,win10和Windows Server 2008,Windows Server 2016等)中找到RegAsm.exe

如何在列表中找到作为列表Python的所有项目中的子字符串存在的项目