提取搜索词周围的词

意大利辣香肠比萨饼

我有这个脚本可以在文本中搜索单词。搜索进行得非常好，结果按预期工作。我要达到的目标是提取n匹配词附近的单词。例如：

世界是一个很小的地方，我们应该努力照顾它。

假设我正在寻找place，我需要提取右侧的3个单词和左侧的3个单词。在这种情况下，它们将是：

left -> [is, a, small]
right -> [we, should, try]

这样做的最佳方法是什么？

谢谢！

亨尼·H

def search(text,n):
    '''Searches for text, and retrieves n words either side of the text, which are retuned seperatly'''
    word = r"\W*([\w]+)"
    groups = re.search(r'{}\W*{}{}'.format(word*n,'place',word*n), text).groups()
    return groups[:n],groups[n:]

这使您可以指定要捕获的双方有多少个单词。它通过动态构造正则表达式来工作。和

t = "The world is a small place, we should try to take care of it."
search(t,3)
(('is', 'a', 'small'), ('we', 'should', 'try'))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-6

我来说两句

0 条评论

登录后参与评论

上一篇：从表中检索最新记录（Oracle SQLPlus）

提取搜索词前后的词

弹性搜索词聚合

弹性搜索词的顺序

Elasticsearch返回搜索词

自动构建搜索词

弹性搜索词查询

搜索包含搜索词的字段

删除包含搜索词的行的问题

搜索词的输出行数

(React)按搜索词过滤api

Lucene搜索词如何工作

基于搜索词的动态变化

反应突出显示搜索词问题

通过搜索词OR标签查找wordpost

使用Whoosh生成搜索词建议？

删除匹配搜索词的文本块

python中的矩阵搜索词

MongoDB：如何只提取具有精确搜索词的文档

Javascript：提取字符串中搜索词之后的内容

Unix grep在长搜索词或短搜索词中都能更快地工作吗？

Elastic Search优先搜索以搜索词开头的搜索结果

Drupal 7：具有多个搜索词的搜索视图

全文搜索多个列以查找多个搜索词

搜索在python中具有搜索词的文件

XSLT XML：在搜索结果中突出显示搜索词

键集/搜索分页并按搜索词过滤

按参考文档字段搜索词搜索MongoDB Atlas

Google搜索javascript-如何获取搜索词

如何使用数组作为搜索词来搜索文件

TOP 榜单

文章

提取搜索词周围的词

提取搜索词周围的词

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序