带有虚假的名词短语

CentAu 发表于 Python

61

CentAu：

如何使用spacy从文本中提取名词短语？
我指的不是语音标签的一部分。在文档中，我找不到有关名词短语或常规分析树的任何内容。

三段论_：

如果要使用基本NP，即没有协调，介词短语或相对从句的NP，则可以在Doc和Span对象上使用noun_chunks迭代器：

>>> from spacy.en import English
>>> nlp = English()
>>> doc = nlp(u'The cat and the dog sleep in the basket near the door.')
>>> for np in doc.noun_chunks:
>>>     np.text
u'The cat'
u'the dog'
u'the basket'
u'the door'

如果您需要其他内容，最好的方法是遍历句子中的单词并考虑句法上下文，以确定单词是否支配您想要的短语类型。如果是这样，则产生其子树：

from spacy.symbols import *

np_labels = set([nsubj, nsubjpass, dobj, iobj, pobj]) # Probably others too
def iter_nps(doc):
    for word in doc:
        if word.dep in np_labels:
            yield word.subtree

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-07-8

我来说两句

0 条评论

登录后参与评论

相关文章

如何在Spacy中获取所有名词短语

从1行获取带有awk的字符串/短语

检查body类是否包含带有jQuery的短语？

Ansible身份验证，使用带有密码短语的密钥

NLTK：如何遍历名词短语以返回字符串列表？

Python（NLTK）-提取名词短语的更有效方法？

使用spaCy删除包含停用词的名词短语

如何在NLP中找到相似的名词短语？

在名词短语列表中解析NLTK树输出

Typo3 Powermail：带有必填字段的虚假垃圾邮件警报

NLTK语言树遍历并提取名词短语（NP）

如何在Spacy（Python）中获取所有名词短语

名词短语合并后如何获取正确的pos标签？

如何在spaCy中获取名词短语的令牌？

获取带有虚假值的Firebase文档

如何在spaCy中提取带有关键短语的句子

带有评分的Lucene模糊短语搜索方法

带有RSA身份且无密码短语的SSH隧道

带有o：tree和p：panelGrid的虚假表示

在MySQL中选择所有带有共同开始短语的字段

带有短语顺序斜率和OR子句的Lucene查询

带有getche（）函数的C ++短语计数器

如何从解析的文本中提取名词短语

如何在ElasticSearch中查询带有停用词的短语

Spacy，名词短语：如何使用 spacy 定位 doc 中每个 noun_chunk 的名词短语 span 开始和结束标记

带有用于添加数据的虚假项目的 Flutter gridview

有没有办法强制 Apache OpenNLP 解析器看到动词短语而不是名词短语？

GF 中带有限定词的专有名词

如何对 Pandas 中的名词短语进行情感分析？

TOP 榜单

文章

热门标签

归档