带有虚假的名词短语

CentAu:

如何使用spacy从文本中提取名词短语?
我指的不是语音标签的一部分。在文档中,我找不到有关名词短语或常规分析树的任何内容。

三段论_:

如果要使用基本NP,即没有协调,介词短语或相对从句的NP,则可以在Doc和Span对象上使用noun_chunks迭代器:

>>> from spacy.en import English
>>> nlp = English()
>>> doc = nlp(u'The cat and the dog sleep in the basket near the door.')
>>> for np in doc.noun_chunks:
>>>     np.text
u'The cat'
u'the dog'
u'the basket'
u'the door'

如果您需要其他内容,最好的方法是遍历句子中的单词并考虑句法上下文,以确定单词是否支配您想要的短语类型。如果是这样,则产生其子树:

from spacy.symbols import *

np_labels = set([nsubj, nsubjpass, dobj, iobj, pobj]) # Probably others too
def iter_nps(doc):
    for word in doc:
        if word.dep in np_labels:
            yield word.subtree

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何在Spacy中获取所有名词短语

从1行获取带有awk的字符串/短语

检查body类是否包含带有jQuery的短语?

Ansible身份验证,使用带有密码短语的密钥

NLTK:如何遍历名词短语以返回字符串列表?

Python(NLTK)-提取名词短语的更有效方法?

使用spaCy删除包含停用词的名词短语

如何在NLP中找到相似的名词短语?

在名词短语列表中解析NLTK树输出

Typo3 Powermail:带有必填字段的虚假垃圾邮件警报

NLTK语言树遍历并提取名词短语(NP)

如何在Spacy(Python)中获取所有名词短语

名词短语合并后如何获取正确的pos标签?

如何在spaCy中获取名词短语的令牌?

获取带有虚假值的Firebase文档

如何在spaCy中提取带有关键短语的句子

带有评分的Lucene模糊短语搜索方法

带有RSA身份且无密码短语的SSH隧道

带有o:tree和p:panelGrid的虚假表示

在MySQL中选择所有带有共同开始短语的字段

带有短语顺序斜率和OR子句的Lucene查询

带有getche()函数的C ++短语计数器

如何从解析的文本中提取名词短语

如何在ElasticSearch中查询带有停用词的短语

Spacy,名词短语:如何使用 spacy 定位 doc 中每个 noun_chunk 的名词短语 span 开始和结束标记

带有用于添加数据的虚假项目的 Flutter gridview

有没有办法强制 Apache OpenNLP 解析器看到动词短语而不是名词短语?

GF 中带有限定词的专有名词

如何对 Pandas 中的名词短语进行情感分析?