这个词的词性的可能数字

哈米德·米纳

我知道如何在文本中获取单词的pos,但是我需要知道句子中单词的pos可能是什么,例如“ like”可以有4个词类:动词名词介词....是吗有可能从斯坦福图书馆得到它吗?

约翰·怀斯曼

Stanford CoreNLP似乎没有与WordNet的接口,但是使用其他小型Java WordNet库之一来做到这一点很容易。对于此示例,我使用了JWI 2.3.3

除了JWI,您还需要下载WordNet数据库的副本。例如,您可以从Princeton下载WordNet-3.0.tar.gz解开字典。

以下代码包含一个函数,该函数返回一个单词的可能词性列表:

import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Collection;

import edu.mit.jwi.Dictionary;
import edu.mit.jwi.item.POS;
import edu.mit.jwi.item.IIndexWord;
import edu.mit.jwi.morph.WordnetStemmer;

public class WNDemo {

  /**
   * Given a dictionary and a word, find all the parts of speech the
   * word can be.
   */
  public static Collection getPartsOfSpeech(Dictionary dict, String word) {
    ArrayList<POS> parts = new ArrayList<POS>();
    WordnetStemmer stemmer = new WordnetStemmer(dict);
    // Check every part of speech.
    for (POS pos : POS.values()) {
      // Check every stem, because WordNet doesn't have every surface
      // form in its database.
      for (String stem : stemmer.findStems(word, pos)) {
        IIndexWord iw = dict.getIndexWord(stem, pos);
        if (iw != null) {
          parts.add(pos);
        }
      }
    }
    return parts;
  }

  public static void main(String[] args) {
    try {
      Dictionary dict = new Dictionary(new File("WordNet-3.0/dict"));
      dict.open();
      System.out.println("'like' is a " + getPartsOfSpeech(dict, "like"));
    } catch (IOException e) {
      System.err.println("Error: " + e);
    }
  }
}

并输出:

'like' is a [noun, verb, adjective]

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

UNIX这个词的扩展?

这个词典理解可能吗?

Ansi:关于这个词的两个快速问题

strcmp() 函数不适用于“大学”这个词

javascript中颜色这个词是什么意思

Umbraco这个词是什么意思

如何从字面上读“MySQL”这个词?

如何加快这个词元查找算法?

试图找到向下和圆顶这个词(喜欢)

我在硒中找不到这个词

改变词的风格,取决于这个词是否加粗,速度很慢

替换两个词之间的所有内容,包括这个词

过滤所有包含这个词和那个词的句子,R

“这个”这个词是什么意思,“静态”是什么意思?

在铸造、编译器的上下文中,“承诺”这个词是什么意思?

“配置文件”这个词是 Django 中的一个内置功能吗?

将计数器结果发送到 CSV,以字母分隔...只想要这个词

Python如何使用类这个词来引用一个关键的“类”?

Java中的对象监视器是什么意思?为什么使用这个词?

在R中我的字符向量之上的这个词是什么?如何摆脱它

为什么这个词的边界正则表达式不匹配

LibreOffice 如何在公式/方程中写出“大小”这个词?

什么是 ?....:在代码中?我不知道这个词,也找不到它

CALL 这个词在调用例程/功能时是什么意思?

事件监听器为什么我不能用这个词

在这种情况下我如何替换(子)这个词

如何在firebase中保存的url之前去掉可选这个词?

我怎样才能制作出边框底部这个词?

WordPress创建新菜单总是会提示错误这个词是必需的