在Mallet中,csvIterator的参数是什么意思?

伦敦人

我正在使用槌主题建模示例代码,尽管运行良好,但我想知道此语句的参数实际上是什么意思?

instances.addThruPipe(new CsvIterator(new FileReader(dataFile),
                                      "(\\w+)\\s+(\\w+)\\s+(.*)",
                                      3, 2, 1)  // (data, target, name) field indices                    
                     );
姆巴特卡罗夫

文档中

该迭代器(可能更恰当地称为“行模式迭代器”)会基于正则表达式读取文件并每行返回一个实例。

如果您有以下形式的数据

[名称] [标签] [数据]

您感兴趣的电话是

CsvIterator(java.io.Reader input, java.lang.String lineRegex, 
            int dataGroup, int targetGroup, int uriGroup) 

第一个参数是如何读取数据,例如文件读取器或字符串读取器。第二个参数是正则表达式,用于从读取器读取的每一行中提取数据。在您的示例中,您已将(\\w+)\\s+(\\w+)\\s+(.*)其转换为:

  • 1个或更多字母数字字符(捕获组,这是实例的名称),后跟
  • 1个或多个空格字符(制表符,空格,..),后跟
  • 1个或多个字母数字字符(捕获组,这是标签/目标),后跟
  • 1个或多个空格字符(制表符,空格,..),后跟
  • 0个或更多字符(这是数据)

数字3, 2, 1表示数据排在最后,目标排在第二,名称排在第一。正则表达式基本上可以确保每行的格式均符合文档中所述:

test1 spam Wanna buy viagra?
test2 not-spam Hello, are you busy on Sunday?

CsvIterator 是一个糟糕的名字,因为它实际上不是此类读取的逗号分隔值,而是空格分隔(空格,制表符...)的值。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

在Python函数中,参数中单独的*是什么意思

传递参数是什么意思?在C#中

Wikipedia API响应中的参数是什么意思?

*作为python中的参数是什么意思?

django模型的Field中的string参数是什么意思?

PendingIntent.send()中的参数代码是什么意思?

glDrawElements中的index参数是什么意思?

python函数参数中的“或”是什么意思?

参数键在dataframe.to_hdf()中是什么意思

-l参数在tcsh中是什么意思?

ffmpeg中的-ab参数是什么意思?

scipy.stats.zipf 中的参数是什么意思?

** / *(D。)在(zsh)sed参数中是什么意思?

LAPACKE_dgesvd(..)中的参数精湛是什么意思?

PreparedStatement中的这些值/参数是什么意思?

go build -ldflags参数中的-X是什么意思?

go build -ldflags参数中的-static是什么意思?

strategy.entry() 中的参数 stop 是什么意思

ReadMsgUDP中的返回参数“标志”是什么意思?

参数在PDFBox矩阵中是什么意思

AWS容器服务中的“ cpu”参数是什么意思?

问号在类型参数绑定中是什么意思?

参数require.resolve()中的斜杠是什么意思?

模板参数中的“ typename =”是什么意思?

...在SCSS mixin参数中是什么意思?

星号在scanf的参数列表中是什么意思

: => A 语法在方法参数声明中是什么意思?

“ git config”命令中的参数“ --add”是什么意思?

参数“绑定”在typing.TypeVar 中是什么意思?