ElasticSearch-使用Java API为大型文件编制索引

超级编码器

我们有一个要求,我们必须使用ElasticSearch来执行全文搜索。我们有一个基于Spring的应用程序,为了与ES集成,我们可以使用Elastic Search的Java API或Spring Data for ElasticSearch。

输入的文件类型约为5MB。

我浏览了ES Java API和SpringData的示例,它们确实提供了可用于插入JSON文档的教程。

但是,关于使用“文件”作为创建文档/索引的输入的任何帮助均不可用。

我是Elastic Search的新手,对此将提供任何指导/帮助。

编辑:

我可以看到ES中有一个Ingest Attachment Processor插件(https://www.elastic.co/guide/en/elasticsearch/plugins/master/ingest-attachment.html)。

谁能指出我使用该插件的示例CURL请求或任何使用此插件的Java代码

萨钦

1.您可以使用Elasticsearch mapper附件插件该插件使用Apache Tika提取几乎所有众所周知的文档类型,并使其可由Elasticsearch进行搜索。

https://www.elastic.co/guide/zh-CN/elasticsearch/plugins/2.3/mapper-attachments.html

2.您可以使用Apache Tika从文件中提取有用的内容,并使用elasticsearch Bulk Indexing API索引到ES

希望能有所帮助

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用Java API的Elasticsearch聚合

如何通过Java API在ElasticSearch中重新编制索引

Elasticsearch使用Java API返回原始JSON

如何使用Elasticsearch提取附件插件为pdf文件编制索引?

通过JAVA API使用JSON文件查询ElasticSearch

使用Python在Elasticsearch中索引JSON文件?

如何使用摄取附件插件和JavaScript客户端在Elasticsearch 6.1中为PDF编制索引?

使用嵌套列表为列表编制索引

通过Java代码在Elasticsearch中使用inguest-attachment插件为pdf / word编制索引

使用Java API进行Elasticsearch排序

尝试使用Kafka Connect在Elasticsearch中为Kafka主题编制索引

Elasticsearch如何使用命令行为文本文件编制索引

使用Java API获取Elasticsearch版本

使用Eclipse通过JAVA API访问Elasticsearch

使用Java API的Elasticsearch FunctionScore查询

索引编制期间Elasticsearch MapperParsingException [无法解析,文档为空]

Elasticsearch中的索引编制

通过插件使用ElasticSearch Java Client API

使用Python UTF-8问题进行Elasticsearch索引编制

使用Elasticsearch索引日志文件

Elasticsearch-什么更快?为相同的文档编制索引或使用detect_noop更新:是吗?

如何使用Elasticsearch对视图内容编制索引?

Elasticsearch简单索引并使用Java API搜索JSON

使用Java API的Elasticsearch

使用Java API从ElasticSearch检索复杂字段

使用Java API检查并插入Elasticsearch

ElasticSearch Java API与ElasticsearchTemplate

如何使用 elasticsearch 5.5.1 索引文件

使用 Java 代码在 ElasticSearch 中索引 PDF 文件