在ElasticSearch中存储数据

罗伯特·约翰斯顿

我正在研究两种在Elastic Search中存储数据的方式。

[
    {
        'first': 'dave',
        'last': 'jones',
        'age': 43,
        'height': '6ft'
    },
    {
        'first': 'james',
        'last': 'smith',
        'age': 43,
        'height': '6ft'
    },
    {
        'first': 'bill',
        'last': 'baker',
        'age': 43,
        'height': '6ft'
    }
]

要么

[
    {
        'first': ['dave','james','bill'],
        'last': ['jones','smith','baker']
        'age': 43,
        'height': '6ft'
    }
]

（名称是+30个字符的散列。嵌套不会超过上述字符）

我的目标是：

查询速度
磁盘空间

我们正在谈论300Gb和1 TB之间的区别。

我的问题是，Elastic Search可以像平铺数据一样快地搜索嵌套数据吗？

尼古拉·瓦西里耶夫（Nikolay Vasiliev）

默认情况下，Elasticsearch将展平对象数组，就像您在示例中演示的那样：

内部对象字段的数组无法按您期望的方式工作。Lucene没有内部对象的概念，因此Elasticsearch将对象层次结构简化为字段名称和值的简单列表。

因此，从查询的角度来看，什么都不会改变。（但是，如果需要查询内部数组的各个项目（例如查询）dave jones，则可能需要将其显式索引为nested数据类型，这会降低性能。）

说到磁盘大小，默认情况下启用压缩。在这里，您应该记住，Elasticsearch将同时以两种方式存储您的原始文档：原始JSON作为source，并隐式存储在反向索引中（实际上用于超快速搜索）。

如果您想了解有关调整磁盘使用情况的更多信息，请访问以下文档页面。例如，您可以为启用更积极的压缩source，或者根本不存储source在磁盘上（尽管不建议这样做）。

希望有帮助！

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-27

我来说两句

0 条评论

登录后参与评论

Elasticsearch在RAM数据存储中

将时间相关数据存储在ElasticSearch中

Elasticsearch如何存储数据

在ElasticSearch中存储混合数据类型

在elasticsearch中存储数据的正确方法是什么？

在Elasticsearch中为搜索存储数据的推荐方式是什么

如何在 Elasticsearch 索引中添加以前存储的数据

在Elasticsearch中存储解析的数据之前，如何使用Logstash过滤数据

Elasticsearch 数据库：elasticsearch 在哪里存储数据？

在Elasticsearch中存储HTML文档

在Elasticsearch中存储日期格式

如何将数据存储在elasticsearch _source中而不对其编制索引？

Elasticsearch将数据存储在哪里？

Elasticsearch在Mac上存储数据的位置

使用Elasticsearch作为中央数据存储库

在R中存储数据

在QSharedMemory中存储数据

在React中存储数据

如何删除存储在本地存储中的数据？

将数据存储在本地存储中

在Android内部存储中存储数据

无法在 redux 存储中存储数据

规范实际存储在Elasticsearch中的内容

Elasticsearch中的存储桶脚本Java API

在Elasticsearch中存储结构化日志

在Elasticsearch中存储树的最佳结构？

在Elasticsearch聚合中获取存储桶计数

Elasticsearch聚合-或在存储桶中

在Elasticsearch中存储聊天消息的最佳方法

TOP 榜单

文章

在ElasticSearch中存储数据

在ElasticSearch中存储数据

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID