Bootstrap

ElasticSearch-Nested 类型与 Object 类型的区别

在 Elasticsearch 中,nested 类型和 object 类型都用于处理嵌套的 JSON 数据,但它们在存储和查询方面有着显著的区别。本文将详细解释这两种类型的区别,并提供具体的示例。

一、基本概念

1. object 类型

  • 定义object 类型是 Elasticsearch 默认的嵌套类型,用于表示 JSON 对象。Elasticsearch 会自动将 object 类型的字段展平存储。

  • 存储方式:Elasticsearch 会将 object 类型的字段展平,存储为多个独立的字段。例如,一个包含多个属性的对象数组会被展平为多个数组字段。

  • 查询方式:可以直接使用普通的查询语句,通过点号(.)连接字段路径进行查询。

2. nested 类型

  • 定义nested 类型是一种特殊的 object 类型,每个嵌套对象会被索引为一个独立的隐藏文档。这允许对嵌套对象进行精确的查询和过滤。

  • 存储方式:每个嵌套对象被索引为一个独立的文档,存储时保持了对象的独立性。

  • 查询方式:需要使用 nested 查询来查询嵌套对象。

二、具体区别

1. 存储方式

  • object 类型:Elasticsearch 会将 object 类型的字段展平存储。例如,一个包含多个属性的对象数组会被展平为多个数组字段。这种展平存储方式可能会导致一些查询问题,特别是当需要对嵌套对象进行精确查询时。

  • nested 类型:每个嵌套对象被索引为一个独立的文档,存储时保持了对象的独立性。这使得对嵌套对象的查询更加精确和灵活。

2. 查询方式

  • object 类型:可以直接使用普通的查询语句,通过点号(.)连接字段路径进行查询。

{
  "query": {
    "term": {
      "inspector.id": {
        "value": "222"
      }
    }
  }
}
  • nested 类型:需要使用 nested 查询来查询嵌套对象。

{
  "query": {
    "nested": {
      "path": "inspector",
      "query": {
        "term": {
          "inspector.id": {
            "value": "222"
          }
        }
      }
    }
  }
}

3. 查询结果

  • object 类型:由于 object 类型的字段被展平存储,有时会导致“且”查询变成“或”查询。例如,查询同时包含“欧莱雅”和“美白”的文档时,可能会返回不正确的结果。

  • nested 类型nested 类型的查询可以精确地匹配嵌套对象,避免了上述问题。例如,查询同时包含“欧莱雅”和“美白”的文档时,不会返回任何结果,因为没有任何一个嵌套对象同时具备这两个属性。

四、总结

  • object 类型:适用于简单的嵌套结构,数据被展平存储,不支持复杂的嵌套查询。

  • nested 类型:适用于需要复杂查询的嵌套结构,支持对嵌套对象的精确查询和过滤。

根据具体的业务需求选择合适的数据类型,以优化查询性能和数据建模的复杂性。如果需要对嵌套对象进行精确的查询和过滤,建议使用 nested 类型。如果嵌套结构简单,且不需要复杂的查询,可以使用 object 类型。

;