elasticsearch的嵌套结构的两种DSL

嵌套结构

针对嵌套结构的基础知识,可以参考文章 嵌套对象

文章 Elasticsearch Nested类型深入详解 对其场景有较好描述:

问题

某个elasticsearch的索引有如下mapping:

"Types": {
  "type": "nested",
  "properties": {
    "FirstTypeName": {
      "type": "text",
      "fields": {
        "Raw": {
          "type": "keyword",
          "ignore_above": 256
        }
      },
      "analyzer": "ik_smart"
    },
    "Tags": {
      "type": "text",
      "fields": {
        "Raw": {
          "type": "keyword",
          "ignore_above": 256
        }
      },
      "analyzer": "ik_smart"
    }
  }
}

描述了商品和(一级分类-二级分类)的一对多关系,两点值得说明:

nested
Raw

需要精准搜索时

在业务上需要精准匹配一级分类的时候,需要 term 查询并加强 Raw 属性:

{
  "query": {
    "bool": {
      "must": {
        "nested": {
          "path": "Types",
          "query": {
            "bool": {
              "must": {
                "term": {
                  "Types.FirstTypeName.Raw": "YJT的数码智能"
                }
              }
            }
          }
        }
      }
    }
  }
}

需要全无搜索时

在用户搜索场景,需要分类提供一定的score时,则只需要 match 查询:

{
  "from": 0,
  "query": {
    "function_score": {
      "boost_mode": "multiply",
      "field_value_factor": {
        "factor": 2,
        "field": "RecentOrderCnt",
        "modifier": "log2p"
      },
      "max_boost": 4,
      "query": {
        "bool": {
          "must": {
            "match": {
              "GoodsName": {
                "operator": "and",
                "query": "华为"
              }
            }
          },
          "should": {
            "multi_match": {
              "fields": [
                "Types.FirstTypeName^4",
                "Types.Tags^4",
                "Brand^30",
                "Labels^2"
              ],
              "query": "华为",
              "tie_breaker": 0.1,
              "type": "best_fields"
            }
          }
        }
      },
      "score_mode": "sum"
    }
  },
  "size": 2,
  "sort": [
    {
      "_score": {
        "order": "desc"
      }
    }
  ]
}