# /

# 倒排索引与正排索引

1、正排索引又称正向索引,要查找word在哪个doc中,通过doc索引,遍历docs,获得包含word的docs。
2、倒排索引又称反向索引,要查找word在哪个doc中,通过word索引,直接获得包含word的docs。

# 查询、搜索、聚合查询

1、查询侧重查找。
2、聚合侧重统计。
3、查询与聚合查询都属于搜索。(您可以使用搜索API来搜索和聚合存储在Elasticsearch数据流或索引中的数据。)

# 查询、检索

1、查询是精准匹配。
2、检索是近似匹配。

# 三角原则

image.png
大数据、准确性、实时性,难以同时兼顾。

  • Elasticsearch追求实时性与大数据,则牺牲准确性。
  • Hadoop追求大数据与准确性,则牺牲实时性。
  • Mysql追求实时性与准确性,则牺牲大数据。

为什么做不到又快又准又大?

  • “大数据+准确性”依赖网络扩展,快不了。
  • “实时性”依赖单机内存,还要兼顾“大数据”,准不了。(单机内存无法容纳海量数据,采用估算,即准不了。)
  • “实时性”依赖单机内存,还要兼顾“准确性”,大不了。(单机内存无法容纳海量数据,即大不了。)

注意:并非所有场景都做不到快准大。

# 词汇表(Glossary)

# index

1、表示JSON文档的集合。
2、将一个或多个JSON文档添加到Elasticsearch。这个过程称为索引。

# retrieve

检索、取回、召回。

# query

请求有关您的数据的信息。您可以将查询视为一个问题,以Elasticsearch理解的方式编写。