# /
# 倒排索引与正排索引
1、正排索引又称正向索引,要查找word在哪个doc中,通过doc索引,遍历docs,获得包含word的docs。
2、倒排索引又称反向索引,要查找word在哪个doc中,通过word索引,直接获得包含word的docs。
# 查询、搜索、聚合查询
1、查询侧重查找。
2、聚合侧重统计。
3、查询与聚合查询都属于搜索。(您可以使用搜索API来搜索和聚合存储在Elasticsearch数据流或索引中的数据。)
# 查询、检索
1、查询是精准匹配。
2、检索是近似匹配。
# 三角原则
大数据、准确性、实时性,难以同时兼顾。
- Elasticsearch追求实时性与大数据,则牺牲准确性。
- Hadoop追求大数据与准确性,则牺牲实时性。
- Mysql追求实时性与准确性,则牺牲大数据。
为什么做不到又快又准又大?
- “大数据+准确性”依赖网络扩展,快不了。
- “实时性”依赖单机内存,还要兼顾“大数据”,准不了。(单机内存无法容纳海量数据,采用估算,即准不了。)
- “实时性”依赖单机内存,还要兼顾“准确性”,大不了。(单机内存无法容纳海量数据,即大不了。)
注意:并非所有场景都做不到快准大。
# 词汇表(Glossary)
# index
1、表示JSON文档的集合。
2、将一个或多个JSON文档添加到Elasticsearch。这个过程称为索引。
# retrieve
检索、取回、召回。
# query
请求有关您的数据的信息。您可以将查询视为一个问题,以Elasticsearch理解的方式编写。
← es2.4地理查询 es2.6相似性评分 →