ElasticSearch 中分词与倒排索引的原理

首先是给检索用的。

  • 英文:一个单词一个词,很简单。I am a student,词与词之间空格分隔。
  • 中文:我是学生,就不能一个字一个字地分,我-是-学生。这是好分的。还有歧义的,使用户放心,使用-户,使-用户。人很容易看出,机器就难多了。所以市面上有各种各样的分词器,一个强调的效率一个强调的准确率。

倒排索引:倒排针对的是正排。
1:正排就是我记得我电脑有个文档,讲了 ES 的常见问题总结。那么我就找到文档,从上往下翻页,找到 ES 的部分。通过文档找文档内容。

2: 倒排:一个 txt 文件 ES 的常见问题 -> D:/分布式问题总结.doc。
所以倒排就是文档内容找文档。当然内容不是全部的,否则也不需要找文档了,内容就是几个分词而已。这里的 txt 就是搜索引擎。

相关推荐

  1. ElasticSearch 分词索引原理

    2024-04-07 12:58:03       20 阅读
  2. Elasticsearch索引是什么?

    2024-04-07 12:58:03       13 阅读
  3. Elasticsearch快速检索法宝: 索引

    2024-04-07 12:58:03       22 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-07 12:58:03       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-07 12:58:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-07 12:58:03       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-07 12:58:03       20 阅读

热门阅读

  1. PostgreSQL入门到实战-第一弹

    2024-04-07 12:58:03       19 阅读
  2. UML 架构图入门介绍 starUML

    2024-04-07 12:58:03       15 阅读
  3. C语言拾遗

    2024-04-07 12:58:03       20 阅读
  4. 统计天数C++

    2024-04-07 12:58:03       21 阅读
  5. 代码随想录打卡Day6

    2024-04-07 12:58:03       18 阅读
  6. 题目 2340: 数列极差

    2024-04-07 12:58:03       16 阅读
  7. spring之AOP(面向切面编程)之详结

    2024-04-07 12:58:03       16 阅读