基于ES安装IK分词插件

前言


IK分词器插件是为Elasticsearch设计的中文分词插件,由Elasticsearch的官方团队之外的开发者medcl开发。它主要针对中文文本的分词需求,提供了较为准确的中文分词能力。以下是IK分词器插件的一些特点:

  1. 智能分词:IK分词器采用基于词典加双向最大匹配算法的分词策略,能够较为智能地处理中文文本。

  2. 支持自定义词典:用户可以根据自己的需求,向IK分词器中添加自定义词典,以此来提高分词的准确性。

  3. 多种分词模式

    • ik_max_word:会将文本做最细粒度的拆分,例如“中华人民共和国国歌”会被拆分为“中华人民共和国, 国歌”。
    • ik_smart:会进行智能分词,自动优化文本,例如“杭州市长江大桥”会被拆分为“杭州市, 长江大桥”。
  4. 繁体分词:IK分词器支持对繁体中文的分词。

  5. 英文识别:在分词时,IK分词器能够识别并保留英文单词。

  6. 数字识别:能够识别数字,并将它们作为整体进行分词。

  7. POJIE支持:IK分词器插件还支持POJIE(破解)模式,可以用于处理未授权的Elasticsearch实例。

  8. 易于集成:作为一个插件,IK分词器可以很容易地集成到现有的Elasticsearch项目中。

  9. 社区活跃:IK分词器由活跃的开源社区维护,不断更新和改进,以适应不断变化的中文分词需求。

安装IK分词器插件后,用户可以在Elasticsearch的索引设置中指定使用IK分词器,从而在索引和搜索中文文本时获得更好的效果。这对于中文搜索引擎、日志分析、数据处理等场景非常有用。

请注意,IK分词器插件的使用需要遵守相应的开源许可协议,且在使用前应确保其与你的Elasticsearch版本兼容。

IK分词插件的安装


1、下载资源包

##下载
https://github.com/infinilabs/analysis-ik/releases/download/v7.6.2/elasticsearch-analysis-ik-7.6.2.zip

2、上传到node01节点,并解压到es的插件目录中

##linux的目录地址
/opt/module/ElasticSearch/elasticsearch-7.6.2/plugins/ik

3、重启es使分词器生效

4、登录kibana,执行下面命令验证

# 智能分词
GET /_analyze
{
  "text": "中华人民共和国国歌",
  "analyzer": "ik_smart"
}

# 最细粒度分词
GET /_analyze
{
  "text": "中华人民共和国国歌",
  "analyzer": "ik_max_word"
}

智能分词

最细粒度的分词

 

相关推荐

  1. ES 在浏览器上安装head

    2024-06-08 04:46:01       13 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-08 04:46:01       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-08 04:46:01       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-08 04:46:01       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-08 04:46:01       18 阅读

热门阅读

  1. 局域网、城域网、广域网的ip

    2024-06-08 04:46:01       10 阅读
  2. SpringMVC:@RequestMapping注解

    2024-06-08 04:46:01       9 阅读
  3. 【嵌入式 - 关于MCU的内存分配】

    2024-06-08 04:46:01       9 阅读
  4. Android面试题汇总-Handler

    2024-06-08 04:46:01       11 阅读
  5. Mybatis面试系列五

    2024-06-08 04:46:01       9 阅读
  6. Vue3响应式基础——ref()和reactive()

    2024-06-08 04:46:01       7 阅读
  7. Vue封装localStorage设置过期时间

    2024-06-08 04:46:01       8 阅读
  8. 使用 Ant Design Vue 实现动态表头与数据填充

    2024-06-08 04:46:01       9 阅读
  9. learn-vue中template根节点元素Div

    2024-06-08 04:46:01       8 阅读
  10. 2024全国高考作文题解读(文心一言 4.0版本)

    2024-06-08 04:46:01       11 阅读
  11. el-select中下拉数据太多,页面卡顿

    2024-06-08 04:46:01       10 阅读
  12. SEO 中域权限和页面权限之间的区别

    2024-06-08 04:46:01       7 阅读
  13. 如何不用命令创建用户

    2024-06-08 04:46:01       8 阅读