ES实战-分析数据1

分析是文档被发送并加入倒排索引之前,es在其主体上进行的操作,具体如下
1.字符过滤-使用字符过滤器转变字符
2.文本切分为分词-将文本切分为单个或多个分词
3,分词过滤-使用分词过滤器转变每个分词
4.分词索引-将这些分词存储到索引中
为文档使用分析器
1.当创建索引的时候,为特定的索引进行设置-直接生效
2.在es配置文件中,设置全局分析器-需重启生效
在映射中指定某个字段的分析器

#为description字段指定myCustomerAnalyzer分析器
{
   
  "mappings": {
   
    "document":{
   
      "properties":{
   
        "description":{
   
          "type":"string",
          "analyzer":"myCustomerAnalyzer"
        }
      }
    }
  }
}
#指定不要分析description字段
{
   
  "mappings": {
   
    "document":{
   
      "properties":{
   
        "description":{
   
          "type":"string",
          "index":"not_analyzed"
        }
      }
    }
  }
}

使用分析API来分析文本

curl -XPOST 'localhost:9200/_analyze' -H 'Content-Type: application/json' -d '{
  "analyzer": "standard",
  "text": "share your experience with NoSql & big data technologies"
}'

相关推荐

  1. ES实战-分析数据1

    2024-02-13 06:54:03       48 阅读
  2. 数据分析-pandas1

    2024-02-13 06:54:03       28 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-02-13 06:54:03       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-02-13 06:54:03       106 阅读
  3. 在Django里面运行非项目文件

    2024-02-13 06:54:03       87 阅读
  4. Python语言-面向对象

    2024-02-13 06:54:03       96 阅读

热门阅读

  1. 面试计算机网络框架八股文十问十答第三期

    2024-02-13 06:54:03       62 阅读
  2. 时钟信号和复位信号的来源

    2024-02-13 06:54:03       44 阅读
  3. C语言-二分查找

    2024-02-13 06:54:03       47 阅读
  4. 使用深度学习进行“序列到序列”回归

    2024-02-13 06:54:03       46 阅读
  5. Dubbo集成Zookeeper embbed模式

    2024-02-13 06:54:03       49 阅读
  6. 探索XGBoost:多分类与不平衡数据处理

    2024-02-13 06:54:03       45 阅读
  7. ChatGPT大升级,文档图像识别领域迎来技术革新

    2024-02-13 06:54:03       59 阅读
  8. codeforces 1200E

    2024-02-13 06:54:03       56 阅读
  9. SQL世界之命令语句Ⅳ

    2024-02-13 06:54:03       43 阅读
  10. 动态态势感知中的态、势、感、知变化规律

    2024-02-13 06:54:03       51 阅读