全角半角以及Normalizer

文章目录

全角半角

全角是一个字符占2个字符,半角就是正常一个字符占字符

输入法输入的有汉字,英文字母,数字,标点符号

汉字默认全角

英文字母和数字默认半角

中文输入法标点符号是全角,英文输入法标点符号是半角

全角半角实际上也是编码上的差异

Normalizer

Java里Normalizer就是用来归一化输入字符的作用

一般用来消除编码上的差异,语义上a和b是相同的符号

        String a = ",";
        String b = ",";
        String aNor = Normalizer.normalize(a, Normalizer.Form.NFKC);
        String bNor = Normalizer.normalize(b, Normalizer.Form.NFKC);
        System.out.println(a.equals(b)); //false
        System.out.println(aNor.equals(bNor)); //true

四种Normailizer.Form

例如:

浏览器输入 www。baidu。com 和www.baidu.com 效果是一样的

相关推荐

  1. 以及Normalizer

    2024-06-13 06:06:07       5 阅读
  2. BERT tokenizer 增加标点符号

    2024-06-13 06:06:07       10 阅读
  3. ROS 欧拉

    2024-06-13 06:06:07       33 阅读
  4. 无人机的航向

    2024-06-13 06:06:07       16 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-13 06:06:07       10 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-13 06:06:07       12 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-13 06:06:07       11 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-13 06:06:07       13 阅读

热门阅读

  1. Lua与C交互API接口总结

    2024-06-13 06:06:07       5 阅读
  2. 华为AR路由器配置防攻击策略

    2024-06-13 06:06:07       5 阅读
  3. kotlin 语法糖

    2024-06-13 06:06:07       6 阅读
  4. Web前端后端结合:深度解析与实战策略

    2024-06-13 06:06:07       4 阅读
  5. 字节跳动基础架构两篇论文入选 VLDB 2024

    2024-06-13 06:06:07       4 阅读
  6. payable介绍, 编写一个转账的测试合约

    2024-06-13 06:06:07       5 阅读