Go语言如何处理含中文的字符串

我们求字符串长度的时候一般使用len(s),但如果对含中文的字符串使用,长度会不符合我们的预期。

package main
import (
    "fmt"
)
func main() {
    const s = "你好,中文!"
    fmt.Println(len(s))
}

结果如下:

18

但是字符串中只有6个字符。

这是因为在Go语言中,字符串是不可变的字节序列,而在UTF-8编码中,一个中文字符通常由多个字节表示。

实验代码:

package main
import (
    "fmt"
)
func main() {
    const s = "你好,中文!"
	fmt.Println(s)
	for i := 0; i < len(s); i++ {
		fmt.Print(s[i], " ")
	}
	fmt.Println()
}

结果如下:

你好,中文!
228 189 160 229 165 189 239 188 140 228 184 173 230 150 135 239 188 129

如果我们想正确求出含中文的字符串的长度,那么我们需要使用unicode/utf8库的RuneCountInString(s)

示例如下:

package main
import (
    "fmt"
    // 导入unicode/utf8
    "unicode/utf8"
)
func main() {
    const s = "你好,中文!"
    // 计算字符长度
    fmt.Println("Rune Count:", utf8.RuneCountInString(s))
}

结果:

Rune Count: 6

这里的Rune是Go中字符的概念,可以查看Strings, bytes, runes and characters in Go进一步了解。

如果想提取字符,可以将字符串string类型的变量转为rune类型的切片。

package main
import (
    "fmt"
    "unicode/utf8"
)
func main() {
    const s = "你好,中文!"
	firstRune := []rune(s)
	fmt.Printf("%c\n", firstRune[:2])
    fmt.Printf("%c\n", firstRune[2])
}

结果:

[你 好]
好

参考:Go by Example 中文版: 字符串和rune类型

相关推荐

  1. Go语言如何处理中文字符串

    2024-04-26 05:10:01       31 阅读
  2. go语言-字符串处理常用函数

    2024-04-26 05:10:01       50 阅读
  3. go语言-字符串处理常用函数

    2024-04-26 05:10:01       51 阅读
  4. Go语言如何处理整数溢出

    2024-04-26 05:10:01       43 阅读
  5. c,c++,go语言字符串演进

    2024-04-26 05:10:01       29 阅读
  6. 【已解决】C语言如何使用宽字符输出中文

    2024-04-26 05:10:01       64 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-26 05:10:01       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-26 05:10:01       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-26 05:10:01       87 阅读
  4. Python语言-面向对象

    2024-04-26 05:10:01       96 阅读

热门阅读

  1. QT设置QTextEdit的文本颜色无效

    2024-04-26 05:10:01       32 阅读
  2. vue2 结合 elementui 实现图片裁剪上传

    2024-04-26 05:10:01       34 阅读
  3. 悲观锁与乐观锁介绍,优缺点

    2024-04-26 05:10:01       25 阅读
  4. Html&Css 基础总结(基础好了才是最能打的)一

    2024-04-26 05:10:01       36 阅读
  5. BERT tokenizer 增加全角标点符号

    2024-04-26 05:10:01       31 阅读
  6. redolog、undolog和binlog日志文件详解

    2024-04-26 05:10:01       35 阅读
  7. 初识reactor响应式编程

    2024-04-26 05:10:01       34 阅读
  8. 在stm32中,所需的库函数有那些

    2024-04-26 05:10:01       27 阅读
  9. P2256 一中校运会之百米跑

    2024-04-26 05:10:01       30 阅读