awk做wordcount

使用awk进行wordcount
被处理数据在文件access_2024-1-21.log(一个单词一行)中,内容如下:

word
coutn
wm
sapce
US
china
WORD
WORD
wode
wode
1
2
3333
zzzz
space
spaceX
china
word

执行如下命令可以统计出每个单词出现次数:

```bash
 awk '{S[$1]++}END{for(k in S) print S[k],k}' access_2024-1-21.log

结果如下:
[root@Oler wm]# awk ‘{S[$1]++}END{for(k in S) print S[k],k}’ access_2024-1-21.log
1 spaceX
1 3333
1 zzzz
1 sapce
1 coutn
1 wm
1 space
1 1
1 2
2 china
2 wode
2 WORD
1 US
2 word
命令解释:
此处的S变量表示一个数组,该数组的索引为每个不重复的单词,值就是S[$1],$1代表单词那一列。awk是每都一行执行一次动作。 此处就是每读一行,同一个key对应的值就增加一。从0开始计算。当统计完,最后,也就是END对应的内容,就是循环打印出存储了统计结果的数组的key和值。

相关推荐

  1. awkwordcount

    2024-01-25 02:00:02       54 阅读
  2. flink 入门学习 wordcount

    2024-01-25 02:00:02       30 阅读
  3. 【Hadoop】WordCount源码分析

    2024-01-25 02:00:02       67 阅读
  4. 第一个FLink程序之wordCount

    2024-01-25 02:00:02       54 阅读
  5. 利用scala书写spark程序实现wordCount

    2024-01-25 02:00:02       48 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-25 02:00:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-25 02:00:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-01-25 02:00:02       87 阅读
  4. Python语言-面向对象

    2024-01-25 02:00:02       96 阅读

热门阅读

  1. 使用CompletableFuture实现并发计算-结合实例

    2024-01-25 02:00:02       61 阅读
  2. 数据结构:单链表

    2024-01-25 02:00:02       49 阅读
  3. 微信小程序腾讯地图定位转高德地图定位

    2024-01-25 02:00:02       45 阅读
  4. c语言不定参数

    2024-01-25 02:00:02       61 阅读
  5. GO——recover

    2024-01-25 02:00:02       57 阅读
  6. 解决Milo连接OPU UA报错的两个常见报错

    2024-01-25 02:00:02       59 阅读
  7. 开发安全之:Server-Side Request Forgery

    2024-01-25 02:00:02       48 阅读
  8. 动态规划最后一天(回文串)

    2024-01-25 02:00:02       62 阅读
  9. 【力扣每日一题】力扣2765最长交替子数组

    2024-01-25 02:00:02       72 阅读
  10. python基础——进程

    2024-01-25 02:00:02       61 阅读
  11. WPF关键帧动画

    2024-01-25 02:00:02       63 阅读