第三期书生大模型实战营之Python前置知识

闯关任务1

请实现一个wordcount函数,统计英文字符串中每个单词出现的次数。返回一个字典,key为单词,value为对应单词出现的次数。

算法流程
1. 去除标点:使用string.punctuation和str.translate去除文本中的标点符号。
2. 转换小写:将文本转换为小写。
3. 分割单词:按空格分割文本,得到单词列表。
4. 统计单词:遍历单词列表,对每个单词进行计数,更新word_count字典。
5. 返回字典:返回包含单词及其出现次数的word_count字典。
代码展示
import string

def wordcount(text):
    # 去除标点符号
    punctuations = string.punctuation
    text = text.translate(str.maketrans('', '', punctuations))
    
    # 转换为小写并切割
    text = text.lower()
    words = text.split()

    # 存储单词计数
    word_count = {}
    for word in words:
        if word in word_count:
            word_count[word] += 1
        else:
            word_count[word] = 1
    return word_count

if __name__ == "__main__":
    text = """
            Got this panda plush toy for my daughter's birthday,
            who loves it and takes it everywhere. It's soft and
            super cute, and its face has a friendly look. It's
            a bit small for what I paid though. I think there
            might be other options that are bigger for the
            same price. It arrived a day earlier than expected,
            so I got to play with it myself before I gave it
            to her.
            """
    
    print(wordcount(text))

闯关任务2

使用本地vscode连接远程开发机,将上面你写的wordcount函数在开发机上进行debug,体验debug的全流程,并完成一份debug笔记

本地连接远程开发机

lianjie

Debug记录

请添加图片描述

请添加图片描述
请添加图片描述

活动组织及参考文献

  1. 上海人工智能实验室
  2. InternLM
  3. 课程作业

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-13 16:12:03       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-13 16:12:03       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-13 16:12:03       58 阅读
  4. Python语言-面向对象

    2024-07-13 16:12:03       69 阅读

热门阅读

  1. 嵌入式单片机项目开发的基本思想分享

    2024-07-13 16:12:03       20 阅读
  2. uni-app 蓝牙传输

    2024-07-13 16:12:03       19 阅读
  3. termux 安装 rockylinux

    2024-07-13 16:12:03       22 阅读
  4. 阿里云通义千

    2024-07-13 16:12:03       21 阅读
  5. 前端实现PDF文件打印和下载

    2024-07-13 16:12:03       19 阅读
  6. docker 安装orcale11数据库

    2024-07-13 16:12:03       22 阅读
  7. 缓冲区共享和同步dma_buf 之二

    2024-07-13 16:12:03       20 阅读
  8. Kylin的优缺点

    2024-07-13 16:12:03       19 阅读
  9. 【C语言】头文件命名详解 - 《铁头无敌 ! 》

    2024-07-13 16:12:03       21 阅读
  10. express

    express

    2024-07-13 16:12:03      20 阅读