蓝桥杯day03——Bigram 分词

1.题目

给出第一个词 first 和第二个词 second,考虑在某些文本 text 中可能以 "first second third" 形式出现的情况,其中 second 紧随 first 出现,third 紧随 second 出现。

对于每种这样的情况,将第三个词 "third" 添加到答案中,并返回答案。

示例 1:

输入:text = "alice is a good girl she is a good student", first = "a", second = "good"
输出:["girl","student"]

示例 2:

输入:text = "we will we will rock you", first = "we", second = "will"
输出:["we","rock"]

提示:

  • 1 <= text.length <= 1000
  • text 由小写英文字母和空格组成
  • text 中的所有单词之间都由 单个空格字符 分隔
  • 1 <= first.length, second.length <= 10
  • first 和 second 由小写英文字母组成

 

2.解析

  • text(一个字符串,我们要在其中查找特定的字符串),first(第一个字符串)和second(第二个字符串)。这个函数的目标是在text中查找所有firstsecond的连续出现后的第三个词 "third" ,并返回这些第三个词 "third" 的列表。
  • s=first + " " + second:定义一个字符串s,是firstsecond的连接,中间有一个空格。
  • ls = re.findall("[a-z]*" + s + " " + "[a-z]+", text):使用正则表达式在text中查找所有以字母开头,接着是s,然后是一个或多个字母的组合。结果存储在列表ls中。
  • ls1 = re.findall(s + " " + s + " " + "([a-z]+)", text):在文本中查找所有s连续出现两次,中间有一个空格和一个或多个字母的组合。结果存储在列表ls1中。
  • if first==second::如果第一个和第二个字符串相同,则执行以下操作。
  • ls1+=re.findall(second + " " + s + " " + "([a-z]+)",text):在文本中查找所有与之前相同的字符串(因为firstsecond相同),即查找所有连续出现两次的字符串,中间有一个空格和一个或多个字母的组合。找到的结果添加到ls1中。

3.python代码

class Solution:
    def findOcurrences(self, text: str, first: str, second: str) -> list[str]:
        import re
        s=first + " " + second

        ls = re.findall("[a-z]*" + s + " " + "[a-z]+", text)
        ls1 = re.findall(s + " " + s + " " + "([a-z]+)", text)

        if first==second:
            ls1+=re.findall(second + " " + s + " " + "([a-z]+)",text)

        for x in ls:
            if x.startswith(s):
                ls1 += re.findall(s + " " + "([a-z]+)", x)

        return ls1

4.运行结果

 

相关推荐

  1. day01.

    2023-12-07 20:26:04       16 阅读
  2. day01 奇怪的数列 特殊日期

    2023-12-07 20:26:04       32 阅读
  3. 刷题day05——2023

    2023-12-07 20:26:04       31 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-07 20:26:04       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-07 20:26:04       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-07 20:26:04       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-07 20:26:04       18 阅读

热门阅读

  1. Android 透明度颜色值对照表

    2023-12-07 20:26:04       42 阅读
  2. 9月6日,星期三,每日早报简报微语报早读分享

    2023-12-07 20:26:04       34 阅读
  3. Flink入门之部署(二)

    2023-12-07 20:26:04       48 阅读
  4. DevOps|研发提效-敏捷开发之每日站立会

    2023-12-07 20:26:04       38 阅读
  5. 2023.11.27 滴滴P0级故障或为k8s升级造成

    2023-12-07 20:26:04       44 阅读
  6. 算法leetcode|91. 解码方法(rust重拳出击)

    2023-12-07 20:26:04       45 阅读
  7. 万界星空科技开源MES系统的基本功能

    2023-12-07 20:26:04       38 阅读