统计单词数

统计单词数

题目描述

一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数。

现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给定的文章中出现的次数和第一次出现的位置。注意:匹配单词时,不区分大小写,但要求完全匹配,即给定单词必须与文章中的某一独立单词在不区分大小写的情况下完全相同(参见样例 1),如果给定单词仅是文章中某一单词的一部分则不算匹配(参见样例 2)。

输入格式

共 2行。

第 1 行为一个字符串,其中只含字母,表示给定单词;

第 2 行为一个字符串,其中只可能包含字母和空格,表示给定的文章。

输出格式

一行,如果在文章中找到给定单词则输出两个整数,两个整数之间用一个空格隔开,分别是单词在文章中出现的次数和第一次出现的位置(即在文章中第一次出现时,单词首字母在文章中的位置,位置从 0 开始);如果单词在文章中没有出现,则直接输出一个整数 −1。

注意:空格占一个字母位

输入输出样例

输入 #1

To
to be or not to be is a question

输出 #1

2 0

输入 #2

to
Did the Ottoman Empire lose its power at that time

输出 #2

-1

说明/提示

数据范围

1≤ 第一行单词长度 ≤10。

1≤ 文章长度 ≤10^6。

这道题我先说一下错误思路,算是提供一下反例吧,

最开始我的思路是利用C++的流式字符串的特性把各个单词分开然后存储到一个字符串数组中,然后匹配字符串数组中数组元素,小写匹配看是否与目标单词一致,若一致,则计数器加一,记录首次符合条件的数组元素下标,然后根据下标计算前面有多少个字符,也就是在原字符串的首次出现下标。

这里面其实有个关键问题,就是我们并不能确定每个单词之间相隔多少个空格

这就导致了我们在流式操作后,无法计算得到正确的首次出现的下标位置


没办法,这种操作是行不通的,那么只能传统的使用滑动窗口的方式了,

设置滑动窗口大小为目标单词长度,再均变为小写字母后遍历字符串的对应窗口,看窗口内字符是否与目标单词匹配。这里面要注意循环时的结束条件,应为字符串长度-滑动窗口长度+1

当然,还有之后还有一步判断,就是保证成功匹配的是一个独立的单词而不是某单词的前缀,

这要求若滑动窗口不在首尾,前后一定是空格

若上述条件均满足,计数器加一,记录首次出现的位置即可

#include<bits/stdc++.h>

using namespace std;

int main() {
    string words, line;
    int count = 0, res_index = -1;
    getline(cin, words);
    getline(cin, line);
    int len = words.length();
    for(int i = 0; i < len; i++) {
        words[i] = tolower(words[i]);
    }
    for(char &ch : line) {
        ch = tolower(ch);
    }

    for(int i = 0; i < line.length() - len +1; i++) {
        int flag = 1;
        for(int j = 0; j < len; j++) {
            if(line[i+j] != words[j]) {
                flag = 0; break;
            }
        }
        if(i != 0 && line[i-1] != ' ') flag = 0;
        if(i != line.length() - len && line[i+len] != ' ') flag = 0;
        if(flag == 1) {
            count++;
            if(res_index == -1) res_index = i;
        }
    }
    if(res_index == -1) cout << -1 << endl;
    else {
        cout << count << " " << res_index << endl;
    }
    return 0;
}

相关推荐

  1. 统计单词

    2024-03-23 01:00:03       34 阅读
  2. P1308 统计单词

    2024-03-23 01:00:03       37 阅读
  3. P1308 [NOIP2011 普及组] 统计单词----有意思

    2024-03-23 01:00:03       52 阅读
  4. 2011NOIP普及组真题 2. 统计单词

    2024-03-23 01:00:03       34 阅读
  5. 蓝桥杯备赛1.统计单词

    2024-03-23 01:00:03       37 阅读
  6. 统计英语单词

    2024-03-23 01:00:03       45 阅读
  7. 单词统计(C语言)

    2024-03-23 01:00:03       57 阅读
  8. pyflink统计单词

    2024-03-23 01:00:03       39 阅读
  9. 统计单词数量(文件)(*)

    2024-03-23 01:00:03       34 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-23 01:00:03       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-23 01:00:03       106 阅读
  3. 在Django里面运行非项目文件

    2024-03-23 01:00:03       87 阅读
  4. Python语言-面向对象

    2024-03-23 01:00:03       96 阅读

热门阅读

  1. docker-compose 启动服务还需要pm2 守护进程?

    2024-03-23 01:00:03       50 阅读
  2. Go语言学习03-字符串

    2024-03-23 01:00:03       38 阅读
  3. Opencv面试题

    2024-03-23 01:00:03       39 阅读
  4. 千帆AppBuilder开发参考-应用API调用说明

    2024-03-23 01:00:03       42 阅读
  5. leetcode 494.目标和

    2024-03-23 01:00:03       43 阅读
  6. RTL编码之严格优先级调度方法

    2024-03-23 01:00:03       36 阅读
  7. 深入探究Spring中Bean的生命周期

    2024-03-23 01:00:03       32 阅读