每日OJ题_优先级队列_堆③_力扣692. 前K个高频单词

目录

力扣692. 前K个高频单词

解析代码


力扣692. 前K个高频单词

692. 前K个高频单词

难度 中等

给定一个单词列表 words 和一个整数 k ,返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序。

示例 1:

输入: words = ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i" 和 "love" 为出现次数最多的两个单词,均为2次。
    注意,按字母顺序 "i" 在 "love" 之前。

示例 2:

输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词,
    出现次数依次为 4, 3, 2 和 1 次。

注意:

  • 1 <= words.length <= 500
  • 1 <= words[i] <= 10
  • words[i] 由小写英文字母组成。
  • k 的取值范围是 [1, 不同 words[i] 的数量]

进阶:尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。

class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k) {

    }
};

解析代码

一道Topk问题的拓展,有点考验语法能力:

稍微处理一下原数组:

  • 需要知道每一个单词出现的频次,因此可以先使用哈希表,统计出每一个单词出现的频次。
  • 然后在哈希表中,选出前 k 大的单词(为什么不在原数组中选?因为原数组中存在重复的单词,哈希表里面没有重复单词,并且还有每一个单词出现的频次)

如何使用堆,拿出前 k 大元素:

一、先定义一个自定义排序,我们需要的是前 k 大,因此需要一个小根堆。但是当两个字符串的频次相同的时候,我们需要的是字典序较小的,此时是一个大根堆的属性,在定义比较函数的时候需要注意。

  • 当两个字符串出现的频次不同的时候:需要的是基于频次比较的小根堆
  • 当两个字符串出现的频次相同的时候:需要的是基于字典序比较的大根堆

二、定义好比较器之后,依次将哈希表中的字符串插入到堆中,维持堆中的元素不超过 k 个。

三、遍历完整个哈希表后,堆中的剩余元素就是前 k 大的元素

class Solution {
public:
    struct cmp
    {
        bool operator()(const pair<string, int>& p1, const pair<string, int>& p2)
        {
            if(p1.second ==  p2.second) // 频次相同,字典序排序,小的在前,大根堆less
                return p1.first < p2.first;
            return p1.second > p2.second; // 频次大的在前->小根堆greater
        }
    };

    vector<string> topKFrequent(vector<string>& words, int k) {
        unordered_map<string, int> hash;
        for(auto& e : words) // 字符和频次映射到哈希表
        {
            hash[e]++;
        }
        priority_queue<pair<string, int>, vector<pair<string, int>>, cmp> heap;
        for(auto& e : hash) // Topk主逻辑
        {
            heap.push(e);
            if(heap.size() > k)
                heap.pop();
        }
        vector<string> ret(k); // 提取结果返回
        for(int i = k - 1; i >= 0; --i)
        {
            ret[i] = heap.top().first;
            heap.pop();
        }
        return ret;
    }
};

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-07 21:44:04       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-07 21:44:04       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-07 21:44:04       82 阅读
  4. Python语言-面向对象

    2024-04-07 21:44:04       91 阅读

热门阅读

  1. 真正的力量:实力与人际关系的平衡艺术

    2024-04-07 21:44:04       36 阅读
  2. Go rand 随机数

    2024-04-07 21:44:04       32 阅读
  3. 19.删除链表的倒数第N个节点

    2024-04-07 21:44:04       34 阅读
  4. C++ [NOIP2006 普及组] 明明的随机数

    2024-04-07 21:44:04       42 阅读
  5. RabbitMQ交换机类型!!!

    2024-04-07 21:44:04       46 阅读
  6. 投资回报率ROI是什么意思?

    2024-04-07 21:44:04       33 阅读
  7. 《牛客》-C小红的字符串构造

    2024-04-07 21:44:04       40 阅读
  8. jq的跳转方法有哪些(补)

    2024-04-07 21:44:04       34 阅读
  9. 小朋友排队(归并排序c++)

    2024-04-07 21:44:04       40 阅读