LC 76.最小覆盖子串

最小覆盖子串

76. 最小覆盖子串 - 力扣(LeetCode)

给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 ""

注意:

  • 对于 t 中重复字符,我们寻找的子字符串中该字符数量必须不少于 t 中该字符数量。
  • 如果 s 中存在这样的子串,我们保证它是唯一的答案。

示例 1:

输入:s = "ADOBECODEBANC", t = "ABC"
输出:"BANC"
解释:最小覆盖子串 "BANC" 包含来自字符串 t 的 'A'、'B' 和 'C'。

示例 2:

输入:s = "a", t = "a"
输出:"a"
解释:整个字符串 s 是最小覆盖子串。

示例 3:

输入: s = "a", t = "aa"
输出: ""
解释: t 中两个字符 'a' 均应包含在 s 的子串中,
因此没有符合条件的子字符串,返回空字符串。

提示:

  • m == s.length
  • n == t.length
  • 1 <= m, n <= 10^5
  • st 由英文字母组成

**进阶:**你能设计一个在 o(m+n) 时间内解决此问题的算法吗?

解题

解法一(滑动窗口)

思路分析:

  1. 考虑暴力解法会超时,可以使用滑动窗口来解决,通过移动窗口右边界,寻找包含字符串ts子串,当找到覆盖t的子串时,再移动左边界,将子串长度减小,直到为覆盖字符串t的最小长度。

  2. 对于窗口区间确认为[left, right),即子串长度为right-left,同时重点需要考虑的是:如何确认s的子串是否已经覆盖了字符串t,先将字符串t包含的字符及其数量进行统计,使用数组tNum进行统计,然后在寻找字串的过程中逐步统计子串中包含的字符及其数量,使用数组sWin进行统计。

  3. 若直接使用统计的子串字符及数量和t的统计进行对比,也需要进行遍历对比,对时间消耗很大,因此使用一个变量distance来确认子串是否已经包含了t中的字符:

    1. 在移动右边界,当子串增加了一个在t中的字符时,则令distance++,直到在子串中该字符的数目已经等于或大于在t中的字符数目时,该字符不再令dishtance增加。
    2. 因此当distance == t.length()时,则说明子串已经覆盖了字符串t
    3. 此时移动左边界,当左边界排除了一个在t中的字符时,若排除该字符前,子串中该字符数目等于t中该字符数目时,即sWin[s.charAt(left)] == tNum[s.charAt(left)],该字符被排除,说明子串不再完全包含字符串t中字符,令distance--
  4. 使用minLen来记录最小子串长度,使用begin来记录最小子串的起始索引,若minLen等于初始值,则说明不存在子串满足条件,返回空字符串,否则则将满足条件的子串返回。

实现代码如下:

class Solution {
    public String minWindow(String s, String t) {
       int sLen = s.length();    // 获取字符串s的长度
       int tLen = t.length();    // 获取字符串t的长度
       int[] sWin = new int[128];    // 记录字符串s的字符频数
       int[] tNum = new int[128];    // 记录字符串t的字符频数
       // 将字符串转化为字符数组
       char[] sCharArray = s.toCharArray();
       // 对 t 中的字符数目 进行统计
       for (int i = 0; i < tLen; ++i) {
          tNum[t.charAt(i)] ++;
       }
       // 定义窗口左右端点
       int left = 0;
       int right = 0;
       // 记录s最小子串的长度
       int minLen = Integer.MAX_VALUE;
       // 记录s最小子串的起始索引
       int begin = 0;
       int distance = 0;     // 用于统计s的子串包含多少字符串t中的字符
       // 定义区间为 [left, right)
       while (right < sLen) {
          char chR = sCharArray[right];
          if (tNum[chR] == 0) {  // 当右边界字符不在字符串t中时 直接继续添加下一位字符
             // 该判断可省略
             // 当移动左边界时 可将该字符排除
             right++;
             continue;
          }
          if (sWin[chR] < tNum[chR]) {
             // 当子串中包含该字符数少于字符串t时
             // 即子串保存t中字符数加一
             distance++;
          }
          sWin[chR]++; // 统计该字符
          right ++;   // 移动右指针 保证窗口区间为 [left, right)
          while (distance == tLen) { // 当s的子串包含字符串t的所有字符时 左边界开始移动
             // 此时窗口区间为[left, right) 则窗口长度为 right-left
             if (right -left < minLen) {
                minLen = right - left;
                begin = left;
             }
             char chL = sCharArray[left];
             if (tNum[chL] == 0) {
                // 字符串t不包含该字符 直接移动
                // 该判断可省略 与右边界移动循环判断处对应
                left ++;
                continue;
             }
             if (sWin[chL] == tNum[chL]) {
                distance --;   // 左边界移动导致子串不再完全包含字符串t中的字符
             }
             sWin[chL] --;  // 排除该字符
             left ++;   // 移动左边界
          }
       }
       if (minLen == Integer.MAX_VALUE)
          return "";    // 若minLen未发生改变 则没有符合条件的子串
       return s.substring(begin, begin+minLen);
    }
}

提交结果如下:

解答成功:
	执行耗时:2 ms,击败了99.00% 的Java用户
	内存消耗:43 MB,击败了64.23% 的Java用户

复杂度分析:

  • 时间复杂度分析:O(|S| + |T|),首先需要遍历字符串t,统计其中字符及数量,然后窗口左右边界最极端情况下需要各自遍历一遍,同时将字符串s转换为字符串数组,函数内部需要遍历一次。

  • 空间复杂度分析:O(|S| + |T|)

优化(+哈希表)

优化思路:

  1. 首先考虑字符频数数组,我们可以使用哈希表来统计字符频数,可以省略部分时间和空间,
  2. 同时可以省略一些判断,让代码更加简洁,但是这会增加对于哈希表的操作(此处未省略)

实现代码如下:

class Solution {
    public String minWindow(String s, String t) {
       int sLen = s.length();    // 字符串s的长度
       int tLen = t.length();        // 字符串t的长度
       HashMap<Character, Integer> tHash = new HashMap<>();   // 记录字符串t的字符频数
       HashMap<Character, Integer> sHash = new HashMap<>();   // 记录字符串s的字符频数
       // 先对字符t进行统计
       for (int i = 0; i < tLen; ++i) {
          char ch = t.charAt(i);
          tHash.put(ch, tHash.getOrDefault(ch, 0) + 1);
       }
       int left = 0;  // 定义窗口左边界
       int minLen = Integer.MAX_VALUE;       // 用于记录更新最小子串长度
       int begin = 0;    // 记录最小子串起始索引
       int distance = 0;  // 记录子串包含字符串t字符的字符数
       // 使用for循环代替while 更简洁 但是需要注意窗口区间 变化
       for (int right = 0; right < sLen; ++right) {
          char chR = s.charAt(right);
          if (!tHash.containsKey(chR))
             continue;  // 可以减少很多不必要的比较和操作
          if (sHash.getOrDefault(chR, 0) < tHash.get(chR)) {
             ++ distance;
          }
          sHash.put(chR, sHash.getOrDefault(chR, 0) + 1);
          while (distance == tLen) {
             // 此时窗口区间为[left, right]
             if (right-left+1 < minLen) {
                minLen = right - left + 1;
                begin = left;
             }
             char chL = s.charAt(left);
             if (!tHash.containsKey(chL)) { // 若字符不在t中 则跳过记录到哈希中的步骤
                left ++;
                continue;
             }
             if (sHash.getOrDefault(chL, 0).equals(tHash.get(chL))) {
                // 注意此处判断不能使用 ==
                // 因为Integer引用类型变量   ==比较的是引用而非内容
                -- distance;
             }
             sHash.put(chL, sHash.getOrDefault(chL, 0) - 1);
             left ++;
          }
       }
       if (minLen == Integer.MAX_VALUE) return "";
       return s.substring(begin, begin+minLen);
    }
}

提交结果如下:

解答成功:
	执行耗时:13 ms,击败了70.19% 的Java用户
	内存消耗:43.6 MB,击败了13.80% 的Java用户

总结:

对于一个字符串是否包含另外一个字符串,在不需要考虑字符之间顺序的情况下,可以使用一个变量distance来记录,每当子串中多一个属于t的字符,让distance+1,当distance == t.length()时,即说明此时已包含字符串t,当然对于distance的增加,也需要考虑每个字符对应的数量,相等时不用再让distance+1,但仍需记录下该字符的数目,即sWin[chR]++,便于将该字符排除时不会误判。

相关推荐

  1. LC 76.覆盖

    2024-04-14 16:56:05       15 阅读
  2. leetcode 76. 覆盖

    2024-04-14 16:56:05       43 阅读
  3. LeetCode -- 76. 覆盖

    2024-04-14 16:56:05       19 阅读
  4. LeetCode 76 覆盖

    2024-04-14 16:56:05       19 阅读
  5. 76. 覆盖

    2024-04-14 16:56:05       10 阅读
  6. Leetcode 76. 覆盖

    2024-04-14 16:56:05       10 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-14 16:56:05       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-14 16:56:05       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-14 16:56:05       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-14 16:56:05       20 阅读

热门阅读

  1. 外星符号译码c++

    2024-04-14 16:56:05       17 阅读
  2. leetcode热题HOT 22. 括号生成(回溯)

    2024-04-14 16:56:05       16 阅读
  3. vue3 浅学

    2024-04-14 16:56:05       13 阅读
  4. 鼠标监听事件、模拟画图工具

    2024-04-14 16:56:05       15 阅读
  5. 久菜盒子|留学|推荐信|结构生物学、构造学

    2024-04-14 16:56:05       15 阅读
  6. 239. 滑动窗口最大值

    2024-04-14 16:56:05       14 阅读
  7. 实际工作中kafka的应用和遇到的问题

    2024-04-14 16:56:05       17 阅读
  8. 【ds】 数组中重复的数字

    2024-04-14 16:56:05       16 阅读
  9. React构建组件的方式有哪些,有什么区别?

    2024-04-14 16:56:05       14 阅读
  10. C/C++ inline 函数

    2024-04-14 16:56:05       14 阅读
  11. 如何备考蓝桥杯赛事 怎样才能取得好成绩?

    2024-04-14 16:56:05       16 阅读
  12. Arcgis windows webadaptor配置

    2024-04-14 16:56:05       16 阅读