五花八门客户问题(BUG) - 数据库索引损坏

问题

曾经有个客户问题,让我们开发不知所措了很久。简单点说就是客户的index周期性的损坏,即使全部重建后经历大约1~2周数据update后也会坏掉。导致的直接结果:select出来的数据不对。问题很严重。

直接看损坏的index文件看不出什么蛛丝马迹,因为它已经面目全非。所以我们一直想拿到第一条导致update出错的insert、update,或者delete.

开始探索

沿着上面提到的思路,给力的support写了一个trigger,只要每次更新(insert、update,或者delete)数据,trigger就调用index检查程序检查index文件是否有问题。客户也比较配合的部署上了,但是只过了几天就禁用掉了,因为每次检查index文件都耗时巨大,直接拖慢了客户business performance。

另寻他路

除了trigger,我们还可以出diagnostic build, 基本就是往怀疑的地方加log,此种办法耗时耗力:先在对应的版本上改代码-> 编译 -> 发给客户 -> 客户部署,重启数据库. 一般来往一次耗时一两周,而且一次都不一定成功。

后来我又想出一个办法:客户发我们问题表,同时我们帮客户记录下客户的所有更新直到select结果不对。我们有继承数据(index没问题的表),在实验室一条条的重复更新客户操作即可。这个办法涉及客户数据,取决于他们在不在乎。好在客户不care这些。

BUG

后来我们真的在实验室重现了,罪魁祸首竟然是index建在最后一个字段大量更新后就会有问题。看来测试不能放过任何一种情况啊,起码得设计三个字段然后所有可以创建index的列的组合都要设计test case。

附加产出

如何记录客户的更新:我们有一个replication功能(本人负责),正常是把更新发给另外一台机器的,但也可以暂时不发而是写入一个log文件,于是我拿到log文件就拿到了客户的更新。

把log文件中的更新写入表:我写了一个replay.py解析log文件中的每一条更新,调用数据库接口写入表中。

相关推荐

  1. 五花八门客户问题(BUG) - 数据库索引损坏

    2023-12-07 12:00:08       47 阅读
  2. 五花八门客户问题(BUG) - 重复打印

    2023-12-07 12:00:08       48 阅读
  3. 五花八门客户问题(BUG) - 用好strace

    2023-12-07 12:00:08       39 阅读
  4. 五花八门客户问题(BUG) - 用好strace2

    2023-12-07 12:00:08       42 阅读
  5. bug清单问题

    2023-12-07 12:00:08       7 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-07 12:00:08       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-07 12:00:08       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-07 12:00:08       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-07 12:00:08       20 阅读

热门阅读

  1. Metasploit的安全防御和逃逸

    2023-12-07 12:00:08       25 阅读
  2. SELinux refpolicy详解(9)

    2023-12-07 12:00:08       55 阅读
  3. Metasploit的漏洞挖掘和利用

    2023-12-07 12:00:08       26 阅读
  4. 详解ES6中的symbol

    2023-12-07 12:00:08       31 阅读
  5. Shopify 开源 WebAssembly 工具链 Ruvy

    2023-12-07 12:00:08       36 阅读
  6. Qt对象树与所有权管理

    2023-12-07 12:00:08       40 阅读
  7. 51单片机程序

    2023-12-07 12:00:08       36 阅读
  8. uniapp-获取手机型号

    2023-12-07 12:00:08       39 阅读
  9. 网页产品经理常用的ChatGPT通用提示词模板

    2023-12-07 12:00:08       48 阅读
  10. 27、数据存储&秒表(定时器扫描按键数码管)

    2023-12-07 12:00:08       36 阅读
  11. 【C++】时间time库

    2023-12-07 12:00:08       43 阅读
  12. 【力扣100】2.字母异位词分组

    2023-12-07 12:00:08       41 阅读