2021年最后一天的问题总结

很不幸,22021年的最后一天过的不顺利,缘自30日我的一个疏忽,进而引发了31日的故障,最终,31日整个上午我都在紧张地处理问题。

最近更新了一个功能的抽数任务,移除了任务中某个输出表的一个字段,这个字段在后续的关联任务中有用到,那么关联任务也要同步调整以取到这个字段。这就要求两个任务要同步更新了,否则后续的关联任务会找不到字段报错失败。

此前意识到此处是个风险点,特意提醒自己注意。

按计划要求31日更新上线,30日上午提前更新几个用户跑了任务发现一切正常,下午想到前置任务需要重新执行一次全量耗时较多,不如把剩余用户的前置任务更新并执行掉,这样31日就很轻松了,我确实这样做了,但是没有对其中哪个用户执行任务做验证,至此祸根已埋下,果然31日早晨这些客户的后续关联任务全失败了。

为此,总结本次经验教训:
端正态度,任务清单/执行步骤一定要写,带上风险点,不可偷懒,好记性不如烂笔头;

严格按照执行步骤操作,不能突发奇想、投机取巧,这往往容易忽视风险;

再小的改动,也要及时手动执行任务,尽早验证,留足回旋余地,最大限度降低风险。

发表评论

评论(2)

  1. S via Chrome 96

    欲速则不达

    1. 秩秩斯干

      @S 确实啊