前几天提到,因为池老师的测试,我们发生了一次事故(当然也是发现了一个漏洞),之后上了个新的安全功能:消息推送需要经过更高等级的安全检查后才可以执行。

这里的“安全检查”,是某家合作伙伴提供的服务,判断内容是否存在安全风险。我们基于这个判断做推送。昨天晚上,突然有大量重复的推送,一条消息往往推送 5-8 次,大量用户向我们反馈 Bug。原因也不复杂:

  1. 我们的这个安全功能是紧急上线的,做得比较粗糙,没有去重。基于一个假设是:合作伙伴对每个内容只会做一次判断——最多也就是还有一次复核,少量复核不符的会发一次修正;
  2. 昨晚服务商突然出现异常,对每个内容都给我们快速返回了多条结果;
  3. 于是我们的动态、消息推送就乱套了。