Base 发布了 6 月 25 日和 6 月 26 日发生的两次主网区块生产中断的详细事后分析,分别持续约 116 分钟和 20 分钟。
据该网络称,这些事件并未损害链上资产的安全,并且在整个中断过程中用户资金仍然可以完全访问。根本原因可追溯到定序器的块构建逻辑中的缺陷。
具体来说,在事务执行失败后,系统无法正确清除历史日志状态。这导致在处理后续有效交易时出现错误的 Gas 计算,从而导致无效的状态转换区块以及 Base 2 层网络的区块生产完全停止。
在中断期间,Base 报告了区块生产完全停止、交易包含失败、内存池拥塞以及响应用户提交的 eth_sendRawTransaction 请求而出现持续错误。
部署补丁后,区块生产已恢复(PR #3806)。然而,Base 指出,定序器集群重启期间的引擎重置竞争状况干扰了恢复同步,并间接导致了 6 月 26 日较短的停机时间。
展望未来,Base计划加强协议级模糊测试和压力测试,以更早地发现异常交易路径,升级监控和操作系统,并实施优雅的恢复机制,以在类似事件中加速恢复。
