正文内容 评论(0)
近日,腾讯云的客户北京清博数控科技有限公司所属“前沿数控”平台一块操作系统云盘发生故障,导致文件系统元数据损坏。
腾讯方面提出了总金额136,469元的“赔偿+补偿”解决方案,前沿数控则索赔11,016,000元,被腾讯认为过高,双方未达成一致。
现在,腾讯云发布了一份关于客户“前沿数控”数据完整性受损的技术复盘,对客户业务所受影响表示诚挚歉意的同时,详细解释了此次故障发生的根源,以及将采取的措施。
腾讯云经过复盘发现,故障缘起于因磁盘静默错误导致的单副本数据错误,再加上数据迁移过程中的两次不规范的操作,导致云盘的三副本安全机制失效,并最终导致客户数据完整性受损。
当天上午11:57,腾讯云运维人员收到仓库I空间使用率过高告警,准备发起搬迁扩容。
14:05,运维人员从仓库I选择了一批云盘搬迁至新仓库II,为了加速搬迁,手动关闭了迁移过程中的数据校验。
20:27,搬迁完成之后,运维人员将客户的云盘访问切至仓库II,同时为了释放空间,对仓库I中的源数据发起了回收操作。
20:30,监控发现仓库II部分云盘出现IO异常。
腾讯表示,数据搬迁过程中的违规操作主要如下两点:
第一是正常数据搬迁流程默认开启数据校验,开启之后可以有效发现并规避源端数据异常,保障搬迁数据正确性,但是运维人员为了加速完成搬迁任务,违规关闭了数据校验;
第二是正常数据搬迁完成之后,源仓库数据应保留24小时,用于搬迁异常情况下的数据恢复,但是运维人员为了尽快降低仓库使用率,违规对源仓库进行了数据回收。
因这些错误操作的连续影响,导致该客户数据完整性受损,给客户的正常业务运行造成影响,腾讯云再次表示最诚恳的歉意。
改进措施方面,腾讯云提出了两点:
首先,将全面审视所有的数据流程,涉及数据安全的流程自动化闭环,进一步提升常规运维自动化和流程化,降低人工干预,同时把全流程的数据安全校验作为系统的常开功能,不允许被关闭。
其次,针对物理硬盘静默数据错误,在当前用户访问路径数据校验自愈的基础上,优化现有巡检机制,通过优先巡检主副本数据块、跳过近期用户访问过的正确数据块等方法,加速发现该类错误,进行数据修复。
另外,腾讯云建议用户开启免费的快照功能,对重要数据进行定期备份。
对于索赔和赔偿问题,腾讯云暂未披露更多进展。
- 热门文章
- 换一波
- 127元追加9倍投注彩票中1.11亿 中奖者:我下班顺路买的
- 2超频狂飙3.3GHz!RTX 5070 Ti首发评测:提升30% 追平4080
- 3弹丸小国贡献NV 28%收入 但只收到1%芯片!美国怀疑中国
- 4一图看懂iPhone 16e和iPhone 16该买谁:差价1500差在哪了
- 5顶配16999元!最强全能平板笔记本预约:首发独占AMD最强U
- 6真的干掉了桌面RTX 4060!AMD史上最强集显首测
- 7刘强东成给外卖骑手上社保第一人:公司克扣五险一金是耻辱
- 8地球将变回终极盘古大陆!超级计算机算出人类灭绝时间
- 9想买内存、SSD的抓紧了!很快就会涨价
- 10小米智能音箱Pro终于来了!老款发布5年价格依然坚挺
- 好物推荐
- 换一波
-
-
GB/T 19266标准:五稻田五常大米10斤39.9元(70元大额券)
2025-02-17 3 -
安比斯短袖款睡衣套装到手59元:吸湿透气 男女款都有
2025-02-11 0
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...