-交易金额扰动:对每个金额乘以(0.95+random()*0.1),保留两位小数。
-地理坐标截断:将经纬度坐标的小数部分截断到三位。
她写得很专注,时间在代码的字符间流逝。窗外的天空从深黑渐渐转为墨蓝,远处传来第一班地铁驶过轨道的声音,沉闷而有节奏。房间里越来越冷,她起身披了件外套,手指因为长时间敲击键盘而有些僵硬。
**凌晨三点四十二分**
模拟程序写完了。
路容从自己的备份里调出上周五清洗完成的数据文件——这是她习惯性保留的本地副本。她用自己编写的模拟程序对这个干净文件进行处理。
运行。
进度条在屏幕上缓慢移动。她的心跳有点快,喉咙发干。她拿起桌上那杯凉透的咖啡,喝了一口,苦涩的味道在舌尖蔓延。
程序运行完毕。
她打开处理后的文件,随机抽取几行数据,与王总监展示的污染样本进行对比。
第一行:日期字段,从“2023-10-28”变成了“2023-11-03”。匹配。
第二行:用户行为序列,从“login→browse→purchase”变成了“login→browse→purchase→login→browse”。匹配。
第三行:交易金额,从“149.99”变成了“142.49”(149.99*0.95)。匹配。
第四行:地理坐标,从“116.407526,39.904030”变成了“116.407,39.904”。匹配。
路容靠在椅背上,长长地吐出一口气。
白色的水汽在冰冷的空气里凝结成雾。她的手指在颤抖,但这次不是因为恐惧或应激障碍,而是因为兴奋。一种冰冷的、锋利的兴奋。
她找到了。完美的证据链。
**凌晨四点十五分**
路容开始整理报告。
她打开一个新的文档,标题是“关于bluen_data_1103_final.csv文件数据异常的技术分析报告”。她没有署名,没有日期,文档里只有事实。
第一页:问题描述。简述文件在清洗完成后出现数据污染的情况。
第二页:现有证据。附上王总监提供的剪辑版操作日志截图,用红框标出缺失的时间段。
第三页:完整日志发现。附上从备份系统获取的完整日志截图,重点标出:
-时间:22:47-22:50
-ip地址:10.10.10.12(王总监办公室)
-用户:admin_wang(王总监管理员账户)
-操作序列:login→unlock_file→modify_file→lock_file→logout
-检测到的临时脚本:/tmp/chetegrity_script.sh
-脚本内容摘要中的正则替换命令
第四页:技术分析。她详细解释了那个正则替换命令的含义——它不是数据完整性校验,而是数据修改。
第五页:模拟验证。她附上自己编写的模拟程序的核心代码片段,以及程序运行结果与污染样本的对比表。表格里列了十个数据字段,她的模拟结果与王总监展示的污染样本匹配度100%。
第六页:结论与建议。
结论:数据污染发生在文件清洗完成并锁定后的深夜,由管理员账户从特定ip地址发起,通过运行包含数据修改命令的脚本实现。
建议:1.核查夜间管理员操作的审计流程是否存在漏洞;2.审查脚本/tmp/chetegrity_script.sh的完整内容及创建者;3.加强数据修改权限的分级管理。
报告一共十二页,简洁、严谨、每一句话都有证据支撑。路容检查了三遍,确保没有情绪化表述,没有指控性语言,只有客观的技术分析。
保存文档。加密。复制到u盘。再备份到云端加密文件夹。
做完这一切,她看了眼时间:凌晨五点零三分。
窗外的天空已经泛出鱼肚白,深港市在晨曦中渐渐苏醒。远处的高楼轮廓变得清晰,街道上开始有早起的车辆驶过。路容关掉电脑,走到窗前,拉开窗帘。
冷空气扑面而来,她打了个寒颤,但精神异常清醒。
二十四小时期限,还剩不到四小时。
她需要睡一会儿,哪怕只是闭眼休息。但她躺到床上时,眼睛却睁着,盯着天花板上因为潮湿而留下的水渍痕迹。那些痕迹的形状像一张扭曲的脸,或者一棵枯树的枝桓。
她想起三年前,天启科技的那间会议室。李剑坐在长桌尽头,面前摊开所谓的“泄密证据”。其他高管坐在两侧,没有人看她。她的解