(原标题:字节诉前实习生恶意攻击模型训练,索赔800万元,律师:法院判决可能会远低于此)
图片来源:视觉中国
蓝鲸新闻11月28日讯(记者 朱俊熹)据《法治周末》11月26日报道,字节跳动将前实习生田某某诉至法院,因认为该实习生篡改代码攻击公司内部模型训练,北京市海淀区人民法院已受理此案。字节跳动请求法院,判令田某某赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。
蓝鲸新闻向字节跳动方面求证此事,截至发稿前未获官方回应。
今年10月,相关事件的微信聊天记录在多个社交平台上被广泛传播。群聊内容显示,一位字节跳动实习生利用AI模型共享平台Hugging Face的漏洞,往商业化模型中注入破坏代码,牵涉到“8000多张H100的GPU集群”、“一个多月的训练结果全是错的”。
随后字节跳动发表澄清声明,称确有商业化技术团队实习生发生严重违纪行为,但网传“涉及8000多卡、损失上千万美元”严重夸大。字节跳动指明,涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务,但并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。涉事人一直在商业化技术团队实习,并没有AI Lab实习经历。换言之,该实习生影响的是广告变现相关业务,而非AI Lab职权范围内的AI技术研发。
在11月发布的《企业纪律与职业道德委员会通报》中,字节跳动再次提及实习生破坏模型训练事件。通报称,2024年6月至7月,商业产品与技术前实习员工田某某,因对团队资源分配不满,通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务,造成资源损耗。
值得注意的是,在这两次情况通报中,字节跳动谈及对涉事实习生的处理方式并未表示将采取法律手段。该公司当时称,已在8月辞退该实习生,解除实习协议。并将其行为同步给阳光诚信联盟及企业反舞弊联盟,交由其就读学校处理。
对于起诉这一决定,《法治周末》援引字节跳动内部人士说法称,由于田某某为在读博士,公司将其辞退后首先交由校方处理。但在事件处理期间,田某某多次对外否认,称攻击模型训练任务的不是自己,而是别的实习生,甚至报警称遭到造谣。考虑到田某某完全没有意识到错误,且涉事行为已触犯公司安全红线,公司最终决定向法院起诉,以表明公司严肃态度、杜绝类似事件再次发生。
江苏剑桥颐华律师事务所律师、专利代理师杨卫薪对蓝鲸新闻解释称,涉事实习生的行为可能构成《刑法》第286条“破坏计算机信息系统罪”,但字节跳动目前没有做出相应的刑事控告,而是提起民事诉讼。
杨卫薪律师表示,字节跳动主张的合理支出2万元为提起本案诉讼的相关费用,侵权损失800万元则可能包含设备所浪费算力和电力成本、数据清洗和恢复的损失、后续潜在商业化项目的损失、公司声誉的损失等方面。此外,这一金额还可能考虑到社会公示的影响,如强调其大模型项目的价值、威慑本领域从业者等。“这个金额在大模型领域不算高,但考虑到被告是一个在校实习生,最终法院判决可能会远低于这个金额。”他称。
杨卫薪律师同时强调,因为该实习生行为已被同步给行业联盟和所在学校,“所以后续不管是实习和就业都会很难,行业顶尖的公司基本上对他已经关上了大门。”
涉事实习生田某某职业社交平台上公开资料显示,其现于北京大学攻读计算机科学方向硕士研究生,本科毕业于北京航空航天大学的软件工程专业。田某某自2021年9月起开始在字节跳动实习,此前还曾作为研究实习生加入过商汤科技。
田某某导师、北大信息科学技术学院教授王立威曾多次带领课题组,联合字节跳动开展研究。今年4月,字节跳动AI Lab和王立威团队联合开发出一种新的图像生成技术VAR,称“首次实现了自回归模型在图像生成任务中超越DiT”,而田某某以一作的身份出现在该项目名单中。