3月31日,论文第一作者北京致远社区写了《如何提炼一个大模型?200页pdf100+作者19个单位!北京致远、清华、唐杰等。发表这篇论文的,领头人是清华大学的唐杰教授。
第一作者单位发道歉信:启动独立调查追责。
4月13日晚,论文第一作者北京致远人工智能研究院就《大模型路线图》评审报告发布致歉信,并表示:“在此情况下,研究院立即组织内部调查,在确认部分文章存在问题后,已开始邀请第三方专家进行独立评审,并做出相关问责。”
致远研究院内部调查初步结果如下:
1.本报告是对大模型领域的一个总结,希望尽可能地涵盖国内外该领域的所有重要文献。由致远研究院牵头,负责框架设计和稿件汇总,邀请国内外100名研究人员撰写16部独立专著,每部专著均由一组作者执笔并署名,共257页。报告发布后,根据反馈意见不断修改完善,并于4月2日在arXiv网站更新至第三版。
4月2月13日,我们了解到,谷歌研究员尼古拉斯·卡里尼(Nicholas Carlini)在其个人博客上指出,该报告抄袭了他们论文的几个段落,而其他段落和句子则抄袭了其他论文。我们对此进行了逐项检查,确认第二条3.1节179个字、第八条3.1节74个字、第十二条2.3节55个字、第十四条第二节159个字、第十六条第一节146个字是其他论文的重复,应该属于抄袭。我们决定立即删除报告中的相应内容,修改后的报告将于今天提交给arXiv进行更新。目前已通知所有文章作者对所有内容进行全面审核,严格审核后将发布新版本。
致远作为这份报告的主办方,应该对每篇文章的所有内容进行严格审查,出现这样的问题难辞其咎。我们为此感到自责,特别感谢学术界和媒体的朋友们帮助我们发现问题。我们将深刻吸取教训,整改科研管理和论文发表流程,希望各界朋友监督我们的工作。
据上游新闻记者统计,自查抄袭涉及五章,共计613字。致远所在道歉信中表示,将进一步完善对学术不端行为零容忍的制度管理,通过更严格的审核机制和更明确的惩戒措施,加强对所内及其支持的科研人员的学风教育,防止类似事件再次发生。
上游新闻记者冯胜勇