点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:硅谷手记|AI抄袭背后的硅谷“不光彩文化”
首页> 国际频道> 国际观察 > 正文

硅谷手记|AI抄袭背后的硅谷“不光彩文化”

来源:新华网2024-06-05 10:47

  新华社旧金山6月3日电 新华社记者吴晓凌 黄堃

  “‘作假,直至成功’,这是硅谷不光彩的文化。”美国斯坦福大学人工智能实验室主任克里斯托弗·曼宁3日就该校某些研究人员抄袭中国清华大学等机构成果的行为这样评论说。他在社交媒体上还指出,该研究团队应该深刻认识自己的错误。

  图为2024年5月30日,在瑞士日内瓦举行的2024年“人工智能造福人类全球峰会” 上,参会者和中国移动开发的AI机器人下棋。(新华社记者连漪摄)

  5月29日,斯坦福大学一个研究团队发布名为Llama3-V的大模型,声称只要500美元的预训练成本,就能用它获得比肩GPT-4V等著名大模型的效果。这一消息在社交媒体和人工智能学术界被广泛转发。

  但业内人士很快发现,该大模型涉嫌抄袭清华大学等机构发布的 MiniCPM-Llama3-V 2.5大模型。它们都是基于开源的Llama3大模型,但清华团队进行了独特的训练,包括利用“清华简”(清华大学收藏的一批战国竹简)训练它识别古代中国文字的能力。测试显示,斯坦福大学这个团队发布的大模型居然也能识别“清华简”。

  “已经比较确信,斯坦福这个团队‘套壳’了我们的大模型研究成果。”清华大学计算机系长聘副教授刘知远对新华社记者说。

  “我们从‘清华简’逐字扫描并标注的数据集从未公开,而Llama3-V展现出了一模一样的识别‘清华简’能力,连做错的样例都一样。”刘知远是清华这个大模型团队成员。他介绍说,在质疑声发酵后,对方已经在网上删除了此前发布的数据库和宣传文章,“从证据和对方反应来看,抄袭性质已比较确定”。

  曼宁发声批评后,斯坦福该团队的两名成员夏尔马和加格也在社交媒体上正式道歉,并表示要完全撤下Llama3-V模型。

  在当前的人工智能热潮中,这个事件引发广泛关注。有观点认为美国的人工智能全面领先,但该事件说明,虽然美国科技仍然整体领先,但远非全能,也不应迷信美国单方宣布的“重大成果”。

  斯坦福大学所处的硅谷地区被认为是美国科技创新的重镇,既孕育了许多先进技术,也有“作假,直至成功”等被津津乐道的负面文化。

  比如,从斯坦福大学退学创业的伊丽莎白·霍姆斯曾吹嘘有颠覆性检测技术可“抽指血查癌症”,一度成为全球闻名的科技创业明星,但后来被发现造假并因欺诈投资者罪名获刑。放眼整个美国科技领域,近年来波音客机事故频发等暴露了更多、更大的问题。

  在人工智能领域,前段时间还有个“著名”事件,在用中文问谷歌人工智能模型“双子座”Pro版(Gemini Pro)它是谁时,它会回答自己是“文心一言”,这个问题很快被谷歌消除。业界人士认为,其原因可能是谷歌在训练大模型的中文时“参考”了中国百度公司的大模型“文心一言”相关数据。

  可见,中国科技近年来快速发展,一些独特的优势越来越引人注目,被美国同行“参考”甚至抄袭。

  “中国人工智能研究的国际影响力越来越大”,刘知远说,“这次抄袭事件也从侧面反映了我们的创新成果正在受到国际关注”。他说,从横向来看,中国研究与国际顶尖成果仍有显著差距,但从纵向来看,中国已快速成长为人工智能科技创新的重要推动者。

[ 责编:丁玉冰 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 重庆永川:积极推进灾后恢复

  • 扩围提质,你的城市“体检”了吗

独家策划

推荐阅读
中国卫星导航定位协会近日发布的《2026中国北斗时空产业发展白皮书》显示,2025年,北斗时空产业总产值达到13323亿元。北斗核心产品持续迭代升级,芯片、模组等基础产品小型化、低功耗、高精度水平不断提升,国内主流手机北斗定位精度持续优化,为产业规模化应用奠定了坚实的技术基础。
2026-05-27 09:36
5月27日0时16分,我国在文昌航天发射场使用长征七号改运载火箭,成功将通信技术试验卫星二十四号发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。
2026-05-27 09:26
“十五五”规划纲要提出,投资于物和投资于人紧密结合。
2026-05-27 03:00
大屏幕上的数字快速跳动。十几轮激烈竞逐后,最终定格在212.4万元,成交!这是日前记者在湖北碳排放权交易中心电子竞价大厅看到的一幕。
2026-05-27 03:10
检测AI率,目的是维护学术研究的严肃性公平性,督促学生遵守学术规范、产出原创成果。然而,在现实操作中,一系列困扰学生乃至老师、学校的问题接连显露。
2026-05-27 02:50
位于北京大兴区的长子营湿地公园,草木葱茏,水面澄澈,鸟鸣声清脆悦耳,勾勒出一幅生机盎然的生态画卷。
2026-05-26 09:24
我国虽然核电铀燃料对外依存度高,但钍资源储量丰富,目前探明钍储量位居世界第二。以钍作核燃料不仅符合我国资源禀赋,甚至可能改变未来全球能源格局。
2026-05-26 09:18
我国已累计发布1750项食品安全标准,涉及2万多个指标,覆盖340多种食品类别,持续完善科学严谨、好用管用的食品安全标准体系。
2026-05-26 09:11
入汛以来,全国平均降水量达110.1毫米,较常年同期偏多18.6%。从空间分布来看,我国南北方均出现降水量较常年同期明显偏多区域。
2026-05-26 09:11
5月30日将迎来第十个全国科技工作者日,中国科协将联合相关部委集中表彰第四届全国创新争先奖获奖团队和个人,发布2026年“最美科技工作者”年度人物。
2026-05-26 09:09
到今年5月21日,“澳门科学一号”(下称“澳科一号”)卫星成功发射三周年。卫星上天不是终点,3年来,“澳科一号”团队研发未曾停歇,在相关科学与技术领域取得多项重大突破。
2026-05-25 10:19
近来,词元(Token)一词持续刷屏科技圈、经济圈,而让它“破圈”的,是一组极具冲击力的数据——今年3月,我国日均词元调用量突破140万亿。从2024年初的1000亿,到2025年底的100万亿,再到突破140万亿,两年间增长超千倍。
2026-05-25 10:16
《中国生物物种名录2026版》封面。与去年的名录相比,2026版名录中,动物界新增3380个物种和477个种下单元;植物界新增431个物种,减少2个种下单元;真菌界新增3114个物种,减少1246个种下单元。
2026-05-25 10:02
平面单位距离问题探讨的是,在无限大的纸上,最多可以画出多少条等长的线段来连接纸上的点。Erdos证明了越来越大的网格如何能够包含大量距离相等的点,并且这个网格会以比点数增长略快的速度无限延伸。
2026-05-25 10:02
“嘀——”一声轻响,广东深圳北站中心公园一只橙白相间的“铁柜”柜顶绿灯亮起。”  胡流华告诉记者,2023年他刚接触低空经济时,无人机配送还只是个概念。胡流华指着监控大屏细细讲解:“瞧,每个光点就是一架无人机。
2026-05-25 10:00
今年秋季,华为将发布新的麒麟手机芯片,完整采用逻辑折叠技术,大幅提升相关性能。
2026-05-25 09:38
5月22日上午,在2026年文化强国建设高峰论坛“人工智能与媒体变革”分论坛上,中宣部副部长、国务院新闻办公室主任莫高义发表主旨演讲。
2026-05-22 13:22
中国科学技术大学何俊峰教授研究组与南方科技大学薛其坤院士、陈卓昱副教授研究组合作,在新型镍基高温超导的机理研究中取得重大突破。
2026-05-22 10:19
近年来,生产环节的技术革新,推动缝纫线产业转型向着上游拓展。
2026-05-22 10:19
在系列政策牵引下,学科专业动态调整正日趋常态化、精细化与特色化。
2026-05-22 10:14
加载更多