点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:硅谷手记|AI抄袭背后的硅谷“不光彩文化”
首页> 国际频道> 国际观察 > 正文

硅谷手记|AI抄袭背后的硅谷“不光彩文化”

来源:新华网2024-06-05 10:47

  新华社旧金山6月3日电 新华社记者吴晓凌 黄堃

  “‘作假,直至成功’,这是硅谷不光彩的文化。”美国斯坦福大学人工智能实验室主任克里斯托弗·曼宁3日就该校某些研究人员抄袭中国清华大学等机构成果的行为这样评论说。他在社交媒体上还指出,该研究团队应该深刻认识自己的错误。

  图为2024年5月30日,在瑞士日内瓦举行的2024年“人工智能造福人类全球峰会” 上,参会者和中国移动开发的AI机器人下棋。(新华社记者连漪摄)

  5月29日,斯坦福大学一个研究团队发布名为Llama3-V的大模型,声称只要500美元的预训练成本,就能用它获得比肩GPT-4V等著名大模型的效果。这一消息在社交媒体和人工智能学术界被广泛转发。

  但业内人士很快发现,该大模型涉嫌抄袭清华大学等机构发布的 MiniCPM-Llama3-V 2.5大模型。它们都是基于开源的Llama3大模型,但清华团队进行了独特的训练,包括利用“清华简”(清华大学收藏的一批战国竹简)训练它识别古代中国文字的能力。测试显示,斯坦福大学这个团队发布的大模型居然也能识别“清华简”。

  “已经比较确信,斯坦福这个团队‘套壳’了我们的大模型研究成果。”清华大学计算机系长聘副教授刘知远对新华社记者说。

  “我们从‘清华简’逐字扫描并标注的数据集从未公开,而Llama3-V展现出了一模一样的识别‘清华简’能力,连做错的样例都一样。”刘知远是清华这个大模型团队成员。他介绍说,在质疑声发酵后,对方已经在网上删除了此前发布的数据库和宣传文章,“从证据和对方反应来看,抄袭性质已比较确定”。

  曼宁发声批评后,斯坦福该团队的两名成员夏尔马和加格也在社交媒体上正式道歉,并表示要完全撤下Llama3-V模型。

  在当前的人工智能热潮中,这个事件引发广泛关注。有观点认为美国的人工智能全面领先,但该事件说明,虽然美国科技仍然整体领先,但远非全能,也不应迷信美国单方宣布的“重大成果”。

  斯坦福大学所处的硅谷地区被认为是美国科技创新的重镇,既孕育了许多先进技术,也有“作假,直至成功”等被津津乐道的负面文化。

  比如,从斯坦福大学退学创业的伊丽莎白·霍姆斯曾吹嘘有颠覆性检测技术可“抽指血查癌症”,一度成为全球闻名的科技创业明星,但后来被发现造假并因欺诈投资者罪名获刑。放眼整个美国科技领域,近年来波音客机事故频发等暴露了更多、更大的问题。

  在人工智能领域,前段时间还有个“著名”事件,在用中文问谷歌人工智能模型“双子座”Pro版(Gemini Pro)它是谁时,它会回答自己是“文心一言”,这个问题很快被谷歌消除。业界人士认为,其原因可能是谷歌在训练大模型的中文时“参考”了中国百度公司的大模型“文心一言”相关数据。

  可见,中国科技近年来快速发展,一些独特的优势越来越引人注目,被美国同行“参考”甚至抄袭。

  “中国人工智能研究的国际影响力越来越大”,刘知远说,“这次抄袭事件也从侧面反映了我们的创新成果正在受到国际关注”。他说,从横向来看,中国研究与国际顶尖成果仍有显著差距,但从纵向来看,中国已快速成长为人工智能科技创新的重要推动者。

[ 责编:丁玉冰 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 第11届上海国际机床展开幕

  • 贺兰山下酿酒葡萄展藤

独家策划

推荐阅读
记者了解到,自20世纪60年代推广杂交玉米种以来,我国玉米的单产提高了约2.7倍,其中51%的增益都来自优良杂交种的选育与应用。进一步研究发现,在现代杂交育种过程中,玉米的基因有害变异被不断清除或互补,并且,杂交种中有害等位基因被抑制表达的比例与其产量和育成年代同步增长。
2026-03-24 09:29
2023年,国务院部署开展专利转化运用专项行动(以下简称“专项行动”)。教育部科学技术与信息化司司长周大旺表示,教育部着力畅通科技成果转化的链条,加速把高校丰富的专利转变为产业发展的红利。
2026-03-24 09:28
走进内蒙古博物院的有机质文物修复室,时间似乎放慢了脚步,空气中透着静谧,只有工具偶尔轻碰的细微声响。”  无机质文物修复室里,文物修复师季园园展示了另一种“手术”场景。
2026-03-24 09:28
柳申滨最初以针刺治疗皮肤炎症及穴位敏化机制为切入点,试图探寻针刺调控皮肤靶器官的效应规律。”  通过和临床医生交流,柳申滨了解到,在压力、焦虑等心理应激状态下,特应性皮炎患者的皮肤炎症会显著加重。
2026-03-24 09:28
全球最大人工智能(AI)模型API聚合平台OpenRouter最新数据显示,3月16日至3月22日,全球AI大模型总调用量为20.4万亿Token,环比增长20.7%。”
2026-03-24 09:28
杂交稻的大面积推广显著提升了水稻产量,但其生产长期依赖程序复杂、成本高昂且需年年重复的杂交制种过程。
2026-03-23 09:40
近日,澳大利亚一位机器学习领域科技企业家,通过人工智能大模型自行设计肿瘤疫苗,救治自家患癌宠物犬的故事广受关注。
2026-03-23 09:39
记者从中国石化获悉,我国首套全链条国产化溶液法聚烯烃弹性体工业化装置在天津进入试运行,相关生产技术取得原创性突破,将有效缓解我国光伏等战略性新兴产业对该材料的进口依赖。
2026-03-23 09:33
中国气象局日前发布了2025年度“中国十大气象科技进展”。3年来,评选工作有效推动气象科技成果涌现,助力资源共建共享,大力弘扬科学家精神,促进气象教育科技人才一体推进,持续激发科技能力和人才活力。
2026-03-23 09:32
3月22日是第三十四个“世界水日”,第三十九个“中国水周”同步开启。以非常规水利用为例,我国近年来在农业节水增效、工业节水减排、城镇节水降损等领域取得显著成效。
2026-03-23 09:28
“遥感是人们在距离和感官上的延伸,是认知地球、探查资源、监测环境的重要技术手段。本次活动由全国科学道德和学风建设宣讲教育领导小组主办,中国科协科学技术传播中心、湖南省科学技术协会、中南大学、光明网联合承办。
2026-03-20 09:42
每年春季,花粉过敏会给不少人带来困扰。该检测试剂盒采用微量血清特异性洋白蜡花粉过敏原IgE定量检测,用以辅助诊断,成为目前用于花粉症精准诊断的主要方法。
2026-03-20 09:39
3月18日,记者从新疆电力交易中心有限公司获悉,自2010年启动“疆电外送”以来,新疆累计外送新能源电量已达3043.6亿千瓦时,约占总外送电量的三成。
2026-03-20 09:39
吕小康:从现实语义上看,情感AI既指能够识别、理解、模拟和响应人类情感的人工智能技术,也指基于这类技术设计和开发的情感智能体。吕小康:为引导青年群体健康使用情感AI,还需要进一步加强协同治理,培育积极有益的陪伴型人工智能应用环境。
2026-03-20 09:36
据3月17日农情调度,全国早稻育秧已三成半,同比略快。据介绍,北方冬小麦当前的田管重点是继续促进弱苗转化升级,抓好病虫防控,防范春旱、倒春寒、干热风等灾害。“近日国家启动投放1000余万吨氮磷及复合肥储备,作为国家化肥储备重要承储主体,全国供销合作社系统农资企业积极按要求将储备化肥及时集中投放市场,稳定市场价格。
2026-03-20 09:36
小时候我们背过一句话:万物由原子组成。这一路走来,从质子的异常,到夸克模型的提出,再到量子色动力学和标准模型的建立,人类把物质拆解到了17种基本粒子的层级。曾获国家六部委回国人员成就奖、德国洪堡研究奖、吴有训物理奖、中国科学院优秀研究生导师奖。
2026-03-20 09:35
吴晓民(右一)团队在野外工作。藏羚羊曾广泛分布于高原全境,其漫长的演化史与复杂的种群波动,始终是全球动物保护与演化生物学领域关注的焦点。研究团队还通过生态位模拟,锁定了藏羚羊的生命庇护所——青藏高原北部的可可西里、羌塘高原等区域。
2026-03-19 10:11
通知明确,各城市群应优先选择具备条件的燃料电池汽车、绿色氨醇、氢基化工原料替代、氢冶金以及掺氢燃烧等应用场景开展试点,积极探索氢能创新应用场景,形成“1个燃料电池汽车通用场景+N个工业领域应用场景+X个创新应用场景”的氢能综合应用生态。通知要求,氢能综合应用试点以城市群为主体开展申报,城市群应立足自身资源条件,因地制宜、宜氢则氢,避免各场景一拥而上、低水平重复建设。
2026-03-19 10:10
2026中关村论坛年会将于3月25日至29日在北京举办。
2026-03-19 10:04
日前发布的《中国地热产业发展报告2025》显示,我国地热产业多元化利用格局正在形成。在地热供暖发展带动下,我国地热产业规模长期稳居世界第一。
2026-03-19 10:00
加载更多