华为的人工智能研究部门驳斥了有关其Pangu Pro大型语言模型抄袭阿里巴巴模型的指控,这标志着中国AI生态系统的重大升级,科技巨头们开始放弃合作模式,转向激烈的公开争执。
这家电信巨头的诺亚方舟实验室在周六发表声明,否认一家名为HonestAGI的机构发布的技术分析,声称华为的Pangu Pro专家混合模型(MoE)与阿里巴巴的Qwen 2.5 14B模型之间存在超高相关性。
该分析声称,华为模型是通过“升级循环”而非从零开始训练的。
这一公开争吵展示了中国在挑战西方AI主导地位方面的团结的显著变化。
行业分析人士表示,内部争斗可能会削弱中国在应对以OpenAI、Google DeepMind和Anthropic为首的美国竞争对手时展现统一立场的能力。
HonestAGI的GitHub分析使用了所谓的“模型指纹识别”技术,声称在两个模型之间发现了0.927的相关系数,以此识别出某个模型从另一个模型衍生而来的模式。
诺亚方舟实验室回应称,其模型“并不是基于其他制造商模型的增量训练”,并且在“架构设计和技术特性的关键创新”方面有所突破。
该公司强调,Pangu Pro是第一款完全基于华为Ascend芯片的大规模模型。
Counterpoint Research的研究副总裁Neil Shah表示:“这一争端实际上反映了中国AI生态系统在成熟过程中的变化动态,以及面临的保持相关性与竞争压力,迫使创新的速度超过了传统的合作方法。”
竞争的激烈程度上升
当一名声称为华为内部人士的人发布有关公司内部系统性模型抄袭的详细指控时,争议达到高潮。
这位匿名的举报者,声称自己是一名Pangu团队成员,指控华为领导层“克隆”阿里巴巴的Qwen模型和初创公司DeepSeek的模型,并将其作为原创工作进行展示。
“他们‘克隆’了Qwen‑1.5(110B),并在外层和变化中进行包装——创造了一个伪135B的‘V2’模型,”举报者在文件中写道。“这个重新品牌的模型,代码仍命名为‘Qwen’,被推广给客户。”
这些指控尚未得到独立验证,举报者的身份仍然未知。
此争端发生之际,中国AI公司在DeepSeek于一月份发布其突破性R1模型后紧锣密鼓,后者以低成本和高性能的方式震惊了硅谷。
阿里巴巴紧随其后,匆忙推出其Qwen 2.5-Max模型,声称在多个基准测试中表现优越。
Greyhound Research的首席分析师兼首席执行官Sanchit Vir Gogia表示:“以前的国家对齐的创新驱动现在被市场导向的竞争所重塑,速度往往压倒了透明度。”
信任危机加剧
这一发展引发了对所有方面可信度的严峻质疑。
对HonestAGI方法论的技术分析显示了潜在缺陷,研究人员发现使用相同指纹识别技术的非相关模型之间也出现了类似的相关性模式。
批评者还发现,HonestAGI论文中存在对不存在的研究的虚假引用。
Shah补充道:“这对中国推动模型开放性战略来说是把双刃剑,可能导致潜在来源的最优模型。”
这一争端突显了AI行业面临的更广泛挑战,随着开发成本飙升,模型重用变得越来越普遍。
Everest Group的实践主管Vershita Srivastava表示,该行业需要更好的工具来处理此类争议。
“行业必须采用包括先进指纹识别和水印技术在内的全面框架,能够可靠地追踪模型的来源。”
这一公开争议标志着中国AI行业的转折点,之前该行业至少在表面上保持了一定的合作性。
Gogia警告称,内部争斗可能对中国以外的市场产生持久影响。
“这一事件突显了中国供应商现在在公众监督下运作,任何信任的侵蚀都可能产生持久的地缘政治和商业后果。”
这一争议可能迫使企业买家,特别是在东南亚和中东地区,重新评估与中国AI供应商的合作关系。
这一系列指控还揭示了Gogia所称的“传统知识产权框架在应用于大型语言模型时的日益不足”。
参数级的指纹识别技术虽有潜力,但仍存在科学争议与法律未决的问题。
市场分化
这一纷争突显了中国AI领军企业针对不同市场的目标,同时追逐同一奖项。
阿里巴巴的Qwen系列专注于像ChatGPT这样的消费应用,已被下载超过4000万次自开放源代码以来。
华为的Pangu模型则将目标瞄准政府、金融和制造等企业客户。
尽管早在2021年推出Pangu时就进入大型语言模型领域,华为在与对手的竞争中却迟迟未能跟上。
该公司于6月开源了其Pangu Pro MoE模型,以期通过免费开放开发者访问来促进采用。
此次争议凸显了整个行业对标准急迫的需求。
Gogia指出:“在缺乏对于衍生模型的公认定义的情况下,尤其是在基于共享语料库训练的模型中,供应商面临着不明确的合规环境。”
这种模糊性为武器化指控创造了空间,侵蚀了开源合作。
Srivastava强调,建立法律框架势在必行,他表示:“必须对衍生模型作出明确的定义,并实施细致的许可框架,以支持负责任的重用,强制执行适当的归属,并维持使用限制。”
这一争议的解决将为在日益竞争的AI生态中知识产权纠纷设定重要的先例。
随着DeepSeek等灵活运营商的成功,打破了关于构建尖端AI所需的假设,使庞大的官僚体制显得更像是一种负担,而非优势。
阿里巴巴未能立即对置评请求作出回应。
图片源于:computerworld