图片源于:https://time.com/7204164/china-ai-advances-chips/
2017年,北京公布了一项雄心勃勃的路线图,旨在到2030年实现人工智能(AI)发展的全球主导地位。
到2020年,该计划要求在人工智能领域取得“标志性进展”,以展示其成就。
然而,在2022年底,OpenAI发布的ChatGPT让全球惊愕,并使中国感到措手不及。
当时,许多领先的中国科技公司仍在经历为期18个月的政府整顿,这次整顿使中国科技部门约损失了1万亿美元。
在中国一些人工智能聊天机器人获得政府批准公开发布之前,还几乎耗时一年。
有人质疑,中国的审查政策是否会阻碍该国的人工智能雄心。
与此同时,拜登政府发布的出口管制措施,正好在ChatGPT首次亮相的一个月前,旨在切断中国与用于训练大型AI模型的先进半导体的联系。
没有尖端芯片,北京实现2030年人工智能霸主目标的希望显得越来越渺茫。
但快进到今天,一系列令人印象深刻的中国产品发布暗示, 美国的人工智能领先地位正在缩小。
在11月,阿里巴巴和中国人工智能开发公司DeepSeek发布的推理模型在某些指标上与OpenAI的o1-preview相媲美。
同月,中国视频游戏巨头腾讯推出了Hunyuan-Large,这是一种开源模型,公司的测试发现其在多个基准测试中超越了美国开发的顶级开源模型。
在2024年最后几天,DeepSeek发布了DeepSeek-v3,该模型在一个受欢迎的在线排行榜上排名最高,并且在与OpenAI和Anthropic的顶级封闭系统进行比较时表现不俗。
在DeepSeek-v3发布之前,趋势已经引起了Eric Schmidt的关注,Schmidt是谷歌的前首席执行官,也是美国人工智能政策中最有影响力的声音之一。
2024年5月,Schmidt自信地表示,美国在人工智能领域的领先地位保持在两到三年,“在我看来,这是一个漫长的时代。”
然而到11月,在哈佛肯尼迪政府学院的一次演讲中,Schmidt改口称,中国正在缩小差距,以阿里巴巴和腾讯的进展为证据。他说:“这让我感到震惊,我原以为我们对芯片的限制会让他们落后。”
人工智能的领导地位不仅是国家的声望问题,还可能影响全球力量的平衡。
如果人工智能代理能够自动化劳动力中的大部分工作,他们可能会为国家经济提供助力。
未来的系统,能够指挥武器或黑客攻击对手,可能会提供决定性的军事优势。
在两大超级大国之间被迫选择中国产或美国产的人工智能系统的国家,可能会使用人工智能作为全球影响力的强大工具。
中国的迅速进展使得关于美国的半导体出口管制是否足以维持其优势的问题愈发复杂。
建立更强大的人工智能需要三种基本成分:数据、创新算法和原始计算能力或计算能力。
大型语言模型(如GPT-4o)的训练数据通常是从互联网中提取的,这意味着全球开发者都可以获得。
同样,算法或改善人工智能系统的新思路,可以跨境轻松传播,因为新技术往往在学术论文中分享。
即使不分享,中国也拥有丰富的人工智能人才,产生的顶尖人工智能研究人员数量超过美国。
相比之下,先进芯片的制造非常困难,与算法或数据不同,芯片是一种实物商品,可以被阻止在边境。
先进半导体的供应链由美国及其盟友主导。
美国公司Nvidia和AMD在用于人工智能的数据中心图形处理器(GPU)上形成了有效的双寡头垄断。
它们的设计如此复杂,晶体管的尺寸仅在单个纳米级别,只有台湾的台积电能够制造这些顶尖的芯片。
为了实现这一点,台积电依赖于只有荷兰ASML能制造的数百万美元的机器。
美国试图利用这一点以取得优势。
在2022年,拜登政府引入了出口管制措施,即禁止向中国销售最先进的芯片。
这一行动是在特朗普政府的系列措施后进行的,旨在限制中国获取芯片制造技术。
这些努力不仅限制了先进芯片流入中国的通道,还妨碍了中国国内的芯片产业发展。
中国的芯片“落后多年”,美国商务部部长吉娜·雷蒙多在4月对《60分钟》节目表示。
然而,2022年的出口管制在宣布之前就遇到了第一个障碍,因为中国开发商据称已经提前囤积了即将被限制的芯片。
DeepSeek是中国的一家开发商,曾在出口管制措施推出前一年,组建了一个包含10,000块即将被禁的Nvidia A100 GPU的集群。
走私可能也影响了出口管制的有效性。
10月份,《路透社》报道称,受限的台积电芯片在中国公司华为生产的产品上被发现。
中国公司据说也通过在国外的空壳公司获取受限芯片。
其他公司通过从离岸云提供商租用GPU的方式规避了出口管制。
12月,《华尔街日报》报道称,美国准备采取新措施,以限制中国通过其他国家获取芯片的能力。
尽管美国的出口管制限制了中国获得最尖端的半导体,但仍允许销售较低性能的芯片。
决定哪些芯片应该被允许,哪些芯片不应被允许,也成了一项具有挑战性的任务。
在2022年,Nvidia调整了其旗舰芯片的设计,创造了一种适合中国市场的版本,该版本在出口管制的阈值范围内。
该芯片在人工智能开发中仍然有用,这促使美国在2023年10月收紧限制。
“我们有一年的时间让他们获得几乎一样好的芯片,”RAND公司技术和安全政策中心的人工智能与计算负责人Lennart Heim说。
他表示,这一漏洞,加上新芯片在人工智能开发者基础设施中普及所需的时间,是我们还没有看到出口管制对中国人工智能发展产生全面影响的原因。
目前尚不清楚现行阈值是否达到合适的平衡。
11月,腾讯发布了一种名为Hunyuan-Large的语言模型,该模型在几个基准测试中超越了Meta的最强版Llama 3.1。
虽然基准测试并非比较人工智能模型整体智能的完美衡量标准,但Hunyuan-Large的表现令人印象深刻,因为它是使用较低性能的、不受限制的Nvidia H20 GPU训练的,根据柏克利风险与安全实验室的研究表明。
“他们显然在利用硬件方面的能力上比美国公司更好,因为他们的软件更优越,”这项研究的作者、同时也是国防创新单位顾问的Ritwik Gupta说。
被认为是最强开源模型的DeepSeek-v3,尽管只用相对较少的计算能力进行训练。
尽管关于特朗普当选后他将如何看待人工智能政策的前景存在重大不确定性,但几位专家在11月告诉《时代》杂志,他们预计出口管制将保持甚至进一步扩大。
在新限制于12月出台之前,中国公司再次囤积即将被封锁的芯片。
“整个策略需要重新考虑,”Gupta说。“别再和这些硬件芯片玩‘打地鼠’游戏。”
他建议,美国应该集中精力防止军事人工智能系统的发展,因为这些系统通常需要的计算能力较少。
尽管他承认,针对芯片供应链其他部分(如ASML制造芯片的机器)的出口管制在减缓中国国内芯片产业方面发挥了关键作用。
Heim表示,在过去的一年中,美国的领先地位确实缩小,尽管他指出,虽然中国可能现在与美国的最佳开源模型相匹配,但这些模型与顶级封闭模型仍然落后大约一年。
他补充说,差距的缩小并不一定意味着出口管制措施失败。
“我们应该摆脱出口管制有效与否的二元对立,”他说,补充说中国可能需要更长时间才能感受到这些措施的影响。
过去十年见证了训练人工智能模型所需的计算能力的迅速增加。
例如,2023年发布的OpenAI GPT-4被估计使用的训练计算量比2019年发布的GPT-2多了大约10,000倍。
有迹象表明,这一趋势将继续,因为美国公司如X和亚马逊正在构建拥有数十万GPU的大型超级计算机,远远超过今天领先的人工智能模型所需的计算能力。
如果这一趋势得以继续,Heim预测,美国的芯片出口限制将阻碍中国在人工智能发展方面的跟进。
“出口管制主要影响你获得的数量,”Heim说,他补充道,即使某些受限芯片找到了通往中国开发者的途径,减少数量会让训练和以大规模部署模型变得更加困难。
“我确实期待出口管制会随着时间的推移变得越发严格,只要计算能力仍然如此重要,”他说。
在华盛顿,目前“对与中国谈判的犹豫感很强,”卡内基国际和平基金会技术与国际事务项目的访问学者Scott Singer说。
隐含的推理是:‘[如果美国处于领导地位的话],我们为什么要分享任何东西?’
但他指出,与中国在人工智能方面进行谈判有迫切的理由。
“即使中国不必领先,它也可能成为巨大风险的源头,”他说,补充说,尽管受到计算能力限制,其持续进展意味着它可能在未来产生具有危险能力的人工智能。“如果中国的进步非常接近,那么考虑你希望与他们进行哪些对话以确保双方的系统保持安全,”Singer说。