No menu items!

    WSJ:美制裁加速中国研发不依赖最新芯片的AI技术

    美国对中国实施芯片制裁措施,正促使中国科技业者加速研发不仰赖最新美国芯片的先进人工智慧(AI)技术。图为示意图。路透

    美国对中国实施芯片制裁措施,正促使中国科技业者加速研发不仰赖最新美国芯片的先进人工智慧(AI)技术。

    华尔街日报检视研究论文并採访员工后发现,中国业者正在研究利用更少、威力没那么强大的半导体,就能达成最先进AI性能的技术,同时研究如何组合不同类型的芯片,避免只仰赖单一类型芯片。

    包括华为、百度与阿里巴巴,都是想办法从现有电脑芯片发掘更多用处的业者。

    研究人员和分析师表示,利用这些变通的方法来追上美国AI领导业者,实际上仍是一大挑战,但一些实验显示出,若取得成功,这些研究可让中国科技业者同时挺过美国的制裁措施,并且在面对未来的限制措施时,自身将更具韧性。

    华为和百度不愿置评,阿里巴巴则没有回覆置评请求。

    随著要将ChatGPT这类模型商业化的竞赛升温,全球企业需要更多威力强大的芯片,同时还要想办法竭力善用这些芯片,以便压低这些飙高中的AI研发成本。

    对陆企来说,这是个极关键的问题,因为美国的制裁措施让他们没办法取得像是辉达(Nvidia)制的最先进芯片,此外,员工、AI研究人员和产业分析师表示,陆企已迅速消耗掉现有的美国芯片来打造与ChatGPT相类似的软体。

    脸书母公司Meta Platforms的AI基础架构与大型语言模型研究人员张苏珊(SusanZhang,音译)表示:“可从字裡行间看出他们试图寻找世界上任何一种运算方式来弥补先进硬体的不足。”

    北京最高决策机构上月表示,中国应鼓励AI研发创新;美国拜登政府在去年10月全面限制向中国供应芯片后,已明示未来可能进一步实施限制措施。

    陆企现在无法取得目前最受业界欢迎的AI开发芯片A100芯片,以及3月推出的新一代版本、能提供更多算力的H100芯片。

    不过,辉达为中国市场创造出降级版的芯片,分别是A800与H800,两款修改后的芯片降低芯片与芯片之间的沟通能力。这些产品可为开发小型AI模型提供有效的替代方法,这类小型AI模型就像是驱动短影片App抖音(TikTok)的推荐演算法所使用的模型。不过,这类芯片无法用于发展大型AI模型,因为大型AI模型需要数百或数千个芯片共同协力运作,举例来说,瑞银分析师估计训练像ChatGPT的AI模型,需要5,000至10,000个A100芯片来进行训练。

    与中国政府与关的半导体产业协会的调查显示,在中国境内可用于训练大型AI模型的A100芯片大约有4万个至5万个,显示供应吃紧。知情人士说,在美国制裁前就已囤积A100芯片的阿里巴巴与百度等业者已严格限制内部使用外国的先进芯片,把这些芯片保留用于需要强力运算的任务。

    根据开源研究论文和知情人士透露,百度近年来一直寻求将海光信息的DCU、华为的AI训练芯片Ascend以及自家的崑崙芯片等国产芯片整合到AI研发中。一些知情人士说,许多陆产芯片在训练大规模模型时仍然不可靠,因为容易瘫痪。

    另据经营AI基础设施公司HPC-AITech的新加坡大学教授尤洋的说法,许多陆企正试图把三或四种没那么先进的芯片组合在一起,来模拟辉达最先进处理器的性能。

    例如在4月,腾讯就公布一套新的运算群,即使用辉达H800芯片进行大型AI模型训练的一组连结芯片。

    尤洋说,这种做法可能甚耗成本,例如一家美企若需要1,000个H100芯片来训练大型语言模型,那么一家陆企便需要3,000个以上的H800芯片来达成同样成果。

    虽然在全球研究圈中仍不太使用这类方法,而且难以实行,但中国研究人员取得一些进展。例如华为研究人员在3月的一篇论文中展示如何只利用该公司的Ascend芯片、而不使用辉达的芯片,来训练华为最新一代大型语言模型。儘管存在缺点,但这个名为PanGu-Σ的模型已达到一些华语任务的先进性能表现,包括阅读理解和文法问题。

    热点

    发表评论