香港文匯報訊 美國《華爾街日報》周二(12月24日)報道,儘管中國在購買先進芯片方面受限,但有跡象表明,中國初創公司追趕美國領先的人工智能(AI) 模型的速度,比業內許多人預期還要快。
由中國最成功避險基金公司之一投資的初創公司DeepSeek,於上月發布其最新大型語言模型的預覽版。DeepSeek表示,程式的能力優於美國科企OpenAI的推理模型「o1」,後者於9月以預覽形式推出。
最近數周其他中國公司也發表類似聲明。由中國網絡巨擘阿里巴巴和騰訊投資的初創公司「月之暗面」(Moonshot AI) 表示,其開發一個專門研究數學的模型,能力接近OpenAI的「o1」。另一方面,阿里巴巴表示自家一個實驗研究模型,在數學上優於「o1」預覽版本。
OpenAI前研究員、現任AI企業家卡爾表示,中國正「緊追在後」。他說,DeepSeek研究人員試圖複製OpenAI的推理模型,僅在數月內就找到了答案,令人相當驚訝。
儘管美國自2022年以來不斷對中國實施最先進AI芯片限制,但中國開發人員找到解決方法。月之暗面創始人楊植麟表示,該公司專注於強化學習,模仿人類的試誤過程,這種方法可能在提高效能方面較少使用運算能力。報道指出,自去年底以來,AI開發人員愈來愈多使用一種名為「混合專家模型」(MoE) 的技術,這種技術能降低對芯片的需求。騰訊曾表示,上月發表的MoE模型的效能,堪比Facebook母公司Meta今年7月推出的Llama 3.1模型。
美國AI初創公司Anthropic聯合創始人克拉克在其網誌中寫道,「中國繞過出口管制的一種方法是,利用它可以訪問的硬件,建立非常好的軟件和硬件培訓。中國製造將成為AI模型的一部分,就像電動車、無人機和其他技術一樣。」
評論