Deepseek 延遲發表 AI 模型 傳因華為晶片技術問題
Deepseek 最新的 AI 模型發表遭遇重大延遲,據報導這是因為在使用華為昇騰晶片進行訓練時,遇到了持續的技術問題。 華為晶片訓練挑戰 《金融時報》報導,中國監管機構在 Deepseek 於 1 月發表 R1 模型後,曾鼓勵其將訓練晶片從 Nvidia 的領先產品轉向華為的昇騰處理器來用於 R2 模型。然而,這項計畫遭遇了巨大阻礙,因為 Deepseek 在使用昇騰晶片訓練時,遇到了持續的技術問題。即使有華為的工程師現場協助,團隊仍未能成功完成訓練作業。加州大學柏克萊分校的…