Apple 已向 Google 提出請求,希望在其數據中心設置伺服器,以運行由 Gemini 驅動的未來版本 Siri。根據《The Information》報導,這一舉動反映出 Apple 在準備迎接新一代 Siri 帶來的龐大 AI 運算需求時,對自身雲端基礎設施能力的擔憂。
重點文章
私有雲端運算架構面臨升級壓力
目前 Apple 將複雜的 AI 查詢傳送至 Private Cloud Compute 系統,該系統運行於採用 Apple 晶片的伺服器。雖然目前的平均使用率僅為 10% ,許多伺服器仍存放在倉庫尚未安裝,但隨著新一代 Siri 的推出,雲端運算需求預計將急劇增加。Apple 長期以來在擴張雲端基礎設施方面顯得猶疑,曾導致 Patrick Gates 等關鍵專家離職,公司過去更側重於硬件裝置與消費者功能,而非後台支援技術,導致額外容量的儲備不足。
內部設施老化促使尋求外部供應商合作
當 Apple 意識到需要強大的雲端支援其 AI 發展時,內部的 AI 基礎設施已開始老化。公司當時正處於停用舊款 Nvidia 伺服器的過程,加上財務壓力,迫使 Apple 轉向 Amazon 等第三方供應商。過去 Apple 基於隱私考慮,軟體主管 Craig Federighi 曾多次否決使用 Google Cloud。然而, Google 在 2023 年對其安全系統進行了改進,滿足了 Apple 的隱私要求,雙方才開始在人工智能領域展開雲端合作。
現有晶片設計限制大型模型運行效率
除了容量問題, Private Cloud Compute 還面臨更新時間較長的問題。此外,目前該系統使用的晶片主要為消費者裝置設計,並非針對 AI 工作流程優化,這使得它們難以高效運行如 Gemini 等大型模型。為了應對 2026 年底功能更強大的 Siri 型號發佈後可能出現的 AI 使用高峰, Apple 決定讓 Siri 直接在 Google 的伺服器上運行。這項轉變顯示出 Apple 在追求 AI 領先地位的同時,正逐步打破過去對雲端技術完全自主控制的堅持。
