M3 Ultra 實裝 6710 億參數 DeepSeek R1 模型 測試證實能輕鬆駕馭

M3 ultra

Apple 最新推出的 M3 Ultra 晶片在 Mac Studio 中展現驚艷性能,竟然能流暢運行擁有 6710 億參數的 DeepSeek R1 模型。這款超大規模 AI 模型需要高達 404GB 的記憶體容量,但 M3 Ultra 憑藉獨特的統一記憶體架構,以低功耗和高效率挑戰業界極限,讓人感到驚嘆不已。

macstudio 01

統一記憶體架構的秘密武器

M3 Ultra 的成功關鍵在於 Apple 的統一記憶體架構 (Unified Memory Architecture)。傳統上,運行像 DeepSeek R1 這樣擁有 6710 億參數的模型需要強大的 GPU 和大量的 VRAM,這通常是高階顯示卡的專屬領域。然而,M3 Ultra 將系統記憶體與處理器共享,形成一個高頻寬記憶體池,讓 AI 模型能像使用 VRAM 一樣高效運作。YouTube 頻道 Dave2D 的測試顯示,這款晶片不僅性能出色,還能在功耗上大幅領先競爭對手。

超越傳統 GPU 的效率奇蹟

DeepSeek R1 模型的 404GB 記憶體需求對傳統 PC 來說是個挑戰,通常需要多張 GPU 協作才能順利運行,這也意味著功耗會飆升至數百甚至上千瓦。然而,M3 Ultra 在 Mac Studio 中僅需不到 200W 的功耗,就能穩定處理這款巨型模型。相較之下,傳統多 GPU 配置可能需要 10 倍以上的電力,讓 M3 Ultra 在能源效率上遙遙領先。Dave Lee 在測試中指出,這種低功耗表現幾乎顛覆了對高性能運算的認知。

極限配置下的性能突破

為了充分發揮 DeepSeek R1 的潛力,M3 Ultra 需要頂規的 512GB 記憶體配置。不過,macOS 預設對 VRAM 的分配有所限制,Dave Lee 透過 Terminal 手動將上限提升至 448GB,才讓模型順利運行。值得一提的是,這次測試使用的是 4-bit 量化的 R1 版本,雖然犧牲了一些精度,但仍保留完整的 6710 億參數。即便如此,M3 Ultra 依然展現出驚人效能,證明其在處理超大規模模型時的硬實力。

M3 Ultra r1 deepseek
M3 Ultra r1 deepseek2

出人意料的參數效率之謎

令人意外的是,6710 億參數的 DeepSeek R1 在 M3 Ultra 上的表現,竟然優於較小的 70 億參數版本。這可能與模型架構的優化有關,讓大規模參數在 Apple 的硬體生態中獲得更好的發揮空間。這種「以大搏大」的表現顯示,M3 Ultra 不僅能應付當前需求,更有潛力挑戰未來的 AI 運算極限。

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookIG