Google 發佈 Gemma 4 12B 開源模型 僅需 16GB RAM 即可在筆電執行

Gemma

Google Deepmind 近日發佈了 Gemma 4 12B,一款開放原始碼的 AI 模型,能將多模態能力帶入日常筆記型電腦。根據 Google 的說法,該模型原生處理文字、圖片與音訊,無需額外的編碼器,從而減少處理時間、記憶體使用量與延遲。這款模型僅需 16 GB 的 RAM 即可在本機執行,且在基準測試中幾乎能媲美體積兩倍的 26B 型號。Gemma 4 12B 也是首款具備原生音訊處理能力的中階 Gemma 模型。

與 Google 相關的圖片

多模態能力打破硬體限制

Gemma 4 12B 支援語音辨識、程式碼生成與影片分析。根據開發者指南,它能透過同時分析影片幀與音訊,解析長達數分鐘的影片片段。在一場展示中,該模型處理了一段五分鐘的 Google I/O 主題演講片段:以每秒一幀的速度分析 313 幀畫面,並同步處理音訊內容。這種能力讓過去需要高階伺服器才能運行的多模態任務,現在能在一般筆電上流暢執行。

1920x1080 xMVEyWv.width 1000.format webp

開放生態與商用授權推動普及

這款模型已於 Hugging Face、Ollama、LM Studio 等多個平台釋出,採用 Apache 2.0 授權,允許商用使用。開放原始碼的策略不僅降低 AI 開發的進入門檻,也讓更多開發者能在本地硬體上測試與部署多模態應用,進一步推動邊緣運算的發展。

消息來源

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookThreads