Google 發佈 Gemma 4 12B 開源模型　僅需 16GB RAM 即可在筆電執行

Google Deepmind 近日發佈了 Gemma 4 12B，一款開放原始碼的 AI 模型，能將多模態能力帶入日常筆記型電腦。根據 Google 的說法，該模型原生處理文字、圖片與音訊，無需額外的編碼器，從而減少處理時間、記憶體使用量與延遲。這款模型僅需 16 GB 的 RAM 即可在本機執行，且在基準測試中幾乎能媲美體積兩倍的 26B 型號。Gemma 4 12B 也是首款具備原生音訊處理能力的中階 Gemma 模型。

重點文章

多模態能力打破硬體限制

Gemma 4 12B 支援語音辨識、程式碼生成與影片分析。根據開發者指南，它能透過同時分析影片幀與音訊，解析長達數分鐘的影片片段。在一場展示中，該模型處理了一段五分鐘的 Google I/O 主題演講片段：以每秒一幀的速度分析 313 幀畫面，並同步處理音訊內容。這種能力讓過去需要高階伺服器才能運行的多模態任務，現在能在一般筆電上流暢執行。

1920x1080 xMVEyWv.width 1000.format webp

開放生態與商用授權推動普及

這款模型已於 Hugging Face、Ollama、LM Studio 等多個平台釋出，採用 Apache 2.0 授權，允許商用使用。開放原始碼的策略不僅降低 AI 開發的進入門檻，也讓更多開發者能在本地硬體上測試與部署多模態應用，進一步推動邊緣運算的發展。

消息來源

Google 發佈 Gemma 4 12B 開源模型 僅需 16GB RAM 即可在筆電執行

重點文章

多模態能力打破硬體限制

開放生態與商用授權推動普及

相關文章

Google 發佈 Gemma 4 12B 開源模型　僅需 16GB RAM 即可在筆電執行