蘋果發佈可直接在裝置運行的開源 LLM AI 模型 OpenELM
蘋果今日發佈了幾款設計於裝置上運行的開源大型語言模型,而不是透過雲端服務。這些模型統稱為 OpenELM,並已在 Hugging Face Hub 上提供,該平台是一個共享人工智能代碼的社區。 根據白皮書的說明,OpenELM 系列包括 8 款模型,其中 4 款利用 CoreNet 圖書館進行預訓練,另外 4 款進行了指令調校。蘋果採用的逐層縮放策略旨在提升模型的準確性和運行效率。 此次蘋果提供了完整的代碼、訓練日誌以及多個版本的模型,而不僅是最終訓練好的模型。研究團隊希望這能加快人工智能語言領域的發展並獲得「更可靠的結果」。例如,在約十億參數的限制下,OpenELM 的準確度較…