Browsing Category

AI

711 posts
grok4 1
Read More

面臨下架壓力 Grok 禁止生成內衣、比基尼等暴露服裝

Apple 目前面臨多個數位權利與兒童安全組織的強大壓力,要求其從 App Store 移除 X 以及內建的 AI 模型 Grok。這項要求源於用戶利用 Grok 生成大量未經同意的私密影像,甚至涉及未成年人的違法內容。由於 Grok 深度整合於 X 平台,這些組織認為 Apple 容許這類應用程式上架,不僅違反了…
antigravity
Read More

Google Antigravity 宣佈正式支援 Skills

Google 旗下的新一代開發者平台 Google Antigravity 今日正式宣佈推出 Agent Skills 功能,為開發者提供了一套開放標準,用於擴充和定義 AI Agent 的能力。這項更新讓開發者能透過簡單的文件結構,將特定的知識與工作流程「傳授」給 Agent,大幅提升了 AI 在軟體開發過程中的實用性與靈活性。 什麼是 Agent Skills? 根據官方文件,Agent…
1760988747 claude code story
Read More

給 Claude Code 新手的生存指南:如何克服 Rate Limit 並最大化開發效率

隨著 AI 輔助開發工具的普及,最近越來越多人開始接觸 Claude Code。筆者使用這套工具進行開發已接近半年,深刻體會到它強大的能力,但也觀察到許多新手剛入門時最常碰壁的痛點。 這個痛點不是程式寫不出來,而是 Rate Limit(使用頻率限制)。不少新加入的朋友抱怨,才剛開始工作 1-2 小時就觸發每小時限制(Hourly Limit);更慘的是,明明專案才進行到一半,用了 3-4 天就撞到了每週限制(Weekly Limit),導致工作被迫停擺。 如果你目前訂閱的是 Claude Code Pro…
Nano banana
Read More

Gemini App 已生成 10 億張 Nano Banana Pro 圖像

Google 旗下的 Gemini 應用程式在短短不到兩個月內,已利用 Nano Banana Pro 模型生成超過 10 億張圖像。這款名為 Gemini 3 Pro Image 的圖像生成與編輯模型於 2025 年 11…
anthopic claude 1
Read More

Anthropic 發佈 Claude for Healthcare 進軍醫療 AI 市場

Anthropic 在 OpenAI 進入醫療市場一週後,正式推出 Claude for Healthcare。這款專為醫療保健設計的 AI 工具符合 HIPAA 標準,旨在協助醫療服務提供者、保險公司及患者。隨著 Abridge 和 Sword Health 等公司在該領域獲得數十億美元估值,Anthropic 正積極進軍這個利潤豐厚的市場,與主要的 AI…
grok4 1
Read More

兩國宣佈封鎖 Grok 以應對 AI 生成深偽影像爭議

馬來西亞與印尼近期正式封鎖由 Elon Musk 旗下公司開發的 Grok 應用程式,主因是該 AI 工具被廣泛用於生成女性與兒童的非自願深偽影像。除此兩國外,英國監管機構 Ofcom 也已展開調查。美國多位參議員則向 Apple 與 Google 遞交公開信,要求在調查完成前,應將 X 與 Grok 從應用程式商店中下架,以防止更多有害內容傳播。…
mark
Read More

盜火者的野心:Meta 啟動「普羅米修斯」計劃 以核能點燃 AI 超級智慧

在希臘神話中,普羅米修斯(Prometheus)是一位富有遠見的泰坦神。他不忍見人類在黑暗與寒冷中掙扎,於是冒著觸怒眾神之王宙斯的風險,盜取了象徵神聖力量的「火種」並將其帶給凡人。這把火不僅帶來了光明與溫暖,更開啟了人類文明、技術與工藝的蓬勃發展。 Meta 將其最新的 AI 基礎設施宏圖命名為「普羅米修斯」(Project Prometheus),絕非巧合。在 Mark Zuckerberg 的願景中,人工智慧正是現代社會的「火種」。一種能夠重塑人類認知、生產力與未來文明形態的終極力量。然而,正如神話中的火種需要被掌控,現代的 AI 亦需要龐大的能量來維持。這一次,Meta 為了守護這把火,決定將目光投向了人類掌握最強大的物理能量:核能。 十億瓦特的超級大腦 「普羅米修斯」計劃不僅僅是一個數據中心的擴建案,它是 Meta 迄今為止最具野心的硬體工程。該計劃的核心是在美國俄亥俄州建立一個耗電量高達 1 吉瓦(GW) 的…
lazy bot
Read More

Claude Opus 4.5 被偷偷「降智」?一個網站告訴你 AI 模型當前可靠性

近日很多盛讚 Claude Code的言論,不過作為長期用戶,這幾天 Opus 4.5 有明顯「降智」問題。如何得知一個模型有沒有被降智?長期用戶會感受得到,一些預期它能 1 Take 完成的工作,卻要做 2-3 次才達標。 很主觀?對!不過,給大家介紹一個名為 Stupid-Meter 的網站。 它會分析當前各大主流模型的可靠度,而且不停更新。 執筆之時,可靠度最高是 SONNET 4…
chatgpt 4
Read More

ChatGPT Health 正式發佈 整合你的 Apple Health 數據提供意見

OpenAI 推出名為 ChatGPT Health 的全新功能,並整合 Apple Health、MyFitnessPal 等多個健康數據平台。這項功能旨在透過整合健康資訊與 AI 技術,為用戶提供更具參考價值的健康資訊。根據 OpenAI 統計,全球每週有超過 2.3 億 名用戶向 ChatGPT 詢問與健康及福祉相關的問題,因此這項新功能的發佈,是為了更好地服務日益增長的健康諮詢需求。 兩年研發並與全球醫師合作…
Grok chatbot silenced as even Musk saw how awful it was 1
Read More

分析指 Grok 於 X 平台每小時生成 6,700 張意識不良照片

Elon Musk 旗下的 X 平台已成為非自願 AI 生成影像的主要分發中心。這些影像在未經當事人同意的情況下,透過 AI 技術將其數位化脫衣,引發了嚴重的隱私與道德爭議。 Grok 模型生成大量爭議影像 研究社交媒體與深偽技術的專家 Genevieve Oh 接受《彭博》訪問時指出,在短短 24 小時內,X 平台的聊天機器人每小時生成約…
Dell mocked at its own press launch for copying Apples naming convention
Read More

Dell 坦言消費者對 AI 電腦缺乏興趣

Dell 產品主管 Kevin Terwilliger 近日指出,目前的個人電腦買家並不真的關心 AI 功能。他在訪談中直言,雖然 AI 在科技行業已成為熱門詞彙,但對普通消費者而言,這項技術目前帶來的困惑往往多於實際幫助。 AI 行銷難以轉化為銷量 根據 Dell 在過去一年的市場觀察,消費者並非因為具備 AI 功能而購買電腦。Kevin Terwilliger 認為,過度強調…
google gemini 6
Read More

Gemini 流量佔比首度突破 20% 而 ChatGPT 降至 64%

Google Gemini 的市場份額首度突破 20% 大關,顯示其在生成式 AI 領域的追趕勢頭強勁。根據 SimilarWeb 的最新數據,Gemini 的全球流量佔比已達到 21.5%,這是自 ChatGPT 問世以來,首次有競爭對手突破兩成門檻。與此同時,OpenAI 的 ChatGPT 流量佔比則下降至 64.5%,低於 65%…
claudecode
Read More

Claude Code 用戶必學的核心技術:Skills 深度解讀

如果你已經開始使用 Claude Code 來輔助編程,你可能已經感受到了它在理解代碼庫方面的強大能力。但如果你還沒有開始使用 Skills,那你可能只發揮了它 50% 的潛力。 在傳統的 LLM 互動中,我們最頭痛的問題是什麼?是「失憶」和「重複勞動」。每次開啟新對話,你都要重新貼上一大段 Prompt:「請使用這套 Commit 規範」、「Code Review 時請注意這些特定的資安問題」…… Claude Code 的…
chatgpt atlas browser 1
Read More

Microsoft Edge 準備攔截 ChatGPT Atlas 瀏覽器下載

Microsoft 正在準備應對 OpenAI 即將推出的 ChatGPT Atlas 瀏覽器。根據流出的系統程式碼顯示,Microsoft 計劃在 Windows 11 平台上採取類似針對 Google Chrome 的策略,當使用者嘗試下載或搜尋 ChatGPT Atlas 時,Edge 瀏覽器將會透過彈出提示,勸說使用者留在自家平台。…
meta manus
Read More

【拆局 】Meta 為何收購 Manus?

Meta 在 2025 年 12 月 29 日宣布收購通用型 AI Agent 新創公司 Manus。官方沒有公開交易金額,但多家主流媒體引述知情人士稱估值約落在 20–30 億美元區間,並指出 Meta 會把 Manus 的…
Expedition33 1
Read More

《光與影:33號遠征隊》因使用 生成式 AI 技術遭 The Indie Game Awards 撤回獎項

由 Sandfall Interactive 開發的 RPG 作品《光與影:33號遠征隊》,最近在 The Indie Game Awards 2025 頒獎典禮上面臨獎項撤回。雖然該遊戲在其他頒獎場合獲得多項榮譽,但因開發過程中涉及使用生成式 AI,違反了該獎項的規定,最終被取消「年度遊戲」與「最佳出道遊戲」兩項大獎。 因使用 AI 技術遭取消資格 主辦單位表示,Sandfall Interactive…
chatgpt 3
Read More

OpenAI 擴大 ChatGPT Go 低價訂閱方案至全球 70 多個國家

OpenAI 正在擴大 ChatGPT Go 的供應範圍,這是一個更具價格競爭力的訂閱方案。繼 8 月在印度推出後,根據官方更新的支援頁面顯示,該方案現已推向全球超過 70 個額外的國家,包括歐洲與南美洲的多個市場。在德國,此服務的月費為 8 歐元,可惜台灣及香港仍未支援, ChatGPT Go 功能特點與限制 除了可以更廣泛地存取旗艦級模型,該訂閱方案還增加了圖像生成、文件分析與數據評估等能力,並具備更大的上下文窗口以處理較長的對話內容。用戶亦可組織專案並建立自定義的 GPTs。不過,此方案並不包含 Sora、API 存取權限以及…
hku
Read More

港大確認論文引文涉 AI 虛構 葉兆輝卸任社科院副院長

香港大學完成就一篇刊登於期刊《China Population and Development Studies》的論文調查,確認該研究部分引文為人工智能生成的虛構文獻,而參與研究的博士生未有作出相關申明。涉事論文題為《Forty years of fertility transition in Hong Kong》,通訊作者為社會科學學院教授葉兆輝。 紀律處分與後續安排 根據調查結果,港大已對事件採取紀律處分及相應措施,包括葉兆輝已卸任學院副院長及研究事務相關職務,並已向相關期刊申請撤稿。涉事博士生亦須依照大學既定紀律程序接受處理。 加強 AI 應用規範培訓 港大表示,將全面加強對所有研究人員的培訓,涵蓋人工智能應用的既定規範與指引,並設立強制性培訓及考核機制,以維護學術誠信及研究質量。…
bot computer
Read More

Meta 首席 AI 科學家:LLM 是死路 效率極低

Meta 首席 AI 科學家 Yann LeCun 在與 DeepMind 研究員 Adam Brown 的辯論中表示,大型語言模型(LLM)代表了通往類人智能的死路。LeCun 認為,根本問題在於這些模型進行預測的方式。 離散預測的缺陷 LeCun 批評 LLM 的技術基礎,也就是離散…
google translate live
Read More

不必買 AirPods  Google Translate 語音即時翻譯支援任何耳機及 70 多種語言

不必再為了即時翻譯而特地購買 AirPods。Google 宣佈為 Google Translate 加入語音即時翻譯測試版功能,只要使用者手上的耳機具備麥克風,就能直接使用,並支援超過 70 種語言,讓即時跨語言溝通不再受限於特定品牌或硬體。 導入 Gemini 翻譯能力 Google 表示,這次更新把 Gemini 最強大的翻譯能力帶進 Google Translate,不僅支援文字翻譯,也首次提供耳機即時語音對語音翻譯體驗,同時加入更多語言供學習與練習。Google 產品與搜尋副總裁…
disney openai
Read More

Disney 向 OpenAI 投資 10 億美元 將角色導入 Sora

Disney 公司正大力投資 OpenAI,同意向這家 AI 開發商投資 10 億美元。根據協議,這家媒體巨頭將成為 OpenAI 影片平台 Sora 的首個主要內容授權合作夥伴。 Sora 用戶的新體驗 透過這次合作,Sora 用戶將可使用來自 Disney 世界觀的大約 200…
openai 4
Read More

OpenAI 十週年 Sam Altman 預測 2035 年實現「超人工智能」

《彭博》 PowerOn 通訊主編 Max 以哲學背景探索意識問題,以及機器是否真正思考。Sam Altman 預測,超人工智能可能在十年內實現。 OpenAI 十週年 在 OpenAI 成立十週年之際,執行長 Sam Altman 預測,公司可能會在未來十年內建立超人工智能。他回顧了公司從 2015 年成立至今的歷程,包括 Dota…
openai browser
Read More

Gemini 影響沒想像中大?OpenAI 預計下月結束 Code Red 狀態

OpenAI 今天發佈 GPT-5.2,這款最新模型在建立試算表、製作簡報、處理圖像、撰寫程式碼與理解長文本方面都有明顯提升。本週起,GPT-5.2 將於 ChatGPT 及 API 正式上線,成為使用者可即時使用的主要工具。 Code Red 全力應戰 在近期推出 GPT-5.1 後,OpenAI 面臨 Anthropic 與 Google…
chatgpt 1
Read More

【拿免費證書】OpenAI ChatGPT 認證課程登場

近日 OpenAI 與 Coursera 合作推出首個官方認證課程 ChatGPT Foundations for Teachers,全程免費,約 4 小時即可完成。雖然課程名稱聚焦於教師,但內容涵蓋的技巧與應用方式對所有使用者都相當實用,讓學習者能快速掌握 ChatGPT 的核心使用方法與最佳實踐。 課程重點 ChatGPT Foundations for Teachers…
deepseek
Read More

Deepseek 傳透過「走私」取得數千顆 Nvidia 晶片用於 AI 訓練

《The Information》報導,根據六位知情人士透露,Deepseek 正使用數千顆 Nvidia 晶片訓練其下一個主要模型。 Blackwell 處理器成目標 該報導指出,這些晶片是美國法規禁止出口到中國的強大 Blackwell 處理器。消息來源稱,這些晶片首先合法運往東南亞的數據中心,Nvidia 或其合作夥伴在這些中心安裝並測試這些晶片。據稱,經銷商隨後拆卸伺服器,以虛假藉口通過海關轉移硬體,並在中國的設施重新組裝系統。據報導,該行動依賴於較小的八晶片伺服器,因為它們更容易運輸和維護。 Nvidia 回應 《彭博》向 Nvidia 詢問時,Nvidia 表示沒有證據表明《The Information》描述的所謂「幽靈數據中心」存在,但強調會跟進任何可能的走私報告。路透社報導稱,Nvidia…
openai 2
Read More

Sam Altman 認為 Google 不是 OpenAI 最大競爭對手?Apple 才是!

OpenAI 執行長 Sam Altman 認為 Apple 是公司最終的競爭對手,並宣布「紅色警戒」,將資源從登月計畫轉移,以挽救 ChatGPT 不斷下滑的主導地位。《華爾街日報》報導,Altman 在週一於紐約與記者共進午餐時表示,未來 AI 競爭將透過設備而非單純的軟體來贏得,而今天的智能手機根本不是為 AI 伴侶而設計的。 挖角 Apple 人才 Altman…
nvidia hq
Read More

特朗普允許 Nvidia 出貨 H200 晶片至中國 但須繳納 25% 關稅

美國總統特朗普週一宣佈,他的政府將允許 Nvidia 在特定的國家安全條件下,將其 H200 產品運送給中國和其他國家的認可客戶。H200 跟現時 Nvidia 最頂級的產品落後大約 18 個月,但明顯較早前中國限定版 H20 晶片有相當顯著的提升。 需交 25% 關稅 特朗普在 Truth Social…
ai predict
Read More

Deepmind CEO 預測 2026 年三大 AI 趨勢

隨著 AI 技術不斷演進,Google Deepmind CEO Demis Hassabis 預測,多模態模型、互動式影片世界和更可靠的 AI Agents 將在明年迎來重大進展。 1. 多模態模型應用 Hassabis 在 Axios AI+ Summit…
google gemini
Read More

AI 教父稱 Gemini 開始超越 OpenAI 猜測 Google 將勝出

AI 教父 Geoffrey Hinton 認為,Google 應該在 AI 競賽中趕上來。「我認為 Google 花這麼長時間才超越 OpenAI 實際上更令人驚訝,」多倫多大學榮譽教授 Geoffrey Hinton 在週二接受 Business Insider 採訪時表示,他之前曾在…
claudecode
Read More

Claude Pro 用戶可在 Claude Code 使用 Opus 4.5

一直以來,Claude Pro 用戶在使用 Claude Code 時也只限選用 Sonnet 4.5,如果想用 Opus 4.5 必須要升級 Max 計劃。然而近日 Claude 宣佈讓Pro 訂戶也可在 Claude Code…
chatgpt
Read More

立即取消訂閱 ChatGPT Plus 將可獲一個月免費使用

受 Google Gemini 的搶攻,ChatGPT 面臨前所未有的壓力,近期紛紛出現「退訂潮」。雖然 OpenAI 表示即將推出 AI 模型更新,甚至透露內部測試性能超越 Gemini 3 Pro!而 ChatGPT 退訂潮下,不少人也反映 OpenAI 已悄悄推出免費送一個月 Plus 訂閱優惠給所有想退訂的人士。…
openai browser 1
Read More

AI 犯錯不再隱藏 OpenAI 坦白系統改變 LLM 訓練方式

OpenAI 近日宣佈,正在開發一種框架,訓練人工智能模型承認自身的不良行為,團隊稱之為「坦白」。由於大型語言模型通常被訓練成產生看似理想的回應,因此它們可能越來越傾向於提供諂媚或完全自信地陳述幻覺。 坦白系統運作方式 新的訓練模型試圖鼓勵模型對其如何得出主要答案的過程做出次要回應。「坦白」只根據誠實度來判斷,而不是根據用於判斷主要回覆的多個因素(例如,有用性、準確性和合規性)來判斷。技術文件可在此處查閱。 鼓勵模型坦誠 研究人員表示,他們的目標是鼓勵模型坦率地說明其所做的事情,包括潛在的問題行為,例如入侵測試、虛報或不服從指令。該公司表示:「如果模型誠實地承認入侵測試、虛報或違反指令,那麼這種承認會增加其獎勵,而不是減少它。」 LLM 訓練新方向 無論你是否喜歡天主教、Usher 或僅僅是更透明的 AI,像「坦白」這樣的系統都可能是 LLM 訓練的一個有用的補充。
Anthropic Bun title
Read More

Anthropic 收購 Bun 強化 Claude Code 基礎架構

Anthropic 近日宣佈收購 JavaScript 和 TypeScript 執行環境與工具鏈 Bun,旨在強化其編碼工具 Claude Code 和 Claude Agent SDK 的基礎架構。 Bun 的重要性 Bun 目前已為這些系統提供支援,Claude…
chatgpt with apple
Read More

OpenAI 呼籲專注改善 ChatGPT 品質

《彭博》報導,OpenAI 執行長 Sam Altman 呼籲員工專注於改進 ChatGPT 的品質,同時延遲其他計劃,包括整合廣告。此舉正值 Google 成功發佈其新的 Gemini 3 人工智能模型後,OpenAI 面臨越來越大的壓力。 延遲項目廣告整合 據稱,OpenAI 延遲了多個項目,如 AI 購物代理和…
NVIDIA
Read More

Meta 考慮採用 Google AI 晶片 Nvidia 股價下跌

Meta 可能考慮在其數據中心使用 Google 設計的晶片,消息傳出後,Nvidia 股價應聲下跌。據《The Information》報導,Meta 正在考慮 2027 年在其數據中心使用 Google 的張量處理單元 (TPU),明年可能還會向 Google 的雲端部門租用 TPU。Google 發言人表示,Google Cloud 對於客製化…
anthropic opus 45
Read More

Anthropic 推出 Claude Opus 4.5 編程能力超越 Gemini 3 Pro

Anthropic 發佈了其最新的頂級模型 Claude Opus 4.5。 該公司表示,該模型在軟件工程基準測試中創下紀錄,運行效率更高,並為 Claude 平台增加了新的控制和代理功能。 效能提升與價格調整 在 Sonnet 4.5 發佈兩個月後,Anthropic 推出了其下一個旗艦模型:Claude Opus 4.5。 Anthropic 將其描述為世界上最強大的編程、自主代理和電腦控制模型,在電子表格編輯、深度研究和幻燈片創建等日常任務中均有所提升。…
1763484188 google gemini 3 story
Read More

OpenAI CEO 承認 Google 帶來威脅 需加速趕上

OpenAI 執行長 Sam Altman 對於 Google 近期在人工智能 (AI) 技術上的進展表示樂觀。Altman 在最近發給同事的內部備忘錄中承認,Google 的成功可能會「為我們公司帶來一些暫時性的經濟逆風」。不過,Altman 亦表示 OpenAI 正在「快速趕上」,並期望能成為 AI 競賽的領導者。 Google Gemini…
openai
Read More

OpenAI 發佈 GPT 5.1 Codex Max 全新編碼模型

OpenAI 近期為 ChatGPT 用戶和開發者推出 GPT 5.1 系列模型。今日,OpenAI 宣佈推出 GPT 5.1 Codex Max,這是一個為長時間運行的任務而構建的全新模型。 單一任務處理數百萬個 tokens GPT 5.1 Codex Max…
grok4 1
Read More

xAI 推出 Grok 4.1 大幅提升情感理解與創造力

首度完整上線的 Grok 4.1 已正式登陸 grok.com、X 平台以及 iOS 與 Android 應用程式,結束過去兩週的安靜上線期。此次更新被視為 xAI 在打造更強大且更貼近人類互動的 AI 系統上,邁出的重要一步。 主要更新內容 Grok 4.1 可在…
anthopic claude
Read More

Anthropic 揭露中國駭客如何利用 Claude 入侵 30 家公司

隨著人工智能技術的快速發展,AI 在網絡安全領域的角色也日益重要。Anthropic 公佈一份報告,內容指出有中國駭客利用 Anthropic 的 Claude 模型成功入侵約 30 家公司,涵蓋科技、金融、化工和政府機構等領域。 AI 完成 90% 駭客工作 駭客主要利用 Claude Code 進行攻擊,該工具具備網路搜尋、資料檢索和軟體執行等功能。AI 負責…
chatgpt 1
Read More

OpenAI 終於解決 ChatGPT 破折號問題

OpenAI 已經解決了 ChatGPT 的一個常見問題,即該 AI 聊天機器人頻繁使用破折號。這個標點符號已成為 AI 生成文字的非官方指標,導致使用者批評那些依賴 AI 的作者。儘管許多人認為破折號有其正當用途,但其在 AI 輸出中的普遍性使其成為任何文字中一個新興的令人反感的特點。 破折號問題的困擾 一段時間以來,ChatGPT 用戶發現即使明確指示,也無法阻止聊天機器人使用破折號。這種持續的使用對 OpenAI 構成了挑戰。 OpenAI…
ai gallery
Read More

藝術家秘密將 AI 生成畫放在博物館展廳

一位藝術家在未經許可的情況下,秘密將一幅由 AI 生成的畫作懸掛在博物館展廳內,隨後在參觀者通知館方後被移除。 博物館員工對此畫一無所知 藝術家 Elias Marrow 將其名為「Empty Plate」的作品,掛在卡迪夫國家博物館。這幅畫作描繪了一名身穿校服的男孩手持餐盤。據 Marrow 表示,在畫作被移除前,已有數百名參觀者看過這件作品。有參觀者向館方詢問此事,工作人員坦言對此畫作及其出現時間一無所知。隨後,Amgueddfa Cymru 的一位發言人證實,一件未經許可的物品被放置在博物館展廳內,館方已接獲通知並將其移除。 使用人工智能生成後再印刷出來 Marrow 表示,他對「公共機構如何決定展示哪些作品,以及當系統之外的事物出現在其中時會發生什麼」深感興趣。這幅畫作使用人工智能生成後再印刷出來,Marrow 認為這是「藝術工具自然演進的一部分」,並補充說他是在使用 AI…
aibot
Read More

研究指出「推理模型」對 LLM 無實質能力提升

清華大學與上海交通大學的一項新研究,已在世界領先的機器學習會議 NeurIPS 上獲得最高榮譽,指出可驗證獎勵強化學習 (RLVR) 雖能提升大型語言模型 (LLMs) 的效率,卻未能賦予其新的推理能力。這項發現引發了研究人員對於基準測試解讀以及 AI 真正推理能力衡量的爭論。 RLVR 機制與效率限制 RLVR 主要用於訓練推理模型,處理數學、程式設計與視覺推理等具有可驗證結果的任務。它不依賴人類回饋,而是使用正確計算或通過的程式碼測試等自動訊號作為獎勵標準。研究表明,RLVR 透過將反應集中在少數高獎勵的解決路徑上,減少了輸出多樣性,從而提高了單次嘗試成功的機會 (pass@1)。然而,這種專注也限制了模型探索替代方案的能力。正如研究負責人 Yang Yue 指出:「RLVR…
Broken Benchmark Chart Sora
Read More

研究指 LLM 模型 Benchmark 存在重大缺陷  無法反映真實能力

一項新的國際研究指出,大型語言模型 (LLM) Benchmark 存在重大問題,顯示大多數目前的評估方法存在嚴重缺陷。研究人員審查了來自頂級 AI 會議的 445 篇基準測試論文後發現,幾乎所有基準測試都存在根本性的方法論問題。 定義不明與人工任務 研究發現,基準測試的定義往往模糊不清或存在爭議。雖然 78% 的基準測試定義了其測量內容,但其中近一半的定義模糊或具爭議性。諸如「推理」、「對齊」和「安全」等關鍵術語常未被定義,導致結論不可靠。此外,41% 的基準測試使用人工任務,其中 29% 完全依賴這類任務。只有約 10% 的測試使用實際反映模型應用方式的真實世界任務。 採樣不良與資料重複…
1749108370 amazon story
Read More

Amazon 運用 AI 幫作者把 Kindle 書籍翻譯成不同語言

Amazon 將為 Kindle 引入 AI 翻譯服務,讓獨立作者能夠以更低的成本將書籍翻譯成其他語言。這項名為 Kindle Translate 的服務目前處於測試階段,並已開放給部分 Kindle Direct Publishing (KDP) 作者使用。Amazon 指出,其美國商店中只有不到 5% 的書籍有多於一種語言版本,希望這個新工具能幫助作者「觸及新讀者並獲得更多收益」。目前,該服務僅支援英文與西班牙文之間的互譯,以及德文翻譯成英文。作者可透過 KDP…
google gemini
Read More

Google 第三季營收突破千億 Gemini 月活躍用戶數達 6.5 億

Alphabet 今天公佈 2025 年 Q3 財報,執行長 Sundar Pichai 宣佈,Gemini 應用程式的月活躍用戶數(MAU)已超過 6.5 億,遠超預期。該季度總營收高達 1,023 億美元,標誌著 Alphabet 在 AI 產品和財務表現上均實現了顯著增長。…
screenshot 155
Read More

IBM 免費 AI 課程 讓你拿下官方認證

IBM 宣佈與 SkillUp Online 合作,推出為期四週的「人工智能基礎導論」免費課程,透過 Guided Learning Experience(GLE)學習模式,幫助對 AI 有興趣的初學者從零開始,深入了解人工智能的基本概念與實際應用。完成課程後,還可獲得官方 IBM Digital Credential 與證書。 從零開始了解人工智能的全貌 這項課程特別為沒有背景知識的學習者設計,內容涵蓋人工智能與機器學習的基本原理、AI 如何理解語言與圖像、AI 對社會與職場的影響等核心議題。課程也包括實作專案,學員將有機會使用…
openai paypal
Read More

PayPal 成為 ChatGPT 首個電子錢包

PayPal 宣佈計劃採用 Agentic Commerce Protocol (ACP),以擴展在 ChatGPT 內的支付與購物功能。此舉將使數百萬 ChatGPT 用戶能夠直接在對話中透過 PayPal 付款,同時讓商家能夠使用 OpenAI Instant Checkout 和 PayPal 的全球支付網絡。…
claude for excel
Read More

Anthropic 強化金融服務功能 推出 Claude for Excel 增益集

Anthropic 正式將其 Claude AI 模型帶入金融服務領域,推出專為金融專業人士設計的全新工具。這些更新的特點包含 Excel 增益集、即時市場數據整合以及可以自動化大量金融任務的 Agent Skills。 深度 Excel 整合 這款 Excel 增益集讓 Claude 能夠讀取、分析、修改甚至建立新的 Excel…
STK255 Google Gemini A
Read More

Google Gemini 現可自動生成簡報 無需手動製作投影片

Google 正在為其 AI 聊天機械人應用程式中的免費互動工作空間 Gemini Canvas 推出一項新功能。這項功能主要針對需要製作簡報的學生與員工。Gemini 現在只需透過提示(Prompt),就能自動生成簡報投影片。 彈性的內容輸入方式 使用者可以選擇上傳文件、試算表或研究報告等檔案,讓 Gemini 根據特定的來源內容建立簡報。若內容來源不是必要的考慮因素,使用者可以直接輸入提示,例如要求針對特定主題建立簡報。如果來源檔案是必須的,則應先上傳文件,然後再指示 Gemini 製作簡報。 簡報的匯出與編輯 生成的簡報成品已包含主題和圖片,並附帶文字內容。使用者可以直接從 Gemini 應用程式將簡報匯出至…