Anthropic 繼本週發佈兩次與設計相關的更新後,於今日推出新產品 Claude Design。這款新工具將加入現有的 Mac 工具套件,其中包括 Claude Cowork 和 Claude Code。Claude Design 由 Opus 4.7 提供支援,是 Anthropic Labs…
Anthropic 發佈了其最新的 AI 模型 Claude Opus 4.7。此新版模型專注於進階軟體開發,並延續了 Anthropic 每兩個月更新一次的節奏,確保模型能力持續迭代升級。 Opus 4.7 大幅提升軟體工程與視覺能力 Claude Opus 4.7 在進階軟體工程方面相較於 Opus 4.6…
據消息指出,Apple 正計派遣部分 Siri 工程師參與為期數週的 AI 編碼訓練營,以期在 AI 領域快速發展的背景下,大幅提升其語音助理的智能表現。此舉正值業界對 Apple 延遲已久的 AI 驅動版 Siri 充滿期待之際,外界普遍預期 Apple 將在今年的全球開發者大會 (WWDC26) 上發佈相關更新。…
OpenAI 近期向企業 AI 市場發起挑戰,推出每月 100 美元的 ChatGPT Pro 訂閱服務。此方案整合了 AI 編碼助手 Codex,直接與 Anthropic 專為開發者設計的 Claude 產品競爭。此舉表明 OpenAI 正積極從消費型聊天應用,擴展至利潤豐厚的專業工具領域,透過每月訂閱制,證明高定價的合理性,並將開發者視為…
Anthropic 近日宣佈,其 AI 助理 Claude 的訂閱方案將不再自動涵蓋透過 OpenClaw 等第三方工具進行的使用。這項調整意味著,若用戶希望繼續利用 Claude 帳戶登入並使用這些第三方服務,將需要另外購買額外的用量組合,或是直接使用 Claude API 密鑰。 Claude 用量激增 Anthropic 調整資源優先順序 Anthropic…
AI 模型開發商 Anthropic 旗下 Claude 的源代碼近期因內部失誤而意外外洩。這導致其部分內部 AI 介面程式碼在網路上流傳,已有用戶開始重現利用這些洩漏的程式碼。 數十萬行程式碼外洩 Anthropic 在週二凌晨約 4 點進行 Claude 的例行性更新時,意外將一個源映射檔發佈,其中包含了 Claude 的源代碼。這個除錯檔涵蓋了 512,000…
根據內部文件洩露與 Anthropic 後續確認,該公司正在測試一款代號為「Mythos」或「Capybara」的全新 AI 模型,宣稱其在推理、編碼與網絡安全方面的表現遠超現有型號。這次洩露是因內容管理系統配置錯誤,導致內部文件自動公開。 新型號能力大幅超越現有產品線 洩露的網誌草稿顯示,新 AI 模型有「Mythos」和「Capybara」兩個版本名稱,Anthropic 表示這些是考慮發佈的初期草稿。這些草稿指出,這款模型超越 Anthropic 現有的 Opus 系列,體積更大、智能程度更高,在軟體編碼、學術推理和網絡安全等多項測試中,分數遠高於 Claude Opus 4.6,被公司視為能力上的一大「里程碑」。 Anthropic…
OpenAI 正在開發一款桌面級「超級應用程式」,旨在將其 ChatGPT 應用、Codex AI 編碼應用以及 Atlas AI 瀏覽器整合至單一平台。這項舉措目標是簡化產品策略,並解決公司內部因功能碎片化而導致的效率問題。 應用程式 CEO 點出碎片化挑戰 面臨產業競爭加劇 OpenAI 應用程式 CEO Fidji Simo 在一份備忘錄中表示,產品的碎片化「已拖慢我們的進度,並使得達成預期品質目標變得更困難」。儘管…
Anthropic 的 Claude 聊天機器人已更新,支援內嵌視覺內容,將有助於提供更清晰的答案。 Claude 支援多種互動式視覺類型 Claude 現可生成圖表、曲線圖和示意圖等客製化視覺內容。當視覺內容能比純文字更好地傳達答案時,系統將會使用。只要啟用網路搜尋,視覺輔助工具也能包含天氣和食譜等真實世界數據。Claude 生成的視覺內容不同於 Artifacts,採用 HTML 和 SVG 技術,而非圖像生成。 天氣和食譜視覺化功能僅限桌面平台 當用戶詢問特定地點的天氣時,Claude 能夠顯示當前天氣狀況和預報;它也能提供格式化的食譜卡,比一大段文字更容易遵循。目前,天氣和食譜數據僅在桌面平台提供,因為這些視覺內容無法在 iOS…
Meta 於週二宣佈收購專為 AI 代理設計的社交網絡平台 Moltbook,並將該公司的創辦人納入其 AI 研究部門。這項交易顯示出業界對 AI 人才與技術的競爭日益激烈,特別是具備執行現實任務能力的自主代理已成為 2026 年科技發展的新前線。Meta 並未透露此次交易的具體財務條款。 創辦人加入 Meta Superintelligence Labs 團隊 Moltbook…
BrowseComp 是一個基準測試,旨在評估 AI 模型在網路上尋找難以定位資訊的能力。當 Anthropic 在多代理設定中讓其 Claude Opus 4.6 模型執行這項基準測試時,發生了該公司前所未見的情況。在 1,266 項任務中的兩項,該模型自主發現自己正被評估,識別出特定的基準測試,並解密了答案密鑰。 AI 模型分析測試脈絡 該模型首先進行了詳盡的網路搜尋以解決問題,其中一個案例處理了數十個平台和十二種語言,約 3000 萬個 token。經過數百次搜尋失敗後,它改變了策略。Opus…
Anthropic 今日宣佈為 Claude 推出全新的記憶匯入工具,並將記憶功能開放予所有免費用戶使用。這項舉措旨在吸引 ChatGPT 與 Gemini 的用戶轉投 Claude 陣營。透過這項工具,用戶可以將其他 AI 服務中的對話紀錄與背景資訊匯入,讓新用戶無需從零開始建立 AI 的學習脈絡。 簡化跨平台遷移流程提升用戶留存 用戶可以使用 Anthropic 提供的特定指令,要求…
這篇文章的作者 Matt Shumer 並非在場外販賣焦慮的評論家,而是身處震央的 AI 開發者與投資人。他擁有超過 6 年創辦 AI 新創公司的經驗,是這個領域最硬核的早期採用者,每天都在測試全球最新的 AI 模型。 這份警告之所以震耳欲聾,是因為它來自一個「每天親手打造 AI」的人。當一位走在技術最前線的專家坦承:「我發現自己的技術工作已經不再被需要了」,並對最新 AI 展現出的自主判斷力感到深深的震撼時,我們就必須明白——這不是對未來的科幻預測,而是已經發生在科技業的現實。他打破業內的「禮貌性樂觀」,寫下這篇長文,是因為他意識到:業內人士看到的真相,與大眾認知的落差已經大到令人感到危險的程度。 1. 現實已經改變:AI…
Anthropic 指控 DeepSeek、MiniMax 和 Moonshot 等三家主要中國 AI 公司,透過欺詐性帳戶從其 Claude 模型中提取數據,以提升競爭對手系統的能力。Anthropic 表示,這些企業創建了數千個虛假帳戶並使用代理服務來規避偵測,總共與 Claude 產生了超過 1,600 萬次互動。這種稱為「蒸餾」的策略,允許開發者利用更先進系統的輸出訓練自己的模型。Anthropic 認為此行為違反了其服務條款,旨在重建 Claude 的高階功能。此指控正值…
Google 近期據傳針對旗下的 AI 程式碼助手採取限制行動,受影響的使用者包括 Antigravity 與 Gemini AI Ultra 的訂閱者。據悉,這些使用者透過與開源程式碼代理框架 OpenClaw 關聯的帳戶使用 Gemini AI 模型,卻因涉及有害、濫用或未經授權的活動,被判定違反 Google 的服務條款。此舉引發了使用者對於 AI…
Google 推出的 Gemini 3.1 Pro 預覽版在 Artificial Analysis 人工智能指數中取得領先地位,以 4 分之差超越 Anthropic 的 Claude Opus 4.6。這款模型在成本效益方面表現突出,其運行費用不到競爭對手的一半,並在十個評測類別中的六個類別排名第一,包括代理編碼、知識、科學推理與物理學。相較於前代模型,其幻覺率大幅下降了 38 個百分點,顯示…
Anthropic 發佈了 Claude Code Security,一款旨在偵測傳統掃描工具遺漏的安全漏洞的工具。此消息公佈後,網絡安全股應聲下跌,反映市場對新興 AI 安全技術潛在影響的擔憂。 Claude Code Security 模擬人類邏輯偵測深層漏洞 Claude Code Security 是 Anth
Google 正式發佈了 Gemini 3.1 Pro 模型,這款升級版模型在問題解決能力上實現了重大飛躍。目前該模型已作為預覽版向開發者、企業及一般用戶開放,旨在將原本屬於 Deep Think 領域的複雜任務處理能力普及到日常應用中。與前代相比,Gemini 3.1 Pro 在核心智能表現上顯著增強,特別是在處理科學研究、工程設計與複雜邏輯推理方面展現了卓越的實力。 推理性能提升超過兩倍 在針對抽象邏輯任務的 ARC-AGI-2 基準測試中,Gemini 3.1 Pro…
繼在 macOS 推出後,Anthropic 的 AI 助理 Cowork 現在正式登陸 Windows 平台。這款 Windows 版本包含了 macOS 版本的所有功能,包括檔案存取、多步驟任務執行、外掛程式以及用於整合外部服務的 MCP 連接器。使用者現在可以設定全域或特定資料夾的指令,讓 Claude 在每個對話視窗中遵循。…
Anthropic 推出的 Claude Opus 4.6 模型正式在 Artificial Analysis Intelligence Index 奪得首位。該指數綜合了編程、代理任務及科學推理等 10 項測試,Claude Opus 4.6 目前在代理型工作任務、終端編程與物理研究問題上表現優異。儘管如此,業界普遍預計正在進行測試的 OpenAI Codex…