OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型雖然在編程和數(shù)學等任務上表現(xiàn)出色,但幻覺率卻遠高于以往模型,引發(fā)了對準確性的嚴重擔憂,亟待進一步研究。
Together AI 最新升級其微調平臺,支持瀏覽器零代碼操作、直接偏好優(yōu)化、續(xù)接先前訓練任務并調整消息權重,同時新定價更低廉,旨在簡化AI模型持續(xù)迭代。
在 Cloud Next 2025 上,Google 公布一系列 AI 更新,包括新 TPU 芯片、專業(yè)化 LLM 及開放代理框架,助力企業(yè)降低集成復雜度和成本,實現(xiàn) AI 部署、擴展及管理。
OpenAI 推出了 GPT-4.1 系列,專注提升編程效率、擴展長文本處理能力與指令執(zhí)行準確性,同時大幅降低成本,為企業(yè)和開發(fā)者提供更靈活的 AI 工具。
Google 發(fā)布了新的智能代理開發(fā)工具包 (ADK) 和相關功能,簡化了基于 Gemini 模型的多代理系統(tǒng)創(chuàng)建過程。ADK 支持 Model Context Protocol,可幫助企業(yè)快速構建、部署和管理 AI 代理。同時推出的還有 Agent Engine 和 Agent Garden,為企業(yè)提供了更全面的代理開發(fā)和管理解決方案。這些新工具旨在增強企業(yè)對 AI 代理的控制和安全性。
英偉達發(fā)布了基于 Meta 舊版 Llama-3.1 的全新開源大語言模型 Llama-3.1-Nemotron-Ultra-253B。該模型在多項第三方基準測試中表現(xiàn)出色,盡管參數(shù)量僅為 DeepSeek R1 的一半,但在許多任務上都超越了這個強大的競爭對手。新模型支持高級推理、指令跟隨和 AI 助手工作流,采用了創(chuàng)新架構和針對性后訓練來優(yōu)化性能。
Google 在生成式 AI 領域起步較晚,但近期 Gemini 發(fā)展迅速。最新發(fā)布的 Gemini 2.5 Pro (實驗版)在基準測試和用戶體驗方面均有顯著提升,有望挑戰(zhàn) ChatGPT 的主導地位。Google 表示,這得益于長期投資的成果開始發(fā)揮作用。新版本在推理能力、性能效率等方面都有進步,但在技術細節(jié)透明度方面仍有待改進。
思科最新研究表明,經(jīng)過微調的大語言模型正在重塑網(wǎng)絡攻擊格局。這些模型可以自動化偵察、身份模仿和實時檢測規(guī)避,加速大規(guī)模社會工程攻擊。一些專門用于攻擊的模型月租低至75美元。研究還發(fā)現(xiàn),微調過程會削弱模型的安全控制,使其更容易被利用。這迫使安全領導者必須重新制定防御策略,將大語言模型視為新的攻擊面來加以防護。
Meta發(fā)布了Llama 4系列大型語言模型,包括適合單GPU運行的Scout和媲美GPT-4o的Maverick,均擁有170億參數(shù)。更強大的Behemoth模型仍在開發(fā)中,將擁有2880億活躍參數(shù)。這些模型采用專家混合系統(tǒng)技術,在性能、效率和安全性方面均有顯著提升,體現(xiàn)了Meta推動開源AI成為行業(yè)領先力量的戰(zhàn)略。
Google 近期加快了 AI 模型的發(fā)布節(jié)奏,推出了業(yè)界領先的 Gemini 2.5 Pro 和 Gemini 2.0 Flash。然而,公司尚未發(fā)布這些新模型的安全報告,引發(fā)了對透明度的擔憂。Google 表示正在權衡快速迭代和獲取反饋的方式,承諾未來會發(fā)布更多文檔,但專家認為這種做法可能會樹立不良先例。
Google 推出最新的 Gemini 2.5 Pro (實驗版) AI 模型,并以罕見的速度向免費用戶開放。該模型支持模擬推理,提高了準確性,并在 LMSYS 聊天機器人競技場排行榜上名列前茅。免費用戶可在網(wǎng)頁上試用,但有使用限制,無法上傳文件,且有未明確的token和使用次數(shù)限制。
Gartner 預測,大語言模型 (LLM) 提供商市場即將進入"滅絕"階段。在競爭激烈的環(huán)境下,巨額資本投入成為主要挑戰(zhàn)。預計到 2025 年,全球生成式 AI 支出將達到 6440 億美元,較 2024 年增長 76%。專家認為,LLM 市場將經(jīng)歷類似云計算市場的整合,最終可能只剩少數(shù)幾家主導者。
OpenAI計劃今年晚些時候向開發(fā)者社區(qū)發(fā)布一個"開放權重"模型,這是該公司自2019年以來的首次嘗試。新模型將具備推理能力,類似于現(xiàn)有的o3-mini模型。這一戰(zhàn)略轉變旨在應對來自競爭對手的壓力,同時為開發(fā)者提供更多定制和使用靈活性。雖然不完全開源,但這種方式可能有助于OpenAI在保持技術領先的同時,滿足市場對更開放AI發(fā)展的需求。
Databricks 與 Palantir 簽署合作協(xié)議,開發(fā)出更優(yōu)的大語言模型微調方法,并與 Anthropic 達成為期五年的戰(zhàn)略聯(lián)盟,將 Claude 大語言模型整合到其數(shù)據(jù)湖平臺中。此次合作將為企業(yè)客戶提供更強大的 AI 能力,包括軍工級安全性、高效的模型訓練以及全面的數(shù)據(jù)治理,助力企業(yè)打造專屬 AI 應用。
Google 發(fā)布新一代 AI 模型 Gemini 2.5,在 LMArena 評測中位居榜首。該模型采用遞歸分析方法提供輸出,在推理、科學、數(shù)學和代碼生成等方面表現(xiàn)出色。目前已向付費高級用戶開放使用,并將在 2025 年投入 750 億美元用于 AI 開發(fā),以爭奪未來萬億規(guī)模的 AI 市場。
AI 正在迅速改變我們的工作方式,無論是通過自動化任務、作為副駕駛還是生成文本、圖像和軟件。雖然目前尚未出現(xiàn)大規(guī)模的勞動力替代,但多項研究預測未來幾年內 40% 的全球就業(yè)崗位可能面臨 AI 自動化的沖擊。這可能是暴風雨來臨前的寧靜。
騰訊放緩了GPU部署速度,原因是DeepSeek技術的突破使得現(xiàn)有GPU的生產(chǎn)力大幅提升。公司預計2025年資本支出將占收入的"低teens百分比",遠低于微軟和亞馬遜的支出。騰訊強調效率和GPU服務器的高效利用,認為這不會影響技術開發(fā)的最終效果。公司計劃在微信中加入AI驅動的搜索、語言輸入和內容生成功能,并考慮引入智能AI服務。
Google 發(fā)布新一代輕量級開源大語言模型 Gemma 3,提供多種參數(shù)規(guī)模選擇,可在單個 GPU 上運行。該模型基于 Gemini 技術,性能優(yōu)異,具備多模態(tài)能力和大上下文窗口。同時推出 ShieldGemma 2 用于圖像安全檢查,為開發(fā)者提供更多 AI 應用開發(fā)選擇。
專家鏈(CoE)是一種新型大語言模型框架,通過順序激活專門化的模型元素來提高資源效率和推理任務準確性。與傳統(tǒng)方法相比,CoE允許專家元素相互傳遞中間結果,逐步建立推理鏈,從而在推理密集型應用中實現(xiàn)更高效的計算和更好的用戶體驗,同時大幅降低企業(yè)運行大型語言模型的成本。
微軟公司據(jù)報道已開發(fā)出一系列大型語言模型,可與 OpenAI 和 Anthropic 的算法相媲美。這個名為 MAI 的 LLM 系列可能使用了微軟內部開發(fā)的 AI 芯片 Maia 100。測試結果顯示,MAI 在性能上具有競爭力,可能用于支持微軟的 Copilot AI 助手系列。此舉或將減少微軟對 OpenAI 的依賴,同時公司也在開發(fā)專注于推理任務的第二個 LLM 系列。