人工智能研究者Francois Chollet聯(lián)合創(chuàng)立的非營(yíng)利組織Arc Prize Foundation推出了一項(xiàng)新的挑戰(zhàn)性測(cè)試,旨在評(píng)估頂尖AI模型的通用智能水平。這項(xiàng)名為ARC-AGI-2的測(cè)試目前難倒了大多數(shù)模型,人類(lèi)表現(xiàn)遠(yuǎn)超AI。測(cè)試要求AI識(shí)別視覺(jué)模式并生成正確答案,同時(shí)引入效率指標(biāo),評(píng)估AI獲取和應(yīng)用新技能的能力。
本文深入探討了一個(gè)普遍的誤解:人工通用智能(AGI)最終會(huì)演變成一個(gè)龐大的統(tǒng)一系統(tǒng)。作者認(rèn)為,基于當(dāng)前AI發(fā)展態(tài)勢(shì),更可能出現(xiàn)多個(gè)獨(dú)立但相互關(guān)聯(lián)的AGI系統(tǒng)。文章分析了AGI之間可能的競(jìng)爭(zhēng)與合作關(guān)系,以及這種分布式發(fā)展模式對(duì)人類(lèi)社會(huì)的潛在影響。
OpenAI 的 AI 推理研究主管 Noam Brown 表示,如果研究人員早知道正確方法和算法,類(lèi)似 OpenAI 的 o1 這樣的"推理"AI 模型本可以在 20 年前就出現(xiàn)。Brown 強(qiáng)調(diào)了測(cè)試時(shí)推理技術(shù)的重要性,同時(shí)指出預(yù)訓(xùn)練仍然重要。他還討論了學(xué)術(shù)界與前沿實(shí)驗(yàn)室合作的機(jī)會(huì),以及 AI 基準(zhǔn)測(cè)試的改進(jìn)空間。
SEARCH-R1 是一項(xiàng)創(chuàng)新技術(shù),通過(guò)強(qiáng)化學(xué)習(xí)方法訓(xùn)練大語(yǔ)言模型生成搜索查詢(xún),并將搜索引擎檢索無(wú)縫集成到推理過(guò)程中。這項(xiàng)技術(shù)突破了傳統(tǒng) RAG 和工具使用方法的局限性,使模型能夠在推理過(guò)程中動(dòng)態(tài)獲取和利用最新的外部信息,為企業(yè)應(yīng)用提供了更智能、更可靠的 AI 解決方案。
Nvidia CEO黃仁勛在GTC 2025大會(huì)上發(fā)表重要演講,展示了公司在AI計(jì)算、推理能力和機(jī)器人技術(shù)等領(lǐng)域的最新進(jìn)展。重點(diǎn)包括Blackwell平臺(tái)性能提升40倍、開(kāi)源AI工廠(chǎng)操作系統(tǒng)Dynamo、Rubin架構(gòu)路線(xiàn)圖、開(kāi)源人形機(jī)器人模型Groot N1,以及與通用汽車(chē)在自動(dòng)駕駛領(lǐng)域的合作。這些舉措顯示了Nvidia從GPU制造商向全方位AI基礎(chǔ)設(shè)施公司的戰(zhàn)略轉(zhuǎn)型。
全球支付巨頭 Visa 正在利用人工智能技術(shù)提升其業(yè)務(wù)運(yùn)營(yíng)。通過(guò)部署檢索增強(qiáng)生成 (RAG) 系統(tǒng),Visa 大幅提高了信息檢索速度和準(zhǔn)確性。同時(shí),Visa 還開(kāi)發(fā)了安全的內(nèi)部 AI 模型,并利用深度學(xué)習(xí)來(lái)加強(qiáng)欺詐防范。這些 AI 應(yīng)用都建立在 Visa 精心構(gòu)建的多層技術(shù)架構(gòu)之上,旨在平衡創(chuàng)新與風(fēng)險(xiǎn)管理。
AI 語(yǔ)音克隆技術(shù)的濫用正日益成為企業(yè)面臨的重大安全威脅。近期多起高調(diào)事件顯示,不法分子利用 AI 生成的虛假音頻視頻進(jìn)行詐騙。目前許多語(yǔ)音克隆應(yīng)用缺乏有效防護(hù)措施,企業(yè)領(lǐng)導(dǎo)人的公開(kāi)音頻很容易被用于克隆。專(zhuān)家呼吁采取多因素認(rèn)證等措施加強(qiáng)防范,并預(yù)計(jì)未來(lái)將出臺(tái)更多監(jiān)管措施和檢測(cè)技術(shù)來(lái)應(yīng)對(duì)這一威脅。
Google 推出了 Gemini 2.0 模型的一系列改進(jìn),包括為免費(fèi)用戶(hù)開(kāi)放高級(jí)功能。用戶(hù)可以使用改進(jìn)的深度研究功能獲取詳細(xì)信息,新的推理模型還能分析搜索歷史以更好地了解用戶(hù)。Google 強(qiáng)調(diào)這些功能需要用戶(hù)選擇加入,并可隨時(shí)禁用。此外,Google 還為免費(fèi)賬戶(hù)推出了 Gems 功能,允許用戶(hù)創(chuàng)建自定義聊天機(jī)器人。
Google 宣布其 Gemini AI 的深度研究功能現(xiàn)已向所有用戶(hù)免費(fèi)開(kāi)放,支持 45 種以上語(yǔ)言。該功能可生成復(fù)雜主題的綜合報(bào)告。Google 還推出了基于個(gè)人化的實(shí)驗(yàn)性功能,可根據(jù)用戶(hù)的 Google 應(yīng)用和服務(wù)使用情況來(lái)定制回應(yīng)。這些升級(jí)旨在提升 Gemini 的研究能力和個(gè)性化體驗(yàn)。
研究人員提出了一種名為長(zhǎng)度控制策略?xún)?yōu)化(LCPO)的訓(xùn)練技術(shù),可以讓開(kāi)發(fā)者更好地控制大語(yǔ)言模型的思維鏈長(zhǎng)度。這種方法通過(guò)在訓(xùn)練過(guò)程中引入長(zhǎng)度約束,使模型能夠在保持準(zhǔn)確性的同時(shí)生成更簡(jiǎn)潔的推理過(guò)程。實(shí)驗(yàn)表明,采用LCPO訓(xùn)練的模型在準(zhǔn)確性和成本之間提供了平滑的權(quán)衡,并且在相同推理長(zhǎng)度下可以超越更大的模型。這項(xiàng)技術(shù)有望大幅降低企業(yè)應(yīng)用中推理的成本。
人工通用智能(AGI)是AI發(fā)展的終極目標(biāo),但實(shí)現(xiàn)這一目標(biāo)面臨諸多挑戰(zhàn)。本文探討了實(shí)現(xiàn)AGI的五大關(guān)鍵障礙:常識(shí)與直覺(jué)的缺乏、學(xué)習(xí)遷移能力不足、物理與數(shù)字世界的鴻溝、可擴(kuò)展性難題,以及社會(huì)信任問(wèn)題?朔@些挑戰(zhàn)需要突破性技術(shù)進(jìn)展、大規(guī)模投資和廣泛的社會(huì)變革。
人工智能領(lǐng)域投資熱潮與互聯(lián)網(wǎng)泡沫有相似之處,但也存在不同?萍季揞^大舉投資AI,投資者面臨重大抉擇。有人認(rèn)為這是新時(shí)代的開(kāi)端,也有人警告可能是泡沫。專(zhuān)家意見(jiàn)不一,有人看好AI前景,也有人對(duì)高估值和風(fēng)險(xiǎn)表示擔(dān)憂(yōu)。關(guān)鍵在于AI能否帶來(lái)實(shí)質(zhì)性變革,以及哪些公司能在這場(chǎng)變革中生存下來(lái)。
OpenAI 正在推出一套新的 API 和工具,旨在幫助開(kāi)發(fā)者和企業(yè)更高效地構(gòu)建基于 AI 的代理,這些代理基于 OpenAI 自家首個(gè) AI 代理 Deep Research 和 Operator 的技術(shù)。Deep Research 獨(dú)立搜索互聯(lián)網(wǎng),生成豐富、組織良好且有引用的報(bào)告,而 Operator 則根據(jù)用戶(hù)的文本指令自主控制網(wǎng)頁(yè)瀏覽器光標(biāo)并執(zhí)行諸如查找體育票或進(jìn)行預(yù)訂等操作。
SambaNova Systems 推出新的 AI 深度研究框架,可生成深度報(bào)告的速度提高 3 倍,成本大幅降低。該框架與 CrewAI 合作開(kāi)發(fā),支持企業(yè)分析私密數(shù)據(jù),使用開(kāi)源大語(yǔ)言模型和 SambaNova 的 AI 加速器,無(wú)需依賴(lài) Nvidia GPU。新框架包含智能路由系統(tǒng),可根據(jù)需求選擇最合適的智能體,提供從基礎(chǔ)搜索到深度財(cái)務(wù)分析的全方位研究能力。
人工智能正在重塑商業(yè)、工作和日常生活。新突破如生成式語(yǔ)言模型和推理能力加速了AI的應(yīng)用。本文列舉了15個(gè)重要統(tǒng)計(jì)數(shù)據(jù),揭示了當(dāng)前AI革命的真實(shí)影響,涵蓋了AI圖像生成、社交媒體、深度偽造、投資規(guī)模、市場(chǎng)前景、企業(yè)應(yīng)用、醫(yī)療保健、信任度差異等多個(gè)方面,展現(xiàn)了AI技術(shù)的巨大潛力和面臨的挑戰(zhàn)。
本周在巴塞羅那的移動(dòng)世界大會(huì)上,一款聲稱(chēng)預(yù)示著智能手機(jī)未來(lái) AI 的新奇移動(dòng)操作系統(tǒng)亮相。
Hugging Face 的聯(lián)合創(chuàng)始人兼首席科學(xué)官 Thomas Wolf 表示,當(dāng)前 AI 發(fā)展范式無(wú)法產(chǎn)生具有創(chuàng)造性問(wèn)題解決能力的 AI。他認(rèn)為,AI 目前主要是填補(bǔ)人類(lèi)已知之間的空白,而非通過(guò)連接不相關(guān)事實(shí)來(lái)產(chǎn)生新知識(shí)。Wolf 呼吁 AI 行業(yè)轉(zhuǎn)向能夠衡量 AI 提出非常規(guī)問(wèn)題和開(kāi)辟新研究路徑能力的評(píng)估方法。
領(lǐng)先的 AI 公司正在采用"蒸餾"技術(shù),以創(chuàng)造更便宜、更易采用的 AI 模型。這種技術(shù)在 DeepSeek 成功應(yīng)用后引起廣泛關(guān)注,引發(fā)了硅谷 AI 領(lǐng)導(dǎo)地位的動(dòng)搖。蒸餾技術(shù)通過(guò)將大型語(yǔ)言模型的知識(shí)轉(zhuǎn)移到小型模型中,實(shí)現(xiàn)了高效且經(jīng)濟(jì)的 AI 應(yīng)用。這一突破為初創(chuàng)公司和開(kāi)發(fā)者提供了更多機(jī)會(huì),同時(shí)也對(duì)現(xiàn)有 AI 公司的商業(yè)模式構(gòu)成了挑戰(zhàn)。
物理人工智能代表了人工智能從純數(shù)字系統(tǒng)向能夠與現(xiàn)實(shí)世界互動(dòng)的智能機(jī)器的演變。與僅依賴(lài)軟件的人工智能不同,物理人工智能將算法與傳感器和執(zhí)行器結(jié)合在機(jī)器人、車(chē)輛和設(shè)備中,使它們能夠感知周?chē)h(huán)境并實(shí)時(shí)做出決策。這些系統(tǒng)能夠自主運(yùn)行,適應(yīng)不斷變化的環(huán)境,而不是遵循固定的編程。
Google聯(lián)合創(chuàng)始人謝爾蓋·布林重返公司,呼吁員工每周工作60小時(shí),以贏得人工智能競(jìng)賽。他認(rèn)為Google有望實(shí)現(xiàn)通用人工智能(AGI)突破,但需要員工全身心投入。這一呼吁引發(fā)了對(duì)工作效率和AI發(fā)展前景的討論,同時(shí)也反映了科技巨頭在AI競(jìng)爭(zhēng)中的緊迫感。