隨著ChatGPT等AI聊天機(jī)器人成為"互聯(lián)網(wǎng)入口",傳統(tǒng)SEO面臨顛覆。企業(yè)開始關(guān)注如何在AI生成的答案中獲得更好展示。Evertune等初創(chuàng)公司應(yīng)運(yùn)而生,通過每月運(yùn)行數(shù)百萬次提示來幫助企業(yè)監(jiān)測品牌在AI回答中的表現(xiàn)。同時(shí),Perplexity出價(jià)345億美元收購Chrome瀏覽器,OpenAI發(fā)布GPT-5模型,顯示AI搜索領(lǐng)域競爭加劇。
三家AI巨頭同時(shí)發(fā)布重磅新模型。OpenAI推出首批開放權(quán)重模型OSS 120b和OSS 20b,具備Apache許可證,大模型推理能力與o4-mini相當(dāng),小模型可在智能手機(jī)運(yùn)行。Anthropic發(fā)布Claude Opus 4.1,在代碼編程和推理任務(wù)上顯著提升。Google DeepMind推出Genie 3世界模型,可實(shí)時(shí)生成可交互的720p游戲世界,被視為通向AGI的重要步驟。
谷歌正式推出其最強(qiáng)大的Gemini 2.5深度思考AI模型,但僅向每月250美元的AI Ultra訂閱用戶開放。該模型基于Gemini 2.5 Pro,通過增加"思考時(shí)間"和并行分析來處理復(fù)雜查詢。深度思考模型在多個(gè)基準(zhǔn)測試中表現(xiàn)優(yōu)異,在人類最終考試中得分34.8%,遠(yuǎn)超其他模型的20-25%。該模型特別擅長數(shù)學(xué)推理、科學(xué)分析和編程,響應(yīng)時(shí)間需要數(shù)分鐘,每日使用次數(shù)有限制。
最新調(diào)查顯示,32%的受訪者表示有興趣使用AI進(jìn)行心理治療而非人類治療師。專家認(rèn)為,AI聊天機(jī)器人具有超強(qiáng)耐心,在快節(jié)奏社會(huì)中頗具吸引力。年輕人因習(xí)慣單向網(wǎng)絡(luò)關(guān)系而更易接受AI治療。研究表明AI在預(yù)測自殺傾向方面準(zhǔn)確率達(dá)70%,但也存在風(fēng)險(xiǎn),包括過度肯定和缺乏真實(shí)人際連接。專家建議應(yīng)謹(jǐn)慎整合AI與傳統(tǒng)心理治療,既發(fā)揮技術(shù)優(yōu)勢又保持人性化關(guān)懷。
谷歌正在將其基于人工智能的圖片轉(zhuǎn)視頻技術(shù)推廣到更多應(yīng)用程序中。這項(xiàng)技術(shù)能夠?qū)㈧o態(tài)圖片轉(zhuǎn)換為動(dòng)態(tài)視頻內(nèi)容,利用先進(jìn)的AI算法分析圖片內(nèi)容并生成流暢的視頻效果。此舉標(biāo)志著谷歌在AI視覺處理領(lǐng)域的進(jìn)一步布局,預(yù)計(jì)將為用戶提供更豐富的多媒體創(chuàng)作體驗(yàn)。
谷歌Gemini嵌入模型正式發(fā)布并在權(quán)威MTEB基準(zhǔn)測試中排名第一,現(xiàn)已集成到Gemini API和Vertex AI中。該模型支持語義搜索和檢索增強(qiáng)生成等應(yīng)用,采用Matryoshka表示學(xué)習(xí)技術(shù),支持100多種語言。阿里巴巴開源的Qwen3-Embedding模型緊隨其后,為企業(yè)提供了專有模型與開源替代方案之間的新選擇。
OpenAI推出ChatGPT Agent,標(biāo)志著人工智能進(jìn)入數(shù)字勞動(dòng)力時(shí)代。與傳統(tǒng)AI不同,智能體AI具備真正的"自主性",能夠設(shè)定目標(biāo)、做出決策并執(zhí)行復(fù)雜任務(wù)。市場規(guī)模將從2024年的50億美元增長至2030年的500億美元。目前已涌現(xiàn)七類數(shù)字工作者:業(yè)務(wù)任務(wù)、對(duì)話服務(wù)、研究分析、開發(fā)編程等智能體,它們正在重塑消費(fèi)者體驗(yàn)和企業(yè)運(yùn)營模式。
以色列魏茨曼科學(xué)研究所、英特爾實(shí)驗(yàn)室和d-Matrix研究人員開發(fā)出新算法,能顯著降低大語言模型服務(wù)成本。該算法基于投機(jī)解碼技術(shù),無需專門的草稿模型即可將令牌生成速度提升2.8倍。研究提出三種方法:令牌級(jí)交集、字符串級(jí)精確匹配和字符串級(jí)拒絕采樣,解決了不同模型詞匯表匹配問題。算法已集成到Hugging Face框架中,開發(fā)者僅需一行代碼即可使用。
語音AI解決方案提供商Krisp發(fā)布了VIVA語音隔離AI模型和軟件開發(fā)工具包,專為語音AI智能體設(shè)計(jì)。VIVA每月處理超過10億分鐘的語音音頻,能在20毫秒內(nèi)處理音頻,將對(duì)話輪轉(zhuǎn)準(zhǔn)確性提升3.5倍,減少50%的通話中斷。該工具可過濾背景噪音和笑聲,避免AI誤判,提升轉(zhuǎn)錄準(zhǔn)確性和用戶體驗(yàn)。
AI第四代生成式AI標(biāo)志著技術(shù)范式轉(zhuǎn)變,正在用戶體驗(yàn)、應(yīng)用自動(dòng)化和平臺(tái)三個(gè)層面為企業(yè)帶來重大價(jià)值和顛覆。企業(yè)應(yīng)關(guān)注商業(yè)價(jià)值而非技術(shù)本身,需要從業(yè)務(wù)問題出發(fā)量化價(jià)值。未來五年將在認(rèn)知任務(wù)處理上取得巨大進(jìn)展,但需要?jiǎng)?chuàng)新思維應(yīng)對(duì)勞動(dòng)力轉(zhuǎn)型。六大顛覆性支柱包括下一代AI能力、數(shù)據(jù)平臺(tái)、機(jī)器人技術(shù)、量子計(jì)算、企業(yè)用戶體驗(yàn)和云架構(gòu)等。
本文分析了AI向AGI發(fā)展的七大路徑中的S曲線路徑,該路徑預(yù)測AI發(fā)展將經(jīng)歷三個(gè)階段:2025-2030年AI多模態(tài)模型和智能體技術(shù)快速發(fā)展;2030-2035年進(jìn)入停滯平臺(tái)期,引發(fā)AI寒冬擔(dān)憂;2035-2040年技術(shù)突破重新啟動(dòng),自改進(jìn)AI系統(tǒng)和混合認(rèn)知架構(gòu)推動(dòng)AGI最終實(shí)現(xiàn)。
谷歌周四宣布,通過Gemini應(yīng)用為其Veo 3 AI視頻生成器增加圖像生成視頻功能。該功能此前已在5月I/O開發(fā)者大會(huì)上推出的AI視頻工具Flow中提供。目前Veo 3視頻生成功能已在150多個(gè)國家推出,僅限Google AI Ultra和Pro用戶使用,每日限制生成3個(gè)視頻。用戶可上傳照片并添加音頻描述來生成視頻。發(fā)布7周來,用戶已創(chuàng)建超過4000萬個(gè)視頻,所有視頻都帶有可見和不可見的數(shù)字水印。
微軟研究團(tuán)隊(duì)提出"AI綠色推理"新模式,將AI計(jì)算集群直接部署在風(fēng)電場等可再生能源站點(diǎn),繞過電網(wǎng)瓶頸直接利用綠色能源。該方案通過Heron軟件路由器動(dòng)態(tài)管理工作負(fù)載,根據(jù)實(shí)時(shí)電力供應(yīng)情況智能分配計(jì)算任務(wù)。研究顯示,目前可在風(fēng)電場部署超過600萬個(gè)高端GPU。這種模塊化數(shù)據(jù)中心架構(gòu)不僅緩解傳統(tǒng)電網(wǎng)壓力,還能有效利用未充分使用的可再生能源,為云計(jì)算提供商提供可持續(xù)發(fā)展的新路徑。
文章介紹了AI大語言模型中最新的深度研究功能,這是目前最令人印象深刻的新功能之一。作者詳細(xì)解析了ChatGPT、Claude和Gemini等主流模型的使用方法,并重點(diǎn)展示了深度研究功能的實(shí)際應(yīng)用。通過實(shí)際測試,作者用ChatGPT 4.5的深度研究功能生成了一份關(guān)于1990-2025年最令人厭煩歌曲的詳細(xì)報(bào)告,展示了AI如何通過思維鏈進(jìn)行深度研究和分析。文章還提到了語音交互模式將進(jìn)一步改變用戶與AI的交互體驗(yàn)。
隨著AI引發(fā)投資熱潮,越來越多初創(chuàng)企業(yè)獲得獨(dú)角獸地位。TechCrunch追蹤了今年迄今為止成為獨(dú)角獸的風(fēng)投支持初創(chuàng)企業(yè)。雖然大多數(shù)與AI相關(guān),但令人驚訝的是許多企業(yè)專注于其他行業(yè),如衛(wèi)星公司Loft Orbital和區(qū)塊鏈交易網(wǎng)站Kalshi。名單涵蓋軟件開發(fā)、機(jī)器人技術(shù)、企業(yè)網(wǎng)絡(luò)基礎(chǔ)設(shè)施、體育軟件、客服AI代理等多個(gè)領(lǐng)域,估值從10億美元到100億美元不等。
德國TNG Technology Consulting公司基于DeepSeek R1-0528開發(fā)出新變體R1T2 Chimera,采用專家組裝技術(shù)融合三個(gè)預(yù)訓(xùn)練模型。該模型在保持90%原版推理能力的同時(shí),輸出token數(shù)量減少60%,推理速度提升200%。新模型采用MIT開源許可,已在Hugging Face平臺(tái)發(fā)布,為企業(yè)應(yīng)用提供更高效的AI推理解決方案。
MIT、哈佛和芝加哥大學(xué)研究人員提出"波將金理解"概念,用于描述大語言模型的新型失效模式。這些模型在概念基準(zhǔn)測試中表現(xiàn)優(yōu)異,但缺乏實(shí)際應(yīng)用這些概念的真正理解能力。研究顯示,模型能準(zhǔn)確解釋概念定義,卻無法正確識(shí)別、生成或編輯相關(guān)實(shí)例。測試發(fā)現(xiàn)模型概念識(shí)別準(zhǔn)確率達(dá)94.2%,但在實(shí)際應(yīng)用中失敗率高達(dá)40-55%。這種現(xiàn)象使基準(zhǔn)測試結(jié)果產(chǎn)生誤導(dǎo)性,表明AI距離真正的通用人工智能還有很長路要走。
Cerabyte公司表示,到2030年將推出容量超過100PB的歸檔存儲(chǔ)機(jī)架,帶寬達(dá)2GBps,首字節(jié)訪問時(shí)間少于10秒。該技術(shù)基于飛秒激光在玻璃基板上蝕刻陶瓷記錄層,玻璃片存儲(chǔ)在類似磁帶的盒式存儲(chǔ)器中。與磁帶相比,該技術(shù)壽命超過100年,成本僅1美元/TB,數(shù)據(jù)傳輸速度1-2GBps。公司已獲得Pure Storage等投資,正在開發(fā)試點(diǎn)生產(chǎn)系統(tǒng)。
Linux之父Linus Torvalds警告稱,新一代bcachefs文件系統(tǒng)可能在6.17版本內(nèi)核中被移除。爭議源于bcachefs維護(hù)者Kent Overstreet在發(fā)布候選階段提交了包含新功能的代碼,違反了該階段只能修復(fù)漏洞的規(guī)則。Torvalds對(duì)此表示不滿,并暗示雙方將"分道揚(yáng)鑣"。bcachefs項(xiàng)目歷時(shí)十年發(fā)展,剛于2024年1月納入6.7版本內(nèi)核,現(xiàn)在面臨被踢出的風(fēng)險(xiǎn)。即使被移除,該項(xiàng)目仍可通過外部開發(fā)、FUSE子系統(tǒng)或DKMS工具等方式繼續(xù)發(fā)展。
人工智能與量子技術(shù)正在改變傳統(tǒng)心臟診療方式。SandboxAQ首席執(zhí)行官介紹了一種突破性方法,通過量子傳感器檢測心臟磁場替代傳統(tǒng)心電圖的電場檢測。這種新技術(shù)能夠獲得360度完整、高密度的心臟信息,避免傳統(tǒng)心電圖間接檢測導(dǎo)致的誤診問題。該方法結(jié)合AI和量子計(jì)算,為心血管疾病提供更精準(zhǔn)的個(gè)性化診斷和治療方案。