以色列 AI 初創(chuàng)公司 AI21 Labs 獲得谷歌和英偉達3億美元的 D 輪融資,進一步推進大型語言模型與企業(yè)級人工智能產(chǎn)品研發(fā),總?cè)谫Y額達6.36億美元。
Meta發(fā)布了Llama家族的新一代AI模型Llama 4,包括Scout、Maverick和Behemoth三個模型。這些模型在大量未標記的文本、圖像和視頻數(shù)據(jù)上進行訓練,具備廣泛的視覺理解能力。Llama 4采用混合專家架構(gòu),提高了計算效率。Meta表示,這標志著Llama生態(tài)系統(tǒng)新時代的開始,將為用戶帶來更強大的AI能力。
馬斯克旗下大模型公司開發(fā)的Grok-1大語言模型已開源,采用Apache2.0協(xié)議。Grok-1是一個混合專家架構(gòu)模型,參數(shù)總數(shù)3140億,每次推理激活860億。雖然在MMLU和GSM8K評測中表現(xiàn)不錯,但與同類模型相比資源消耗大而收益不顯著。開源的僅為推理代碼,訓練基礎(chǔ)設(shè)施和tokenizer的特殊token作用未透露。