VDURA公司完成重大轉(zhuǎn)型,將自己定位為與DDN、VAST Data和WEKA并列的AI和HPC高性能存儲(chǔ)解決方案提供商。該公司全面改造了原有PanFS軟件,推出基于微服務(wù)架構(gòu)的VDP數(shù)據(jù)平臺(tái),結(jié)合并行文件系統(tǒng)的穩(wěn)定性能與對(duì)象存儲(chǔ)的彈性和成本效益。新平臺(tái)采用統(tǒng)一命名空間和單一控制平面,支持分層閃存-磁盤架構(gòu)。在美國(guó)聯(lián)邦項(xiàng)目競(jìng)標(biāo)中,VDURA憑借優(yōu)異的性能和TCO擊敗競(jìng)爭(zhēng)對(duì)手,證明了其在AI/HPC存儲(chǔ)基礎(chǔ)設(shè)施領(lǐng)域的競(jìng)爭(zhēng)實(shí)力。
PCI特殊興趣小組(PCI-SIG)正式發(fā)布PCIe 7.0規(guī)范,帶寬再次翻倍達(dá)到128 GTps原始傳輸速率,在x16通道配置下可實(shí)現(xiàn)高達(dá)512 GBps雙向帶寬。相比2022年發(fā)布的PCIe 6.0的256 GBps,性能提升一倍。該技術(shù)主要面向800 Gbps以太網(wǎng)適配器、高性能計(jì)算和機(jī)器學(xué)習(xí)等高吞吐量應(yīng)用。同時(shí),PCI-SIG首次推出基于光纖鏈路的PCIe標(biāo)準(zhǔn),并已開始PCIe 8.0規(guī)范的前期研發(fā)工作。
Sandia國(guó)家實(shí)驗(yàn)室與SpiNNcloud合作推出的SpiNNaker2類腦超級(jí)計(jì)算機(jī),依靠48芯片高并行架構(gòu)及高速SRAM/DRAM通信,無(wú)需GPU或內(nèi)置存儲(chǔ),適用于國(guó)防及前沿計(jì)算任務(wù)。
Atos 正在重組,法國(guó)政府已確認(rèn)以4.1億歐元收購(gòu)其 Eviden 子公司先進(jìn)計(jì)算業(yè)務(wù)(不含 Vision AI 部分),該業(yè)務(wù)涵蓋 HPC、量子計(jì)算及 AI 部門,預(yù)計(jì)2025年?duì)I收約8億歐元,此舉將為 Atos 提供急需流動(dòng)資金。
該文探討企業(yè)如何利用超級(jí)計(jì)算推動(dòng) AI 項(xiàng)目落地。HPE 高性能計(jì)算及 AI 基礎(chǔ)設(shè)施負(fù)責(zé)人表示,密集計(jì)算、擴(kuò)展架構(gòu)與液冷技術(shù)正助力大規(guī)模數(shù)據(jù)中心建設(shè),亞太區(qū)增長(zhǎng)迅猛,但高投入、能耗和人才短缺仍是嚴(yán)峻考驗(yàn)。
文章闡述了數(shù)據(jù)中心由傳統(tǒng)向多樣化轉(zhuǎn)型,著重介紹了Intel Xeon 6 CPU采用P核與E核雙架構(gòu),在AI、高性能計(jì)算及云邊端場(chǎng)景中實(shí)現(xiàn)高效節(jié)能的創(chuàng)新應(yīng)用。
本文比較了谷歌“鐵木” TPU Pod 與傳統(tǒng)HPC系統(tǒng)(如“El Capitan”和“Aurora”)在性能和成本上的表現(xiàn)。文章指出,盡管設(shè)計(jì)目標(biāo)不同,但美國(guó)能源部通過(guò)優(yōu)惠合作,實(shí)現(xiàn)了更優(yōu)的性價(jià)比,而谷歌的比較存在誤導(dǎo)。
Rescale是一家數(shù)字工程平臺(tái)公司,剛獲得1.15億美元D輪融資,用于開發(fā)AI驅(qū)動(dòng)的工程工具。該公司通過(guò)"AI物理學(xué)"技術(shù)將傳統(tǒng)需要數(shù)天的模擬計(jì)算縮短至秒級(jí),已吸引包括貝佐斯、奧特曼等知名投資者支持。Rescale源于創(chuàng)始人在波音787研發(fā)中遇到的計(jì)算資源挑戰(zhàn),現(xiàn)已服務(wù)通用汽車等企業(yè)客戶。
隨著 AI 應(yīng)用的加速發(fā)展,企業(yè)面臨著超越原始計(jì)算能力的瓶頸。AMD 提供智能高效的定制計(jì)算解決方案,從數(shù)據(jù)中心 AI 訓(xùn)練到企業(yè)自動(dòng)化,幫助組織無(wú)縫部署和擴(kuò)展計(jì)算基礎(chǔ)設(shè)施。通過(guò)現(xiàn)代化數(shù)據(jù)中心、開源軟件棧 ROCm 以及全面的硬件產(chǎn)品組合,AMD 正在推動(dòng) AI 創(chuàng)新發(fā)展,為企業(yè)提供最佳性能和效率的解決方案。
AMD 發(fā)布第五代 Epyc 嵌入式處理器,采用 Zen 5 架構(gòu),專為網(wǎng)絡(luò)、存儲(chǔ)和工業(yè)邊緣計(jì)算優(yōu)化。新處理器在性能、能效和嵌入式特性方面均有提升,可支持高達(dá) 192 核心,內(nèi)存容量達(dá) 6TB,并提供 7 年產(chǎn)品制造支持。多家行業(yè)合作伙伴已開始采用這一新產(chǎn)品。
VDURA是一家高性能計(jì)算和人工智能并行文件系統(tǒng)存儲(chǔ)供應(yīng)商,最近在其V5000硬件架構(gòu)平臺(tái)上增加了一個(gè)高容量全閃存存儲(chǔ)節(jié)點(diǎn)。V5000于三個(gè)月前推出,配備了中央瘦型(1RU)控制節(jié)點(diǎn),控制混合閃存+磁盤存儲(chǔ)節(jié)點(diǎn)。新推出的全閃存F節(jié)點(diǎn)是一個(gè)1RU服務(wù)器機(jī)箱,最多可容納12個(gè)128 TB NVMe QLC SSD,提供1.536 PB的原始容量。VDURA的首席執(zhí)行官Ken Claffey表示,AI工作負(fù)載需要持續(xù)的高性能和可靠性,因此V5000不僅能達(dá)到最高速度,還能在硬件故障的情況下保持這些速度。
VDURA 將在即將舉行的能源高性能計(jì)算會(huì)議上展示其新一代數(shù)據(jù)平臺(tái)。該平臺(tái)旨在通過(guò)更快的數(shù)據(jù)處理、更高的數(shù)據(jù)持久性和更易用的混合環(huán)境,加速能源行業(yè)創(chuàng)新。VDURA 的混合架構(gòu)結(jié)合了 HDD 和 SSD 的優(yōu)勢(shì),為能源公司提供了優(yōu)化運(yùn)營(yíng)成本和工作負(fù)載速度的解決方案。
微軟推出 Copilot+ PC 標(biāo)準(zhǔn),要求配備高性能 NPU,引發(fā) AI PC 市場(chǎng)格局變化。英偉達(dá)雖在數(shù)據(jù)中心 AI 領(lǐng)域占主導(dǎo),但在 PC 端面臨挑戰(zhàn)。文章分析了英偉達(dá)的 AI PC 策略、NPU 與 GPU 的競(jìng)爭(zhēng)關(guān)系,以及未來(lái) GPU 可能在 Copilot+ 功能中發(fā)揮作用的前景。
DDN獲得3億美元投資,計(jì)劃將其在超級(jí)計(jì)算領(lǐng)域的領(lǐng)先優(yōu)勢(shì)轉(zhuǎn)化為AI存儲(chǔ)解決方案。該公司正在調(diào)整其高性能計(jì)算產(chǎn)品線以適應(yīng)AI工作負(fù)載的需求,并承諾將于2月20日發(fā)布重大公告。這筆投資反映了AI基礎(chǔ)設(shè)施市場(chǎng)的快速增長(zhǎng)和投資熱潮。
Panmnesia 開發(fā)的 GPU 內(nèi)存擴(kuò)展方案榮獲 CES 創(chuàng)新獎(jiǎng)。該技術(shù)通過(guò) CXL 技術(shù)將外部?jī)?nèi)存快速接入 GPU 統(tǒng)一虛擬內(nèi)存空間,有效解決大規(guī)模 AI 訓(xùn)練中 GPU 內(nèi)存不足的問(wèn)題,顯著降低 AI 基礎(chǔ)設(shè)施成本。該方案比傳統(tǒng)方法延遲更低,引起了 AI 數(shù)據(jù)中心行業(yè)的廣泛關(guān)注。
芯片制造商 AMD 投資 2000 萬(wàn)美元入股 Absci 公司,進(jìn)軍人工智能藥物研發(fā)領(lǐng)域,緊隨競(jìng)爭(zhēng)對(duì)手 NVIDIA 的步伐。雙方達(dá)成協(xié)議,Absci 將使用 AMD 的芯片和軟件來(lái)支持其藥物研發(fā)工作,包括利用生成式 AI 的生物藥設(shè)計(jì)平臺(tái)。這一舉措凸顯了 AI 在藥物研發(fā)中的重要性,有望加快新藥開發(fā)進(jìn)程,提高研發(fā)效率。
新加坡一所領(lǐng)先大學(xué)采用新諾公司的 xiRAID 存儲(chǔ)技術(shù),顯著提升了其人工智能研究速度。該技術(shù)通過(guò)先進(jìn)算法實(shí)現(xiàn)高性能、高可靠的數(shù)據(jù)存儲(chǔ),支持包括醫(yī)療保健和自然語(yǔ)言處理在內(nèi)的多個(gè)人工智能研究領(lǐng)域。這一部署不僅滿足了大學(xué)當(dāng)前的存儲(chǔ)需求,還為未來(lái)的擴(kuò)展提供了靈活性。
AIDC的基本架構(gòu)可以劃分為多個(gè)層次和組成部分。在總體架構(gòu)上,AIDC可以被劃分為基礎(chǔ)設(shè)施層、平臺(tái)管理層、大模型開發(fā)平臺(tái)層,以及行業(yè)應(yīng)用層,如圖所示。
福特主要依靠本地系統(tǒng)運(yùn)行建模及模擬類工作負(fù)載。當(dāng)然,過(guò)往與亞馬遜云科技和Azure等超大規(guī)模云服務(wù)商的實(shí)驗(yàn)合作,也證明了混合方案的出色靈活性。
啟用同步多線程(SMT)會(huì)對(duì)某些工作負(fù)載(尤其是高性能計(jì)算(HPC))產(chǎn)生中性到負(fù)面的性能影響。此外,一些應(yīng)用程序許可證計(jì)算啟用的硬件線程數(shù)量而不是物理核心數(shù)量。因此,在你的 AMD EPYC 9005 系列處理器上禁用 SMT 可能是最佳選擇。