日韩成年片在线观看,久碰久摸久看好男人视频,日韩在线一区看片,哥去射在线视频一区二区三区伊人

英偉達(dá)這顆芯片,震驚所有人

英偉達(dá)這顆芯片,震驚所有人

牢樂安 2025-01-12 社會(huì)科技 3 次瀏覽 0個(gè)評(píng)論

在 2025 年的 CES 活動(dòng)上,Nvidia (NVDA.US)這宣布與聯(lián)發(fā)科合作開發(fā)了一款售價(jià) 3000 美元的新型臺(tái)式電腦,該電腦搭載了基于 Arm 的全新精簡(jiǎn)版 Grace CPU 和 Blackwell GPU 超級(jí)芯片。新系統(tǒng)名為“Project DIGITS”(不要與 Nvidia 的深度學(xué)習(xí) GPU 訓(xùn)練系統(tǒng):DIGITS混淆)。該平臺(tái)為 AI 和 HPC 市場(chǎng)提供了一系列新功能。

Project DIGITS 采用具有 20 個(gè) Arm 核心的全新 Nvidia GB10 Grace Blackwell 超級(jí)芯片,旨在提供“千萬(wàn)億次”(FP4 精度)的 GPU-AI 計(jì)算性能,用于原型設(shè)計(jì)、微調(diào)和運(yùn)行大型 AI 模型。(強(qiáng)制性浮點(diǎn)解釋器可能在這里有所幫助。)

自 G8x 系列顯卡發(fā)布(2006 年)以來(lái),Nvidia 一直致力于提供適用于整個(gè) GPU 系列的 CUDA 工具和庫(kù)。能夠使用低成本客戶顯卡進(jìn)行 CUDA 開發(fā)有助于創(chuàng)建充滿活力的應(yīng)用程序生態(tài)系統(tǒng)。由于高性能 GPU 的成本和稀缺性,DIGITS 項(xiàng)目應(yīng)該能夠?qū)崿F(xiàn)更多基于 LLM 的軟件開發(fā)。與低成本 GPU 一樣,在桌面上運(yùn)行、配置和微調(diào)開放式變壓器模型(例如 llama)的能力應(yīng)該對(duì)開發(fā)人員具有吸引力。例如,通過(guò)提供 128GB 內(nèi)存,DIGITS 系統(tǒng)將有助于克服許多低成本消費(fèi)級(jí)顯卡上的 24GB 限制。

規(guī)格不足

新款 GB10 超級(jí)芯片采用 Nvidia Blackwell GPU,配備最新一代 CUDA 核心和第五代 Tensor 核心,通過(guò) NVLink-C2C 芯片到芯片互連連接到高性能 Nvidia Grace 類 CPU,其中包括20 個(gè)節(jié)能的 Arm 核心(十個(gè) Arm Cortex-X925 和十個(gè) Cortex-A725 CPU 核心)。

雖然沒有可用的規(guī)格,但 GB10 的 GPU 端被認(rèn)為提供的性能低于Grace-Blackwell GB200。需要明確的是;GB10 不是分檔或激光修剪的GB200。GB200超級(jí)芯片有 72 個(gè) Arm Neoverse V2 核心和兩個(gè) B200 Tensor Core GPU。

DIGITS 系統(tǒng)的定義特征是 CPU 和 GPU 之間統(tǒng)一、一致的內(nèi)存 128GB(LPDDR5x)。這種內(nèi)存大小在 GPU 上運(yùn)行 AI 或 HPC 模型時(shí)打破了“GPU 內(nèi)存障礙”;例如,80GB Nvidia A100 的當(dāng)前市場(chǎng)價(jià)格從 18,000 美元到 20,000 美元不等。有了統(tǒng)一、一致的內(nèi)存,CPU 和 GPU 之間的 PCIe 傳輸也被消除了。下圖中的渲染表明內(nèi)存量是固定的,用戶無(wú)法擴(kuò)展。該圖還表明ConnectX 網(wǎng)絡(luò)(以太網(wǎng)?)、Wifi、藍(lán)牙和 USB 連接可用。

該系統(tǒng)還提供高達(dá) 4TB 的 NVMe 存儲(chǔ)。在電源方面,Nvidia 提到了標(biāo)準(zhǔn)電源插座。沒有特定的電源要求,但尺寸和設(shè)計(jì)可能會(huì)提供一些線索。首先,與 Mac mini 系統(tǒng)一樣,小尺寸(見圖 2)表明產(chǎn)生的熱量一定不會(huì)那么高。其次,根據(jù) CES 展廳的圖像,沒有風(fēng)扇通風(fēng)口或切口。機(jī)箱的正面和背面似乎有一種海綿狀的材料,可以提供氣流,并可能充當(dāng)整個(gè)系統(tǒng)的過(guò)濾器。由于散熱設(shè)計(jì)表明功率,功率表明性能,因此 DIGITS 系統(tǒng)可能不是一款為實(shí)現(xiàn)最大性能(和功耗)而調(diào)整的尖叫器,而是一款具有優(yōu)化內(nèi)存架構(gòu)的涼爽、安靜、高效的 AI 桌面系統(tǒng)。

如上所述,該系統(tǒng)非常小。下圖提供了一些鍵盤和顯示器的視角(沒有顯示電纜。根據(jù)我們的經(jīng)驗(yàn),其中一些小型系統(tǒng)可能會(huì)因電纜重量而從桌面上拉下來(lái)。)

桌面上的人工智能

Nvidia 報(bào)告稱,開發(fā)人員可以運(yùn)行多達(dá) 2000 億個(gè)參數(shù)的大型語(yǔ)言模型,以增強(qiáng) AI 創(chuàng)新。此外,使用 Nvidia ConnectX 網(wǎng)絡(luò),兩臺(tái) Project DIGITS AI 超級(jí)計(jì)算機(jī)可以連接起來(lái),運(yùn)行多達(dá) 4050 億個(gè)參數(shù)的模型。借助 Project DIGITS,用戶可以使用自己的桌面系統(tǒng)開發(fā)和運(yùn)行模型推理,然后在加速云或數(shù)據(jù)中心基礎(chǔ)設(shè)施上無(wú)縫部署模型。

Nvidia 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“AI 將成為各行各業(yè)中每一種應(yīng)用的主流。借助 Project DIGITS,Grace Blackwell 超級(jí)芯片將惠及數(shù)百萬(wàn)開發(fā)者。將 AI 超級(jí)計(jì)算機(jī)放在每一位數(shù)據(jù)科學(xué)家、AI 研究人員和學(xué)生的桌子上,將使他們能夠參與并塑造 AI 時(shí)代?!?/p>

這些系統(tǒng)不適用于訓(xùn)練,而是設(shè)計(jì)用于在本地運(yùn)行量化的 ?LLM(減少模型權(quán)重的精度大?。?。Nvidia 引用的 1 petaFLOP 性能數(shù)字適用于 FP4 精度權(quán)重(四位,或 16 個(gè)可能的數(shù)字)許多模型可以在此級(jí)別充分運(yùn)行,但量化可以增加到 FP8、FP16 或更高,以獲得更好的結(jié)果,具體取決于模型的大小和可用內(nèi)存。例如,對(duì) Llama-3-70B 模型使用 FP8 精度權(quán)重需要每個(gè)參數(shù)一個(gè)字節(jié)或大約 70GB 的內(nèi)存。將精度減半到 FP4 會(huì)將其減少到 35GB 的內(nèi)存,但增加到 FP32 將需要 140GB,這比 DIGITS 系統(tǒng)提供的內(nèi)存還要大。

有人用 HPC 集群?jiǎn)幔?/p>

可能不為人所知的是,DIGITS 并不是第一款桌邊 Nvidia 系統(tǒng)。2024年,GPTshop.ai推出了一款基于 GH200 的桌邊系統(tǒng)。HPCwire提供了包括 HPC 基準(zhǔn)測(cè)試在內(nèi)的報(bào)道。與 DIGITS 項(xiàng)目不同,GPTshop 系統(tǒng)在桌邊機(jī)箱中提供了 GH200 Grace-Hopper 超級(jí)芯片和 GB200 Grace-Blackwell 超級(jí)芯片的全部功能。性能的提升也伴隨著更高的成本。

將 DIGITS 項(xiàng)目系統(tǒng)用于桌面 HPC 可能是一種有趣的方法。除了運(yùn)行更大的 AI 模型之外,集成的 CPU-GPU 全局內(nèi)存對(duì) HPC 應(yīng)用程序也非常有益。請(qǐng)考慮最近HPCwire 的一篇關(guān)于僅在英特爾兩顆 Xeon 6 Granite Rapids 處理器(無(wú) GPU)上運(yùn)行的 CFD 應(yīng)用程序的故事。根據(jù)作者 Moritz Lehmann 博士的說(shuō)法,模擬的促成因素是他能夠用于模擬的內(nèi)存量。

同樣,許多 HPC 應(yīng)用程序不得不想方設(shè)法繞過(guò)常見 PCIe 連接視頻卡的小內(nèi)存域。使用多張卡或 MPI 有助于擴(kuò)展應(yīng)用程序,但 HPC 中最有利的因素始終是更多內(nèi)存。

當(dāng)然,需要基準(zhǔn)測(cè)試來(lái)確定 DIGITS 項(xiàng)目是否完全適用于桌面 HPC,但還有另一種可能性:“用這些構(gòu)建一個(gè) Beowulf 集群”。這句話通常被認(rèn)為是一個(gè)玩笑,但對(duì)于 DIGITS 項(xiàng)目來(lái)說(shuō)可能更嚴(yán)肅一些。當(dāng)然,集群是用服務(wù)器和(多個(gè))PCEe 連接的 GPU 卡構(gòu)建的。然而,一個(gè)小型、中等功率、完全集成的全局內(nèi)存 CPU-GPU 可能會(huì)成為更平衡、更有吸引力的集群構(gòu)建塊。還有一個(gè)好處:它們已經(jīng)運(yùn)行 Linux 并具有內(nèi)置的 ConnectX 網(wǎng)絡(luò)。

本文轉(zhuǎn)自“半導(dǎo)體行業(yè)觀察”微信公眾號(hào);智通財(cái)經(jīng)編輯:陳筱亦。

你可能想看:

轉(zhuǎn)載請(qǐng)注明來(lái)自綿陽(yáng)綿城稅務(wù)師事務(wù)所,本文標(biāo)題:《英偉達(dá)這顆芯片,震驚所有人》

每一天,每一秒,你所做的決定都會(huì)改變你的人生!

發(fā)表評(píng)論

快捷回復(fù):

評(píng)論列表 (暫無(wú)評(píng)論,3人圍觀)參與討論

還沒有評(píng)論,來(lái)說(shuō)兩句吧...

Top
網(wǎng)站統(tǒng)計(jì)代碼
主站蜘蛛池模板: 青河县| 丰镇市| 临沭县| 赤峰市| 濮阳市| 万全县| 民权县| 临西县| 高密市| 金阳县| 科技| 乌拉特前旗| 那坡县| 云浮市| 延寿县| 林周县| 清涧县| 米脂县| 和田市| 石景山区| 新绛县| 阿鲁科尔沁旗| 邵武市| 延川县| 龙井市| 绥棱县| 登封市| 宁安市| 南康市| 阜平县| 二连浩特市| 沙田区| 九龙坡区| 永年县| 绥阳县| 宣汉县| 泉州市| 瑞安市| 阜新市| 青海省| 维西|