時(shí)間:2023-07-28來(lái)源:本站
國內某互聯(lián)網(wǎng)企業(yè),始終以用戶(hù)為中心,不斷加大在新技術(shù)上的研發(fā)投入,持續推動(dòng)服務(wù)零售和商品零售在需求側和供給側的數字化升級,致力于為用戶(hù)提供品質(zhì)服務(wù)。
為了促進(jìn)自身業(yè)務(wù)發(fā)展和提升用戶(hù)體驗,該企業(yè)也向大模型領(lǐng)域發(fā)起進(jìn)軍,希望通過(guò)大模型數據訓練和算法,實(shí)現產(chǎn)品應用的轉型和升級,以提高品牌滿(mǎn)意度。然而,要實(shí)現這一目標,強大的算力是必不可少的。
(圖片來(lái)源于包圖網(wǎng))
算力是人工智能產(chǎn)業(yè)創(chuàng )新的基礎,沒(méi)有算力,做大模型就是天方夜譚。大模型需要處理海量的數據,并且需要在短時(shí)間內完成復雜的計算任務(wù),這就要求更高水平的計算能力。因此,該客戶(hù)迫切需要一款能滿(mǎn)足大模型訓練高性能計算需求的AI算力基礎設施,為海量數據的大規模訓練提供強大算力支撐。
在了解到客戶(hù)的需求之后,寶德量身推薦了一款擁有高強的計算能力的寶德AI訓練服務(wù)器PR4910E。其配備了最先進(jìn)的硬件設施,包括高效的CPU、GPU和TPU等,可以提供強大的計算能力來(lái)支持復雜的AI模型訓練,為該企業(yè)夯實(shí)了AI大模型算力底座。
它采用2顆身懷七大算力神器的第四代英特爾®至強®可擴展處理器,最大可達60核心,并具有13 個(gè)PCIe x16 Gen5插槽,支持10個(gè)全高全長(cháng)雙寬 GPU卡(NVIDIA® Tesla系列、英特爾®GPU Flex系列和昇騰Atlas系列等),可為大模型訓練強有力的算力支撐;它支持32個(gè) DIMM / DDR5內存插槽,支持最新400Gb ETH和NDR IB高速智能網(wǎng)卡,以及 GPU Direct RDMA,最多支持24個(gè) NVMe SSD,且采用CPU 直通設計,大幅降低 I/O 延遲,這些都為大模型數據存儲和傳輸提供高效可靠保證。
此外,它采用整機模塊化設計,支持靈活切換 CPU 和 GPU/TPU 的異構拓撲結構,讓算力發(fā)揮到極致,為各個(gè)場(chǎng)景下的AI應用加速提碼,方便用戶(hù)維護和管理。