以客戶(hù)為中心,提供定制化或一站式的全棧解決方案,賦能千行百業(yè)
高性能計算(High performance computing) 指通常使用很多處理器(作為單個(gè)機器的一部分)或者某一集群中組織的幾臺計算機(作為單個(gè)計算資源操作)的計算系統和環(huán)境。高性能集群上運行的應用程序一般使用并行算法,把一個(gè)大的普通問(wèn)題根據一定的規則分為許多小的子問(wèn)題,在集群內的不同節點(diǎn)上進(jìn)行計算,而這些小問(wèn)題的處理結果,經(jīng)過(guò)處理可合并為原問(wèn)題的最終結果。由于這些小問(wèn)題的計算一般是可以并行完成的,從而可以縮短問(wèn)題的處理時(shí)間。高性能計算在一個(gè)國家的科研中居于基礎性地位,是科技創(chuàng )新的動(dòng)力源之一。以E級超級計算機為代表的高性能計算具有廣闊的應用前景,有望在氣候科學(xué)、可再生能源、基因組學(xué)、天體物理學(xué)以及人工智能等領(lǐng)域“大顯身手”。
寶德公司力推的高性能集群是專(zhuān)門(mén)為滿(mǎn)足大規模分析計算而設計的超級并行計算機集群系統,它遵循 Intel 開(kāi)放的 HPC 生態(tài)體系架構來(lái)系統的部署所有的軟硬件:采用Intel 基于酷睿架構的雙路 Xeon 和多路 Xeon 作為計算節點(diǎn)。寶德高性能計算集群采用集群體系結構,通過(guò)標準開(kāi)放的高速網(wǎng)絡(luò )實(shí)現互連,運行開(kāi)放源代碼的 Linux 系統,對外提供單一系統接口,它針對大規??茖W(xué)并行計算設計,兼顧事務(wù)處理和網(wǎng)絡(luò )信息服務(wù)。
該方案主要通過(guò)構建管理節點(diǎn)、計算節點(diǎn)、以及分布式存儲資源池,構建計算力高達100Tflops以上的計算能力高性能計算集群,存儲采用高性能低延遲得SSD分布式存儲池,以及大容量得HDD分布式存儲池。滿(mǎn)足對于高性能計算力以及高速存儲IO帶寬的需求。
【硬件部分】
計算節點(diǎn):CPU計算節點(diǎn)
管理節點(diǎn):雙路服務(wù)器
登陸節點(diǎn):雙路服務(wù)器
存儲節點(diǎn):分布式并行存儲
網(wǎng)絡(luò )系統:包含以太網(wǎng)絡(luò )系統、 光纖存儲網(wǎng)絡(luò )、機柜、PDU等
【軟件部分】
操作系統:CentOS 7
集群軟件:資源管理與調度軟件Powercloud
開(kāi)發(fā)環(huán)境:Fortran/C/C++等
并行環(huán)境:OpenMP、OpenMPI、MVPAICH2等MPI并行環(huán)境
文件系統:分布式并行文件系統
應用軟件:客戶(hù)自帶應用軟件
計算網(wǎng)絡(luò )采用高速的100G IB網(wǎng)絡(luò ),確保用戶(hù)的計算任務(wù)在運行過(guò)程中不受網(wǎng)絡(luò )帶寬的限制,業(yè)務(wù)網(wǎng)絡(luò )使用25G以太網(wǎng)路,延遲低速度快。兩層高速網(wǎng)絡(luò )保障集群中所有節點(diǎn)無(wú)阻塞、全線(xiàn)速的運行,可充分滿(mǎn)足高速互聯(lián)的需求。
計算節點(diǎn)由寶德四路服務(wù)器組成,每臺四路服務(wù)器可支持4個(gè)英特爾可擴展系列處理器,以及最大96個(gè)內存插槽,多核心計算能力和大內存運行能力,為要求苛刻的HPC和橫向擴展工作負載提供動(dòng)力。
存儲資源分為兩個(gè)分布式資源池,其中SSD存儲池運行重要數據和熱數據,HDD存儲池保存冷數據和大容量數據,同時(shí)兼顧IO性能和容量。
整套集群采用多種可靠性設計方案大幅度提升系統的可靠性,確保系統無(wú)單點(diǎn)故障。同時(shí)為用戶(hù)提供簡(jiǎn)單易用的使用和維護接口,降低系統的使用維護門(mén)檻,提高整套系統的維護效率