設萬維讀者為首頁 廣告服務 聯繫我們 關於萬維
簡體 繁體 手機版
分類廣告
版主:白夫長
萬維讀者網 > 軍事天地 > 帖子
中國首台自研千萬億次超級計算機細節曝光(圖) zt
送交者: 一劍破天 2012年10月22日20:21:45 於 [軍事天地] 發送悄悄話
電腦報

  在監控室中就能隨時查看超級計算機的各個狀態參數

  一塊計算單元的主板,上面有兩顆申威SW1600C處理器

  整套神威藍光超級計算機有多大?這只是其中1/4不到

  擁有為14萬3千枚16核CPU;

  存儲容量高達2PB(1PB等於100萬GB)

  最高帶寬達到69.6TB/s(1TB等於1000GB);

  每秒峰值運算達1.07千萬億次,相當於20萬台普通筆記本同時運算能力;

  ……

  顯然,這不是一台普通的電腦,這是中國首台自主研發CPU和底層系統的千萬億次超級計算機神威藍光。

  10月13日,帶着幾分好奇,電腦報記者來到濟南超級計算機中心,第一次了解到神威藍光的諸多細節,也見到了與這台國產超級計算機朝夕相處的一群科學家。

  走進超級計算機的心臟

  沒有想象中巨大,神威藍光就是一個放大的“0”躺在機房裡,走進它,如果不是旁邊一排商業服務器的噪聲提醒,從外面封閉的外殼難以察覺它的運行。

  國家超級計算濟南中心陳德訓研究員像魔法師為記者打開了三扇門。

-

  第一扇“0”型頭部的一扇門,映入記者眼帘的是晶瑩透明、手指粗細的水管,有序地排列在兩排機架上,與地板下的製冷系統相連,用手摸一下這些水管,都是冰涼的感覺。

  第二扇門打開,是配列整齊的CPU,每排8顆CPU,128個核,一個機架上是一萬億次的計算能力。

  第三扇門打開的時候,就是一個空的橢圓形小房間,“這裡有什麼寶貝?”

  “進來吧,感受一下安靜。”陳德訓邀請記者走進藍光超級計算機的內部,“環形牆”原來是9個計算機倉和2個網絡機倉,除了網絡連線上的指示燈閃爍,這裡簡直可以當着是靜修的空間。

  “這就是神威藍光的主機部分”,總工程師周明忠研究員說包含14萬3千個核的主機只占用60平米的機房,與其龐大的計算能力相比,確實是小巧玲瓏。

  神威藍光從2011年9月整個系統安裝加電測試以來,一直就是保持24小時的開機運行狀態。

  “關鍵是主機的CPU和底層軟件系統全部是國內自主研發生產的,使中國成為繼美國、日本之後,世界上第三個具有獨立研發千萬億次超級計算機的能力的國家。”陳德訓和所有研究員都倍感自豪。

  最神秘的神威藍光的CPU,是全球第一顆16核CPU,比AMD的要早6個月,並行操作系統、虛擬機管理器、多核編譯器、並行編譯器、海量並行文件系統、多核數學庫則是自主研發的軟件成果。

  此時是10月13日中午12:08,從主機房外監控室的屏幕上,看到此刻正忙着的CPU是7760個,系統為正在運行的項目配置了8704顆CPU,屏幕上綠色顯示閒着的CPU主要分布在第3號機倉。

  “正在運行的是什麼計算?”

  “我們並不清楚每個計算項目的具體運行內容,監控主要是看機器性能配置,發現有問題會及時自動處理。”

  “通常一次運算要多少時間?”

  “一天的計算時間是最短的項目,項目一周左右的計算時間比較普遍。”

  “怎麼知道在這裡跑的運算項目沒有暗藏惡意代碼?”

  “運行前有一套安全檢測程序會保證機器安全”研究員對記者的疑問一一耐心解答。

  為什麼每一層有三個電源開關?因為一層有三部電源,兩部是備用的

  水冷散熱系統的儲水管,左邊的小管子用來觀察水位

  系統進程界面,綠色為空閒CPU

  瘋狂博士帶你看超級計算機

  相信各位讀者都曾經看到中國某某超級計算機又勇奪世界排名多少位之類的新聞,對“天河”、“銀河”、“神威藍光”等等關鍵詞記憶猶新。

  不過在我們的想象中,對超級計算機的認識卻僅僅停留在“運算能力比普通電腦強很多”這個層面上。

  到底超級計算機是個什麼樣子?它的各部分硬件和普通電腦有什麼不同?其實包括瘋狂博士自己也想把它弄個明白。10月13日,瘋狂博士親自深入國家超級計算濟南中心,為大家揭開超級計算機神秘的面紗!

  走進神威藍光超級計算機的機房,可以看到很多立式的機櫃,在機房正中間擺成一圈的機櫃正是神威藍光,旁邊排成一行的是常規的X86架構服務器機櫃(從前面的機房布局圖也能看出來)。

  瘋狂博士也見過不少大型機房,不過神威藍光給我的最大印象就是非常安靜!和旁邊發出巨大噪音的X86服務器形成了鮮明的對比。

  超頻用水冷?超算也用水冷!

  經工程師介紹,神威藍光全部採用水冷設計,一是比風冷省電,二是幾乎零噪音(這個我們後面詳細介紹)。

  工程師打開機櫃,一層層的刀片機引入眼帘。經工程師介紹,每一片上有兩顆處理器,每顆處理器有16個物理核心,每顆處理器配備了16GB DDR3內存。

  瘋狂博士發現刀片機上有三個電源開關,原來每一片都配備了三個獨立的電源,就算有一個壞掉,另兩個也能及時補上,大大保證了服務器的可靠性和穩定性(三個一起壞?這幾率太太太小了)。

  從機櫃背後可以看到,各個節點之間是用光纖進行連接的,這樣才能保證足夠的數據帶寬;而刀片機之間是直接用PCB連接的,數據帶寬更高。

  那麼千兆網線這樣顯得比較“慢”的網絡連接是用來做什麼的呢?其實是用來連接監控單元的,監控對於數據帶寬要求很低,所以一般的網絡就行了。

  一提到水冷散熱系統,恐怕大家最先想到的就是發燒玩家玩超頻的必備神器了。

  其實,神威藍光超級計算機也是採用的水冷散熱系統,而且這也是它最有特色的設計之一。

  首先,這套給超級計算機使用的水冷系統非常安靜,基本上可以算是零噪音了;

  其次,它非常節能,遠比常規的散熱系統省電得多,畢竟只需要驅動功率不算大的水泵,而且在冬天,濟南的室外溫度很低,冷卻水在室外實現自然冷卻,散熱效率更高;

  再次,這套水冷散熱系統的運營成本也很低,一年的冷卻水損耗率才30%(其他超級計算機採用的水冷系統蒸發量遠高於它)。

  超算拆開給你看!

  這裡需要說明一下,和我國其他幾個超級計算機中心所用的CPU+GPU方案不同的是,神威藍光採用的是完全自主開發的純CPU方案。

  其中申威SW1600C採用的架構與X86、ARM完全不同,採用自己的編譯器和軟件,具備16個物理核心(一般台式機上最多才8核),頻率為1GHz,每顆CPU搭配16GB DDR3 1066內存。

  看到這裡可能玩家有疑問,怎麼才1GHz?現在台式機的處理器默認頻率都快破4GHz了。其實不能這麼比較,申威SW1600C的架構不同於X86和ARM(X86和ARM兼容的軟件無法直接在它上面運行,因此擁有很好的安全性),而且針對的數據與應用也不同於一般台式機,所以不能單純從頻率來衡量。

  另外,從結構圖上也可以看到,申威SW1600C內部有4個核心組,也就是說每個核心組包含了4個物理核心,由交叉開關來進行動態調節計算負載。

  再來看看一個計算單元的主板,兩顆採用BGA封裝的申威SW1600C直接焊接在主板上面,周圍是DDR3內存顆粒,每顆CPU分配了16GB內存。

  瘋狂博士仔細觀察了一下主板上的供電電路,一共是11+1相供電,相當於高端Z77等主板的供電規格, 看來申威SW1600C的功耗應該和普通台式機處理器差不多!

0%(0)
標 題 (必選項):
內 容 (選填項):
實用資訊
回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐:海航獲五星
海外華人福利!在線看陳建斌《三叉戟》熱血歸回 豪情築夢 高清免費看 無地區限制