高性能計算機范文

時間:2023-03-23 15:32:53

導(dǎo)語:如何才能寫好一篇高性能計算機,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

篇1

從今年7月開始,惠普開展了為期半年、涉及全國20個油田的高性能計算機應(yīng)用巡展,石油行業(yè)用戶對由刀片和集群構(gòu)建的高性能計算機非常熱衷,對這種高性能計算機所表現(xiàn)出的高性能、低能耗、易管理、易擴展等特性贊賞有加。

無獨有偶,隨著最新一期的全球最快計算機排行榜(TOP500)于11月30日出爐,專家關(guān)于刀片+集群快速增長的預(yù)言成真。在TOP500中,采用刀片和集群架構(gòu)的高性能計算機數(shù)量大幅增加,成為TOP500中增長最好的一種類型。惠普入圍TOP500的系統(tǒng)中,95%是采用刀片服務(wù)器。

刀片保證投資回報

早在兩年前,就有專家預(yù)言:未來的2~3年內(nèi),刀片式服務(wù)器將以其高服務(wù)器密度、敏捷式部署維護、全方位監(jiān)控管理融合、高可擴展性與可用性,全面取代傳統(tǒng)基于機架式服務(wù)器的集群系統(tǒng),基于刀片式服務(wù)器的集群系統(tǒng)將得到大量應(yīng)用。

事實表明,基于刀片服務(wù)器的集群系統(tǒng)的潛力正在逐漸釋放。2006年的中國TOP100排行榜顯示,超過70%的系統(tǒng)采用了集群體系結(jié)構(gòu),而值得關(guān)注的是,其中有26套是刀片服務(wù)器集群系統(tǒng),惠普和IBM分別占有13套和11套。在這26套系統(tǒng)中,有17套用于石油勘探,6套用于網(wǎng)絡(luò)游戲。

中國惠普有限公司副總裁,商用產(chǎn)品事業(yè)部總經(jīng)理楊諾礎(chǔ)認為:過去,用戶大量采用基于PC服務(wù)器的集群系統(tǒng),并在過去3~5年成為一個主流發(fā)展方向。不過在最近兩三年,基于刀片服務(wù)器的集群系統(tǒng)開始大范圍推廣應(yīng)用。在中國,石油行業(yè)是采用刀片服務(wù)器最多的一個行業(yè)。

在分析形成這一趨勢的原因時,江漢油田勘探開發(fā)研究院計算機中心的總工程師羅忠輝認為,刀片服務(wù)器作為一種高可用高密度的低成本服務(wù)器平臺,在高密度、易擴展和低成本方面都更適合地震資料處理等石油行業(yè)的關(guān)鍵應(yīng)用需求;同時,刀片式服務(wù)器集群節(jié)點密度高于傳統(tǒng)的1U機柜,占地面積更少,可以在有限的空間整合巨大的運算能力,即使在未來增加更多的節(jié)點,也不需要考慮機房空間問題;在通風(fēng)、耗電等方面,比1U機柜更適合地球物理的應(yīng)用;在密集型的高性能計算中,刀片式服務(wù)器在布線和相互連接方面比傳統(tǒng)的機架式服務(wù)器又有很大的改進。

而楊諾礎(chǔ)認為,石油行業(yè)在IT應(yīng)用上與大部分行業(yè)不一樣的地方是更重視投資回報,IT應(yīng)用與企業(yè)的回報率直接掛鉤,勘探的一個誤差會導(dǎo)致幾十萬美元的成本增加。采用刀片構(gòu)建集群系統(tǒng),可以降低風(fēng)險成本,IT投資回報率比較明顯。

兩大典型應(yīng)用

在中國,高性能計算機應(yīng)用已經(jīng)有十多年的歷史,用戶在選擇適合自己的系統(tǒng)上更顯理性。相比用機架式服務(wù)器構(gòu)建HPC,用刀片構(gòu)建HPC具有更多優(yōu)勢:它可以節(jié)省機柜空間,系統(tǒng)密度高;節(jié)省電力,刀片系統(tǒng)的能耗明顯比機架系統(tǒng)低;容易部署和管理,刀片采用模塊化架構(gòu),需要就可以插入,沒有太多的線纜,都在機架內(nèi)完成;集成了網(wǎng)絡(luò)設(shè)施,可以配置10G光纖通道與Infiniband等。

在中國石油行業(yè),兩大基于刀片的集群系統(tǒng)廣受好評。第一個集群系統(tǒng)是部署在大慶油田公司勘探開發(fā)研究院的刀片服務(wù)器集群地震資料處理系統(tǒng)。該系統(tǒng)采用惠普開發(fā)出的刀片服務(wù)器架構(gòu),集成了692臺惠普第三代服務(wù)器產(chǎn)品――HP BL20PG3、HP DL380G3和HP DL580G3三種服務(wù)器,選用了1432個Intel 至強CPU,其峰值浮點計算能力超過 9.8萬億次,位居中國刀片服務(wù)器集群系統(tǒng)榜首,是國內(nèi)處理規(guī)模最大的地震資料處理系統(tǒng)。該處理系統(tǒng)用于大慶探區(qū)地震資料的高分辨目標(biāo)處理和疊前偏移處理,使大慶油田公司勘探開發(fā)研究院具備了二維地震資料目標(biāo)處理2萬公里、三維疊前偏移處理1萬平方公里的年處理能力。

刀片服務(wù)器集群系統(tǒng)采用惠普的刀片服務(wù)器架構(gòu)。整個系統(tǒng)由常規(guī)計算節(jié)點、偏移計算節(jié)點、管理節(jié)點、I/O節(jié)點、核心交換網(wǎng)絡(luò)和管理網(wǎng)絡(luò)組成,并安裝了Redhat Linux AS 3.5版本操作系統(tǒng)、CMU和SIM集群管理及監(jiān)控等系統(tǒng)軟件,利用惠普公司開發(fā)的iLO高級管理技術(shù),實現(xiàn)服務(wù)器集群的遠程管理。常規(guī)計算節(jié)點采用200多臺HP ProLiant BL20pG3刀片服務(wù)器,千兆網(wǎng)絡(luò)端口直聯(lián),安裝在6個機柜中。HP ProLiant BL20pG3采用2個Intel 至強3.4 GHz DP處理器。而偏移計算節(jié)點則采用400多臺HP ProLiant BL20pG3。

另一個典型系統(tǒng)部署在中國地球物理界最大的專業(yè)服務(wù)公司――中國石油集團東方地球物理公司研究院大港分院。大港分院采用了HP高性能計算集群系統(tǒng),以HP刀片式服務(wù)器作為計算節(jié)點,實現(xiàn)二維常規(guī)處理12000公里、三維常規(guī)處理6000平方公里、迭前偏移處理3000平方千米的年處理能力,使大港分院地震資料處理能力和處理水平大幅度提升。

大港分院選用了由HP提供的包括硬件和軟件在內(nèi)的整套高性能計算方案,包括119個HP ProLiant BL20P節(jié)點、14個基于Intel至強處理器ProLiant DL380G2作為I/O節(jié)點,以集群技術(shù)組成超級并行計算機作為地震資料處理的主機系統(tǒng),共131個節(jié)點,262個處理器,整體計算能力實現(xiàn)浮點計算達1.4萬億次/秒。

在整套系統(tǒng)中,硬件系統(tǒng)包括:I/O節(jié)點采用主頻為3.06Hhz的HP ProLiant DL380G2 2U機架式服務(wù)器,計算節(jié)點采用主頻為2.8Hhz的HP ProLiant BL20pG2刀片式服務(wù)器,監(jiān)控分發(fā)節(jié)點采用HP ProLiant DL380G2 2U機架式服務(wù)器,物理節(jié)點采用HP ProLiant DL360 1U機架式服務(wù)器,互連網(wǎng)絡(luò)系統(tǒng)采用HP ProCurve Switch 高性能網(wǎng)絡(luò)交換機,每套PC-Cluster計算機系統(tǒng)由兩個網(wǎng)絡(luò)系統(tǒng)組成,一個為高性能的千兆以太網(wǎng)傳輸數(shù)據(jù)信息,一個為10/100快速以太網(wǎng)傳輸管理控制信息;存儲系統(tǒng)采用HP Smart Array機群陣列盤柜。

管理和服務(wù)最被看重

那么,用戶選擇刀片的標(biāo)準(zhǔn)是什么?江漢油田勘探開發(fā)研究院計算中心總工程師羅中輝指出,用戶最看重的是管理和服務(wù)。大港分院副總工程師兼計算機服務(wù)中心主任張武斌也認為,以刀片服務(wù)器為節(jié)點的高性能集群系統(tǒng)試運行以來,最大的感覺之一就是系統(tǒng)管理方便了。HP提供的集群系統(tǒng)管理軟件Cluster Management Utility管理功能全面,還具有遠程管理特性,使用戶能夠在任何終端管理集群系統(tǒng),查看機器的運行狀況?!艾F(xiàn)在,我們在自己的辦公室里就可以管理這套系統(tǒng),不必再跑到機房了,非常便捷?!?/p>

集群系統(tǒng)管理軟件Cluster Management Utility(CMU)是一個Beowulf Cluster系統(tǒng)環(huán)境下的管理軟件,它提供了友好的圖形用戶界面。比如,CMU使用了RILOE板并集成了iLO的特性,使遠程文本控制臺在服務(wù)器的所有狀態(tài)下均可遠程控制服務(wù)器電源。無論服務(wù)器處于何種狀態(tài),遠程BIOS設(shè)置借助獨立于CMU的WEB瀏覽器,遠程訪問圖形控制臺。由于CMU具有將一個節(jié)點的系統(tǒng)磁盤分區(qū)克隆到其他集群節(jié)點的能力,能夠避免對集群中各節(jié)點進行系統(tǒng)安裝或配置所帶來的耗時、費力的工作,這一特性使大港分院能夠在3天內(nèi)就完成了集群系統(tǒng)的安裝。

篇2

關(guān)鍵詞:科學(xué)計算;大數(shù)據(jù)處理;超級計算機;模擬仿真;并行計算

1引言

在現(xiàn)代科學(xué)研究和工程實踐中,通常使用數(shù)學(xué)方程式來表示某些自然科學(xué)規(guī)律,產(chǎn)生了眾多復(fù)雜繁瑣的數(shù)學(xué)計算問題[1]?;谄胀ㄓ嬎愎ぞ邅斫鉀Q這些問題,將耗費大量人力物力,甚至無法得到準(zhǔn)確結(jié)果。而科學(xué)計算[2],利用計算機仿真、重現(xiàn)、預(yù)測或探索自然世界萬物運動規(guī)律和演變特性的全過程,通過研究合理的計算方法,設(shè)計高效的并行算法,研制合適的應(yīng)用程序,能準(zhǔn)確、高效地模擬各領(lǐng)域研究過程,分析計算結(jié)果。然而,普通計算機的科學(xué)計算能力往往是有限的,現(xiàn)有的計算能力無法高效地解決某些基礎(chǔ)學(xué)科和工程技術(shù)部門的科學(xué)計算問題,如長期天氣預(yù)報、石油勘探、飛機整體氣動力等等。

與此同時,地震檢測儀、粒子碰撞器、天文望遠鏡以及高通量分析裝置等大型科學(xué)儀器的研制和發(fā)展[3],產(chǎn)生了大量非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù),使得“大數(shù)據(jù)”趨勢變得越來越突出[4]。如今,許多科學(xué)發(fā)現(xiàn)和見解由大量數(shù)據(jù)集驅(qū)動,“大數(shù)據(jù)”被認為是除了實驗、理論和計算方法之外的第四種科學(xué)范式[5]。數(shù)據(jù)生成的容量、速度和多樣性構(gòu)成了分析大數(shù)據(jù)的主要挑戰(zhàn)。

為提高科學(xué)計算能力,解決大數(shù)據(jù)問題,高性能計算(HPC)[6]技術(shù)迅猛發(fā)展。高性能計算機代表用于解決計算密集型科學(xué)和工程問題的高端計算基礎(chǔ)設(shè)施。我國的高性能計算早已突破每秒浮點運算千萬億次的壁壘,并繼續(xù)解決性能、可擴展性、可編程性、能效和可靠性等問題,探索新的支持技術(shù)以達到e級計算能力。

目前,高性能計算機已在多個領(lǐng)域得到了成功的應(yīng)用[7],但仍存在大量可供多個研究機構(gòu)使用的空閑節(jié)點。本文簡介了一些高性能計算機系統(tǒng)及其性能,針對近年來在高性能計算機上的各大領(lǐng)域應(yīng)用實例進行總結(jié),并對在其他領(lǐng)域的應(yīng)用做出了展望,以促進更高效、全面地使用高性能計算機。

2高性能計算機系統(tǒng)概述

中國首臺千萬億次超級計算機,是“天河一號”?!疤旌右惶枴背売嬎銠C使用由中國自行研發(fā)的“龍”芯片,其峰值計算速度能夠達到1.206TFlop/s,同時Linpack實測性能達到了0.563TFlop/s,該超級計算機位居當(dāng)時公布的中國超級計算機前100強之首,中國成為了繼美國之后世界上第二個能夠自主研制千萬億次超級計算機的國家。

天河一號采用6144個英特爾通用多核處理器和5120個AMD圖形加速處理器,其內(nèi)存總?cè)萘?8TB。至于點對點通信的帶寬就達到了40Gbps,而其用于共享的磁盤總?cè)萘縿t達到1PB。該超級計算機系統(tǒng)部署于天津濱海新區(qū)的國家超級計算天津中心作為業(yè)務(wù)主機。

2013年,由國防科學(xué)技術(shù)大學(xué)研制的“天河二號”大型超級計算機以每秒33.86千萬億次的浮點運算速度成為全球最快的超級計算機,位列國際大型超級計算機TOP500榜首。隨后,“天河二號”實現(xiàn)了世界最快超算“六連冠”。天河二號采用基于加速器的架構(gòu)[8]。在可接受的總成本、功率預(yù)算、支持可靠性、可用性和可服務(wù)性(RAS)的能力、應(yīng)用開發(fā)和移植的復(fù)雜性下提供高的計算性能。

天河二號的硬件系統(tǒng)由五個子系統(tǒng)組成,包括計算系統(tǒng)、通信系統(tǒng)、存儲系統(tǒng)、監(jiān)控診斷系統(tǒng)和服務(wù)系統(tǒng)。它由16000個節(jié)點組成,每個節(jié)點有2顆基于IvyBridge-EXeonE52692處理器和3顆XeonPhi,每個節(jié)點的內(nèi)存是64GB。所有的計算節(jié)點都通過專有的高速互連系統(tǒng)連接。還提供了一個服務(wù)子系統(tǒng)的4096個節(jié)點,以加快高吞吐量的計算任務(wù),如大數(shù)據(jù)處理。存儲子系統(tǒng)包括256個I/O節(jié)點和64個容量為12.4PB的存儲服務(wù)器。天河二號文件系統(tǒng)命名為h2fs,采用麒麟操作系統(tǒng)、基于SLURM的全局資源管理。支持大多數(shù)現(xiàn)代編程語言,包括C、C++、Java、Python等。采用的是新型異構(gòu)多態(tài)體系結(jié)構(gòu)(Multipurpose-Heterogeneous)[9]。

天河二號的系統(tǒng)配置列于表1中。

“天河二號”集科學(xué)計算、大數(shù)據(jù)分析和云計算于一體,被認為是滿足工業(yè)和社會需求的戰(zhàn)略基礎(chǔ)設(shè)施。以超級計算機為支撐的高性能計算應(yīng)用正加速向各個領(lǐng)域滲透。

Table1SystemindicatorsofTianhe-2

表1天河二號系統(tǒng)指標(biāo)

width=375,height=252,dpi=110

在國內(nèi)早期的高性能計算機研究中,2004年6月超級計算機曙光4000A研制成功,落戶上海超級計算中心,標(biāo)志著繼美國和日本之后,中國是第三個能研制10萬億次高性能計算機的國家。曙光能夠每秒運算11萬億次,進入全球超級計算機前十名。經(jīng)過十多年發(fā)展,曙光E級高性能計算機系統(tǒng)項目現(xiàn)在是國家“十三五”期間高性能計算的重點專項,其最顯著的特點是突破了制約E級計算發(fā)展的各個關(guān)鍵技術(shù),通過這樣原型機的研制去驗證E級的技術(shù)路線,為未來真正實現(xiàn)國產(chǎn)E級系統(tǒng)做技術(shù)鋪墊。

width=642,height=303,dpi=110

Figure1StructureofSugon’sCPU

圖1曙光CPU結(jié)構(gòu)

在2016年法蘭克福世界超算大會上,“神威·太湖之光”超級計算機系統(tǒng)成為新的榜首,速度較第二名“天河二號”快出近兩倍,效率提高三倍。

神威·太湖之光超級計算機由40個運算機柜和8個網(wǎng)絡(luò)機柜組成。每個運算機柜包含4塊由32塊運算插件組成的超節(jié)點。每個插件由4個運算節(jié)點板組成,一個運算節(jié)點板又含2塊“申威26010”高性能處理器。一臺機柜就有1024塊處理器,整臺“神威·太湖之光”共有40960塊處理器。每個單個處理器有260個核心,主板為雙節(jié)點設(shè)計,每個CPU固化的板載內(nèi)存為32GBDDR3-2133。

在2018年的法蘭克福世界超算大會上,美國能源部橡樹嶺國家實驗室(ORNL)推出的新超級計算機“Summit”以每秒12.23億億次的浮點運算速度,接近每秒18.77億億次峰值速度奪冠,“神威·太湖之光”屈居第二。

3高性能計算機各大領(lǐng)域應(yīng)用實例分析

為充分發(fā)揮高性能計算機的優(yōu)勢,極大限度地滿足客戶需求,自超級計算機在中國開始發(fā)展以來,相關(guān)團隊都致力于擴展高性能計算在各個領(lǐng)域的利用,迎合各領(lǐng)域應(yīng)用的計算要求,協(xié)助用戶配置應(yīng)用環(huán)境,建立高效模型,設(shè)計合理并行算法,以實現(xiàn)各領(lǐng)域的科學(xué)計算和大數(shù)據(jù)處理在高性能計算機上的應(yīng)用。

3.1生物計算與精準(zhǔn)醫(yī)療

根據(jù)廣州國家超級計算中心的內(nèi)部統(tǒng)計[10],生物醫(yī)學(xué)相關(guān)應(yīng)用現(xiàn)在是超級計算中心的主要客戶。生物醫(yī)學(xué)研究主要包括生物大分子的結(jié)構(gòu)模擬與功能建模,藥物設(shè)計與篩選,蛋白質(zhì)序列分析,基因序列分析與比對,基因調(diào)控網(wǎng)絡(luò)的分析與建模,醫(yī)療衛(wèi)生的雙數(shù)據(jù)分析及生物醫(yī)學(xué)文獻挖掘等。

生物醫(yī)學(xué)數(shù)據(jù)繁多,且一直呈指數(shù)增長。如世界最大的生物數(shù)據(jù)保存者之一,歐洲生物信息學(xué)研究所(EBI),存儲超過20PB的數(shù)據(jù),并且最近每年的數(shù)據(jù)量都增加一倍[11]。數(shù)據(jù)源的異質(zhì)性,包括基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)、微陣列數(shù)據(jù)、文獻等,使其更加復(fù)雜。

針對典型類型的大數(shù)據(jù)——基因組大數(shù)據(jù),在大數(shù)據(jù)框架(如Hadoop和Spark)的幫助下,云計算已經(jīng)在大數(shù)據(jù)處理中發(fā)揮著積極作用。現(xiàn)在,HPC在中國的快速發(fā)展使得以不同的方式解決基因組大數(shù)據(jù)挑戰(zhàn)成為可能。Yang等人[12]強調(diào)了在現(xiàn)代超級計算機上增強大數(shù)據(jù)支持的必要性,提出只需單個命令或單個shell腳本就能使當(dāng)前的大數(shù)據(jù)應(yīng)用在高性能計算機上運行,并且支持多個用戶同時處理多個任務(wù)的Orion作為高性能計算機的大數(shù)據(jù)平臺。該平臺可以根據(jù)大數(shù)據(jù)處理需求,合理分配所需的資源量,并使用HPC系統(tǒng)軟件棧自動建立和配置可回收的Hadoop/Spark集群。以華大基因提供的基因組學(xué)大數(shù)據(jù)作為案例研究,測試基因組分析流水線SOAPGaea的FASTQ過濾、讀取對齊、重復(fù)刪除和質(zhì)量控制四個過程,證明了Orion平臺的高效性。

為更好地了解基因的精細結(jié)構(gòu)、分析基因型與表現(xiàn)型的關(guān)系、繪制基因圖譜,DNA序列分析成為生物醫(yī)學(xué)中的重要課題[12]。

DNA序列的排序是對DNA序列分析的基礎(chǔ)[13]。通常先使用測序儀得到生物體基因組的一些片段,再利用計算機對片段進行denovo拼接,從而得到DNA序列的排列順序。而隨著測序儀的發(fā)展,基因組的數(shù)據(jù)量增大,分析復(fù)雜性提高,普通計算工具分析數(shù)據(jù)會消耗大量時間和空間。張峰等人[14]基于高性能計算機,使用一種新型序列拼接工具SGA(StringGraphAssernbler),對任務(wù)之間數(shù)據(jù)耦合度小的分批構(gòu)建FM-Index,采用粗粒度的多進程并行;對任務(wù)之間數(shù)據(jù)耦合度較大的FM-Index合并過程,采用多線程的細粒度并行。這種多進程與多線程的混合并行策略,使用并行計算代替通信開銷,測試小規(guī)模數(shù)據(jù)時,將索引構(gòu)建時間的最佳性能提高了3.06倍。葉志強等人[15]在基因組排序時,引入隨機listranking算法,基于高性能計算機,使用MPI并行實現(xiàn)Pregel框架的線性化步驟,利用節(jié)點之間的通信和計算能力,減少了線性化步驟時間。

SNP(單核苷酸多態(tài)性)檢測是DNA序列分析的關(guān)鍵步驟[16]。它將對齊的read、參考序列和被編排的數(shù)據(jù)庫(如數(shù)據(jù)庫SNPP)作為輸入,通過站點檢測對齊的read和引用站點的信息,生成SNP站點的列表。SNP檢測工具SoAPSNP可以用一個多星期的時間來分析一個覆蓋20倍的人類基因組。崔英博等人[17]通過重新設(shè)計SOAPSNP的關(guān)鍵數(shù)據(jù)結(jié)構(gòu)以降低內(nèi)存操作的開銷,設(shè)計CPU與XeonPhi協(xié)作的協(xié)調(diào)并行框架,以獲得更高的硬件利用率。并提出了一種基于讀取的窗口劃分策略(RWD),在多個節(jié)點上提高吞吐量和并行規(guī)模,開發(fā)了SOAPSNP的并行版本MSNP,在沒有任何精度損失的情況下,利用高性能計算機的一個節(jié)點實現(xiàn)了45倍的加速。

方翔等人[18]利用高性能計算機,構(gòu)建了由基因組與轉(zhuǎn)錄組測序數(shù)據(jù)分析、蛋白質(zhì)結(jié)構(gòu)預(yù)測和分子動力學(xué)模擬三個功能模塊組成的生物信息平臺分析水產(chǎn)病原,對約氏黃桿菌等多種水生動物病原進行生物信息學(xué)分析。

從生物醫(yī)學(xué)文獻中提取有價值的信息的一種主流方法是在非結(jié)構(gòu)化文本上應(yīng)用文本挖掘方法。然而,大量的文獻需要分析,這對文本挖掘的處理效率提出了巨大的挑戰(zhàn)。彭紹亮等人[19]將針對疾病實體識別的軟件DNorm加入可高效識別基因、蛋白質(zhì)、藥物、基因通路等實體關(guān)系的文本挖掘工具PWTEES流水線中,擴充了PWTEES的功能。使用LINNAEUS導(dǎo)入MEDLIN數(shù)據(jù)庫提供的摘要,并在個人賬戶目錄下,動態(tài)使用計算節(jié)點,編譯安裝配置了非關(guān)系型數(shù)據(jù)庫(MySQL),將大量非結(jié)構(gòu)化數(shù)據(jù)(文獻)轉(zhuǎn)為結(jié)構(gòu)化數(shù)據(jù)。將平時在普通服務(wù)器上需100天能完成的文本挖掘過程縮短為1小時,并利用200個進程并行挖掘7萬篇頭頸癌相關(guān)文獻中的關(guān)鍵命名實體,得到了80%以上的并行效率。Xing等人[20]開發(fā)了一個可運行的框架PARABTM,它能夠在超級計算機上實現(xiàn)并行文本挖掘。以GNormPlus、tmVar2.0、Dnorm三種命名實體識別任務(wù)為例,對多個數(shù)據(jù)集上PARABTM的性能進行了評價。結(jié)果表明,使用PARABTM并行處理策略中的短板匹配負載平衡算法(Short-Boardloadbalancingalgorithm),最大程度地提高了生物醫(yī)學(xué)命名實體識別的處理速度。

3.2全數(shù)字設(shè)計與制造

數(shù)字設(shè)計與制造是一種以計算機系統(tǒng)為中心的集成制造方法。隨著制造工廠中計算機系統(tǒng)數(shù)量和質(zhì)量的提高,數(shù)字化趨勢迅速。越來越多的自動化工具被用于制造工廠,有必要對所有機器、工具和輸入材料進行建模、模擬和分析,以優(yōu)化制造過程。而模擬能夠建模和測試一個系統(tǒng)行為特性,讓工程師能夠用更低耗、更快速同時更安全的方式來分析所做的設(shè)計會產(chǎn)生什么樣的影響。模擬的應(yīng)用范圍廣泛,涵蓋了產(chǎn)品設(shè)計、過程設(shè)計以及企業(yè)資源安排[21]。在模擬過程中,利用超級計算機強大的計算能力,使工程師能在幾分鐘或幾小時內(nèi)仿真和測試數(shù)千種設(shè)計方案。

利用數(shù)字化的方式,可以對產(chǎn)品進行結(jié)構(gòu)力學(xué)分析、流體力學(xué)分析、電磁設(shè)計和多物理場模擬等多種計算仿真。

在計算流體力學(xué)CFD(CcomputationalFluidDynamics)領(lǐng)域的一大熱點研究問題就是如何在當(dāng)前主流的眾核異構(gòu)高性能計算機平臺上進行超大規(guī)模計算。楊梅芳等人[22]在高性能計算機的單個節(jié)點上,利用超然沖壓發(fā)動機燃燒數(shù)值模擬軟件LESAP模擬一個實際發(fā)動機燃燒化學(xué)反應(yīng)和超聲速流動的問題,采用OpenMP4.0編程標(biāo)準(zhǔn),向量化SIMD,優(yōu)化數(shù)據(jù)傳輸過程,均衡基于網(wǎng)格塊劃分的負載技術(shù),實現(xiàn)了軟件面向CPU+MIC異構(gòu)平臺的移植,達到了3.07倍的性能加速比。王勇獻等人[23]面向高性能計算機探索了高階精度CFD流場數(shù)值模擬程序的高效并行性。在高性能異構(gòu)并行計算平臺上進行了多個算例的數(shù)值模擬的結(jié)果顯示最大CFD規(guī)模達到1228億個網(wǎng)格點,共使用約59萬CPU+MIC處理器核,實現(xiàn)了移植后的性能大幅度提高。通過將算法移植到超級計算機進行大規(guī)模并行,能夠?qū)崿F(xiàn)高效的流體力學(xué)分析。而文獻[24-26]都是針對空氣動力學(xué)中的具體分類利用高性能計算機進行模擬以驗證有效性的研究。利用數(shù)字化設(shè)計,能夠快速低成本地對設(shè)計性能進行分析評估。

在圖像模擬中,Metropolis光傳輸算法能夠利用雙向路徑跟蹤構(gòu)建出由眼睛到光源的路徑,是MonteCarlo方法的變體。然后,使用Metropolis算法靜態(tài)計算圖像中光線的恰當(dāng)?shù)纳⑸錉顟B(tài),由一條已發(fā)現(xiàn)的光到眼睛的路徑,能搜索到鄰近路徑。簡單地說,Metropolis光傳輸算法能夠生成一條路徑并存儲其上的節(jié)點,同時能通過添加額外節(jié)點來調(diào)整并生成新的路徑。隨著對照片級真實感圖像的要求越來越高,為Metropolis光傳輸算法開發(fā)高效且高度可擴展的光線跟蹤器變得越來越重要。主要是渲染圖像通常需要花費大量時間,開發(fā)高效且高度可擴展的光線跟蹤器的困難來自不規(guī)則的存儲器訪問模式、光攜帶路徑的不平衡工作量以及復(fù)雜的數(shù)學(xué)模型和復(fù)雜的物理過程。Wu等人[27]提出了一種基于物理的高度可擴展的并行光線追蹤器,并在高性能計算機上進行了實現(xiàn),利用多達26400個CPU內(nèi)核,證明了其可擴展性,能夠從復(fù)雜的3D場景生成逼真圖像。

模擬高場非局部載流子傳輸同樣需要3DMonteCarlo模擬方法,通過適當(dāng)?shù)牧孔有Uw散射效應(yīng),半經(jīng)典的MC模擬能夠給出準(zhǔn)確的結(jié)果。但是,MC方法中3D模擬和量子校正都需要巨大的計算資源[28],由效率出發(fā)超級計算機的計算能力就至關(guān)重要了。文獻[29]中,通過在高性能計算機上使用IntelMIC協(xié)處理器,進一步提高了之前工作中開發(fā)的3D并行的繼承MC模擬器的并行效率。

對于高性能計算機在全數(shù)字設(shè)計和制造領(lǐng)域的集成應(yīng)用,國家超級計算廣州中心推出了天河星光云超算平臺,以云服務(wù)的方式提供CAE計算和HPC訪問,大大降低了數(shù)字設(shè)計的門檻,支持產(chǎn)品設(shè)計的全工作流。目前基于該平臺支撐的項目有諸如國產(chǎn)大飛機、高鐵等,都是國家工業(yè)生產(chǎn)中重要項目[30]。

3.3地球科學(xué)與環(huán)境工程

基于該應(yīng)用領(lǐng)域,超級計算機的主要作用在于變革對自然界中諸如地理狀況、海洋、大氣等種種元素的模擬方式。以超算為平臺,不僅能模擬出地球上每個時期的狀況,甚至是對宇宙中的種種同樣能進行模擬分析,讓地球科學(xué)和環(huán)境工程的研究范圍不再限于此時此地,而是更廣闊的空間。

在宇宙學(xué)的層面,早在2015年就利用高性能計算機模擬出宇宙大爆炸后1600萬年之后至今約137億年的暗物質(zhì)和中微子的演化過程,并將進一步尋找宇宙邊界的報告[31]。中微子雖然是自然界中的基本粒子之一,在宇宙大爆炸約1s后與其他等離子體物質(zhì)退耦,形成看不見的宇宙背景,通過物理實驗和實際的天文觀測都無法精確測量中微子的質(zhì)量。在高性能計算機平臺上,利用3萬億粒子來對宇宙中的中微子和暗物質(zhì)的分布和演化進行模擬,開創(chuàng)了宇宙學(xué)中獨立測量中微子質(zhì)量的道路。

在地球外圍層面上,大氣變化同樣是一個關(guān)注點。Xue等人[32]提出了一種基于高性能計算機的全球性大氣動態(tài)模擬的混合算法。通過使用更靈活的域分區(qū)方案來支持節(jié)點中任意數(shù)量的CPU和加速器,算法能夠充分利用超算的優(yōu)良性能。當(dāng)使用8664個節(jié)點,包括了近170萬個核心時,可以有效地利用節(jié)點內(nèi)的三個MIC卡,對兩個IvyBridgeCPU(24個內(nèi)核)實現(xiàn)4.35倍的加速?;诔晒Φ挠嬎?通信重疊,算法分別在弱和強縮放測試中實現(xiàn)了93.5%和77%的并行效率。

相較于廣袤無邊的宇宙,大部分人們對于腳下的土地更加關(guān)心。自然災(zāi)害如地震、泥石流等,可能會造成巨大的生命財產(chǎn)損失,而地下油氣資源又是經(jīng)濟社會發(fā)展所必需的,利用超級計算機去探索大地也是發(fā)展所需要的。

中石油集團開發(fā)的用于石油油氣勘探的GeoEast系統(tǒng)已經(jīng)經(jīng)過了十幾年的發(fā)展更新,在數(shù)據(jù)模型、數(shù)據(jù)共享、一體化運行模式、三維可視化、交互應(yīng)用框架、地震地質(zhì)建模、網(wǎng)絡(luò)運行環(huán)境和并行處理方面取得了多項創(chuàng)新與重大技術(shù)突破,是地震數(shù)據(jù)處理解釋一體化系統(tǒng)。目前GeoEastV3.0版本軟件總體達到國際同類軟件先進水平,為推動中國石油勘探開發(fā)領(lǐng)域不斷取得新成果發(fā)揮了重要作用[33]。但是,這樣的一體化系統(tǒng)在使用中勢必會產(chǎn)生大量的數(shù)據(jù),這就對計算機的性能有了要求。因此,在GeoEast系統(tǒng)聞名世界的過程中,高性能計算機在幕后是功臣之一,保證了系統(tǒng)的順利運行,助力石油勘探工作[34]。而文獻[35]專注于地震模擬,提出了針對英特爾至強處理器的對于軟件SeisSol的優(yōu)化,以適用于高性能計算機的計算環(huán)境中,通過全摩擦滑動和地震波的耦合仿真實現(xiàn)了空前復(fù)雜的地震模型。移植到高性能計算機的SeisSol提供近乎最佳的弱縮放,在8192個節(jié)點上達到8.6DP-PFLOPS,在所利用的整個高性能計算機上能達到18~20DP-PFLOPS,成功模擬了1992年蘭德斯地震。

3.4智慧城市云計算

城市發(fā)展經(jīng)過多年的調(diào)整,已經(jīng)在經(jīng)濟上有了相當(dāng)進展,目前從如何讓人們生活更加便捷出發(fā),許多地區(qū)開始建設(shè)智慧城市。智慧城市(SmartCity)是指利用各種信息技術(shù)或創(chuàng)新意念,集成城市的組成系統(tǒng)服務(wù),以提升資源運用的效率,優(yōu)化城市管理和服務(wù),進而能夠提高居民生活質(zhì)量。智慧城市的發(fā)展不僅僅是對生活的改變,還能促進生產(chǎn)方式的轉(zhuǎn)變,解決在城市擴張及經(jīng)濟高速發(fā)展中產(chǎn)生的一系列“城市病”問題。智慧城市,代表的是城市的智慧,由智慧,能夠衍生出智能中、知識和數(shù)字等更廣泛的內(nèi)涵[36]。

迄今為止,廣州、北京、上海、寧波、無錫、深圳、武漢、佛山等國內(nèi)城市已紛紛啟動“智慧城市”戰(zhàn)略,相關(guān)規(guī)劃、項目和活動漸次推出。高性能計算機云平臺應(yīng)運而生,為智慧城市建立堅實、先進的基石。智慧城市由于其性能需求,對依賴的平臺的計算能力的要求會更高,而超算的計算能力就能為智慧城市的建設(shè)提供相當(dāng)助力。在2014年,就有中國首臺千萬億次超級計算機“天河一號”在智慧城市中應(yīng)用的報道,以其在天津濱海區(qū)的應(yīng)用為例,“天河一號”的建筑信息領(lǐng)域的大數(shù)據(jù)平臺通過對建筑信息建模,實現(xiàn)對建筑物從規(guī)劃、設(shè)計、建造到后期物業(yè)管理理的全程數(shù)字化。此外,城市規(guī)劃、氣象預(yù)測、生物醫(yī)療、裝備制造、汽車碰撞模擬等行業(yè),也能更多地通過“天河一號”,實現(xiàn)大批量數(shù)據(jù)計算、分析和存儲[37]。

而高性能計算機的持續(xù)計算速度進一步達到了億億次,所能提供的服務(wù)質(zhì)量也更高,麒麟云平臺被部署在1920個節(jié)點(15個機柜),其中64個節(jié)點(兩個機框)作為云平臺控制節(jié)點,其余節(jié)點為運行虛擬機的計算節(jié)點和分布式存儲的存儲節(jié)點。為方便管理,將計算節(jié)點進行分區(qū)管理,512個節(jié)點(4個機柜)為一區(qū),用于滿足生產(chǎn)環(huán)境、適配環(huán)境、測試環(huán)境需要。分布式存儲沒有分區(qū),所有節(jié)點形成一個全局的分布式存儲池,但在使用時可按需劃分指定容量的區(qū)域供不同用途使用[38]。這種云超算服務(wù)采用麒麟安全云系統(tǒng)實現(xiàn)虛擬化技術(shù),將虛擬機資源遠程推送給用戶使用[39]??赏ㄟ^互聯(lián)網(wǎng)遠程管理虛擬機資源,使高性能計算機云平臺資源能夠被更多人使用,超算的計算能力能夠更好地推動社會各個領(lǐng)域發(fā)展。2017年OpenStack的第15個版本中,麒麟云團隊在核心功能解決的Bug數(shù),以及Commits的數(shù)量均進入全球前20,麒麟云的發(fā)展是非常迅速的,與開源社區(qū)緊密結(jié)合,貢獻突出[40]。

3.5材料科學(xué)與工程

在材料科學(xué)與工程的研究中,量子力學(xué)、經(jīng)典動力學(xué)、統(tǒng)計力學(xué)是三大基礎(chǔ)且主要的研究方向。研究人員致力于材料參數(shù)的建模、多尺度平臺開發(fā)和新材料的設(shè)計、開發(fā)和優(yōu)化。

分子動力學(xué)模擬在材料科學(xué)、生物化學(xué)和生物物理學(xué)等領(lǐng)域得到了廣泛的應(yīng)用。分子動力學(xué)(MD)是研究分子和分子的物理運動的計算機模擬方法,它提供分子尺度上的微觀取樣?;谀芰考毣妮o助建模AMBER(AssistedModelBuildingwithEnergyRefinement)[41]是用于MD模擬的使用最廣泛的軟件包之一。然而,對于具有百萬原子級的系統(tǒng)的AMBERMD模擬的速度仍然需要改進。彭紹亮等人[42]在單CPU上的細粒度OpenMP并行、單節(jié)點CPU/MIC并行優(yōu)化和多節(jié)點多MIC協(xié)作并行加速方面進行了改進。在高性能計算機上實現(xiàn)AMBER的并行加速策略,與原程序相比,實現(xiàn)了25~33倍的最高加速比。同時,對于計算資源的限制,分子動力學(xué)軟件GROMACS不能大規(guī)模地進行滿意的操作。Wang等人[43]提出了一種利用卸載模式加速GROMACS的方法。為了提高GROMACS的效率,提出了異步化、數(shù)據(jù)重組和數(shù)組重用等一系列方法。在這種模式下,GROMACS可以與CPU和IntelXeonPHITM多個集成內(nèi)核(MIC)協(xié)處理器同時有效地配置,充分利用高性能計算機資源。

材料輻照效應(yīng)(Materialirradiationeffect)是使用核能的重要關(guān)鍵之一。然而,由于高通量輻照設(shè)施和進化過程知識的缺乏,此效應(yīng)的利用并不好。在高性能計算的幫助下,Hu等人[44]提出了一種新的數(shù)據(jù)結(jié)構(gòu),用于大規(guī)模并行模擬金屬材料在輻照環(huán)境下的演化?;谒岢龅臄?shù)據(jù)結(jié)構(gòu),開發(fā)了一種新的分子動力學(xué)軟件——CrystalMD,并在高性能計算機上進行了二兆個原子模擬,對MD輻射效應(yīng)研究的模擬規(guī)模進行了擴展。

3.6其他領(lǐng)域

近年來,隨高性能計算的推廣,政府部門對超級計算機的重視,舊產(chǎn)業(yè)轉(zhuǎn)向新產(chǎn)業(yè)的變化及大量有高性能計算需求的企業(yè)對超級計算機的需求增大,超算人才培養(yǎng)初見成效[45]。在應(yīng)用軟件開發(fā)等推動下,高性能計算機的適用范圍逐漸向更多領(lǐng)域滲透。

源于人工神經(jīng)網(wǎng)絡(luò)的研究深度學(xué)習(xí)作為人工智能的一個新研究領(lǐng)域,在模仿人腦的機制來解釋如圖像、聲音和文本數(shù)據(jù)上有了很大進展。例如,卷積神經(jīng)網(wǎng)絡(luò)(CNN)能準(zhǔn)確地對大型圖像進行識別處理,然而CNN的訓(xùn)練密集程度很高,特別是對于大型具挑戰(zhàn)性的任務(wù),卷積層的參數(shù)數(shù)據(jù)量龐大。而高性能計算機的易訪問、高峰值等性能使學(xué)術(shù)界和工業(yè)界都可以輕松訪問相關(guān)平臺,并可以在合理的時間內(nèi)訓(xùn)練中等和較大規(guī)模的CNN。使用基于輸入展開以將其投影為矩陣乘法(Unfold+Parallel-GEMM)的算法的CAFFE、Theano、Torch7、Chainer、CNTK和TensorFlow等最先進的CNN基礎(chǔ)設(shè)施已可以在高性能計算機上進行部署和應(yīng)用。

增強現(xiàn)實技術(shù)AR(AugmentedReality),將真實世界信息模擬至虛擬世界,讓人隨時產(chǎn)生真實感受。通過高性能計算機高效地實現(xiàn)算法,可以數(shù)字虛擬孕育“互聯(lián)網(wǎng)+”新業(yè)態(tài),開發(fā)虛擬試衣、模擬試駕等應(yīng)用項目。

篇3

關(guān)鍵詞 故障解決HPS IBM 高性能計算機

引言

IBM高性能計算機系統(tǒng)承擔(dān)中國氣象局主要的天氣氣候業(yè)務(wù)科研模式運行,系統(tǒng)在2004年末安裝以來,運行一直比較平穩(wěn)。在整個系統(tǒng)中,數(shù)據(jù)交換是通過IBM HPS(High Performance Switch)網(wǎng)絡(luò)實現(xiàn)的,通過SWITCH網(wǎng)絡(luò)為用戶的并行作業(yè)提供通信。如果SWITCH網(wǎng)絡(luò)出現(xiàn)問題,就會影響模式的運行效率,甚至可以導(dǎo)致整個系統(tǒng)不能使用。在2006年9月21日,科研分區(qū)的SWITCH網(wǎng)絡(luò)故障,導(dǎo)致了整個科研分區(qū)的癱瘓,9月24日故障恢復(fù);此次故障對數(shù)值預(yù)報系統(tǒng)和動力氣候模式預(yù)測系統(tǒng)的業(yè)務(wù)模式?jīng)]有影響,只是涉及了科研分區(qū)的用戶和作業(yè)。

1 故障基本情況

1.1 故障現(xiàn)象

2006年9月21日,科研分區(qū)的系統(tǒng)性能下降,用戶作業(yè)的運算速度比較慢,檢查發(fā)現(xiàn)HPS(High Performance Switch)[1]網(wǎng)絡(luò)的通信狀態(tài)大面積出現(xiàn)異常,影響了GPFS(General Parallel File System)[2]數(shù)據(jù)文件系統(tǒng)和作業(yè)管理軟件L DLEVEL的正常運行,導(dǎo)致用戶無法使用數(shù)據(jù)空間和正常提交用戶作業(yè),最終導(dǎo)致了用戶無法使用科研分區(qū);在SWITCH網(wǎng)絡(luò)通信正常后,GPFS文件系統(tǒng)中的有些文件不能正常訪問。

1.2 處理過程

在故障發(fā)生后,為了確保不影響業(yè)務(wù), 對系統(tǒng)上運行的業(yè)務(wù)模式分析并做應(yīng)急處理。系統(tǒng)承擔(dān)的業(yè)務(wù)模式包括數(shù)值預(yù)報業(yè)務(wù)模式系統(tǒng)和動力氣候模式系統(tǒng),這些業(yè)務(wù)模式都運行在業(yè)務(wù)分區(qū),但是動力氣候模式系統(tǒng)的用戶空間掛接在科研分區(qū)的服務(wù)節(jié)點上,為了避免維護科研分區(qū)時影響業(yè)務(wù),緊急切換HACMP(High Available Cluster Multi—Processing),使文件系統(tǒng)掛接在業(yè)務(wù)分區(qū)。

在確保業(yè)務(wù)可以穩(wěn)定運行后,由于當(dāng)時用戶已無法使用科研分區(qū),因此首先申請對科研分區(qū)進行停機維護,然后分析并解決故障,處理過程如下。

(1)分析HPS網(wǎng)絡(luò)通信數(shù)據(jù),發(fā)現(xiàn)F45一S11和F46一S07的兩塊主板上的芯片內(nèi)部通信不正常,決定更換這兩塊主板;但由于備件新?lián)p的原因,只有一塊主板可用,只更換了F46一S07 SWITCH的主板。

(2)在重新加電啟動完畢后,仍有大量的HPS網(wǎng)絡(luò)不能通信,導(dǎo)致GPFS不能穩(wěn)定工作,用戶無法正常提交作業(yè)。

(3)用SWITCH管理界面檢查SWITCH狀態(tài)時,顯示大量節(jié)點存在光纖卡故障的報錯,但光纖卡的狀態(tài)指示燈顯示正常,更換了5塊光纖卡進行檢測,沒有作用,故排除了大批量光纖卡故障的可能。

(4)收集SWITCH的SNAP數(shù)據(jù)傳給美國實驗室,對數(shù)據(jù)進行分析;經(jīng)過數(shù)據(jù)的多次收集傳遞,美國實驗室SWITCH產(chǎn)品專家對底層數(shù)據(jù)進行分析后,建議對F20、F21、F22、F24、F28、F30、F34、F36、F38、F45、F46、F47、F48、F49、F50機柜進行電源微碼刷新,刷新為統(tǒng)一的26A6版本后,SWITCH網(wǎng)絡(luò)恢復(fù)正常。

(5)系統(tǒng)啟動后,對科研分區(qū)進行檢查,發(fā)現(xiàn)不能正常訪問GPFS文件系統(tǒng),3個文件系統(tǒng)均報I/O讀的錯誤,但可以正常寫入數(shù)據(jù);fsl可以用mmfsck命令進行修復(fù),但fs2和fs3均各有一個NsD(Net—work Shared Disk)的狀態(tài)為“down”狀態(tài),然后手工啟動GPFS文件系統(tǒng),整個系統(tǒng)恢復(fù)正常。

2 故障原因分析

2.1 控制信號傳輸過程

從圖1可見,IBM 高性能計算機系統(tǒng)是通過硬件控制終端HMC(Hardware Management Console)對主機和SWITCH的硬件進行控制,通過HMC上的SNM (SWITCH Network Manager)軟件管理HPS,在HMC上啟動FNMD(Federation Network Manager Daemon)進程,實現(xiàn)對HPS網(wǎng)絡(luò)的配置、初始化、監(jiān)視、控制、恢復(fù)、分析和診斷。此功能與節(jié)點是否安裝操作系統(tǒng)無關(guān),因為這些指令直接由HMC發(fā)起,控制指令都是通過電源傳輸?shù)模灰娫凑?,就會響?yīng)執(zhí)行,SWITCH的拓撲結(jié)構(gòu)是在電源啟動的過程中通過自檢獲得的。

每個HMC系統(tǒng)有一個RS232串口連接CSP(Common Service Processor)[2],畢業(yè)論文實現(xiàn)對主機的控制和管理,如開機、關(guān)機、關(guān)閉系統(tǒng)、重新啟動等;有兩個RS422串口分別連接節(jié)點和SWITCH機柜的兩個BPA(Bulk Power Assembly)電源,實現(xiàn)對BPA的監(jiān)視和firmware管理。所有的HPS都是通過BPA提供電源,對于每一個SWITCH,通過HMC將信號發(fā)送給BPA,再通過BPA 將控制信息通過SWITCH的DCA(Distributed Converter Assembly)電源傳送給SWITCH,來實現(xiàn)對SWITCH的管理。

2.2 SWITCH初始化實現(xiàn)的功能

在啟動SWITCH之前,首先要確保HMC已經(jīng)正常啟動;在SWITCH 機柜加電后,由SSP(SWITCH Service Processor)控制SWITCH的加電過程,在每一個SWITCH芯片的寄存器中記錄本地以及相鄰芯片的機柜號、端口號等信息。

在節(jié)點機柜加電后,每個SNI芯片寄存器中保存自己的機柜號和GX-BUS信息,并將這些信息傳輸給相鄰的SNI芯片寄存器。

由HMC節(jié)點啟動FNM進程,對所有的硬件控制器初始化,配置FNM 網(wǎng)絡(luò);網(wǎng)絡(luò)配置好以后對FNM初始化,F(xiàn)NM 將與每個激活的SWITCH和SNI網(wǎng)絡(luò)部件通信;將FRAME、CHIP、PORT、ROUTE、SWITCH等信息都保存在寄存器中,節(jié)點轉(zhuǎn)入LPAR狀態(tài)后將信息保存在內(nèi)存中,SWITCH初始化完畢。

轉(zhuǎn)貼于 2.3 故障原因分析

在2006年6月到9月期問,科研分區(qū)共更換了7塊BPA機柜電源、8塊SWITCH DCA電源、8塊p655 DCA節(jié)點電源。

由于IBM高性能計算機系統(tǒng)的有些電源模塊被更換,并且有些備件號發(fā)生了變化,雖然新備件可以實現(xiàn)對原備件的替代功能,但是新舊電源備件的微碼版本部分存在不一致;而SWITCH的控制信息是通過HMC—BPA—DCA進行傳送,電源相關(guān)部件微碼版本的不一致影響了信息的正常傳送,進而影響SWITCH的網(wǎng)絡(luò)初始化,不能得到正確的網(wǎng)絡(luò)拓撲結(jié)構(gòu),導(dǎo)致不能建立正常的SwITCH通路;而通過刷新一次機柜電源BPA同版本微碼,使電源模塊上的通信進程狀態(tài)重新初始化(歸零操作),清除了電源模塊上的錯誤通信信息記錄,可以將控制信息正確傳送,重新建立了正確的網(wǎng)絡(luò)通路。

GPFS文件系統(tǒng)不能正常讀寫主要是由于SWITCH網(wǎng)絡(luò)通信不穩(wěn)定,GPFS的通信頻繁發(fā)生中斷,所以GPFS的文件系統(tǒng)也會頻繁異常上線或離線(mount或umount狀態(tài)),使GPFS文件系統(tǒng)控制的有些硬盤上的NSD(Network Shared Disk)控制信息不一致,GPFS為了保證數(shù)據(jù)的安全性,系統(tǒng)自動對此NSD進行了隔離操作。

3 故障事件的分析和啟發(fā)

從這次發(fā)生的故障情況來看,由于在系統(tǒng)本身設(shè)計和日常維護的過程中考慮了高可靠性和對于用戶數(shù)據(jù)的一致性管理,因此在科研分區(qū)出現(xiàn)問題的情況下,并沒有影響業(yè)務(wù)作業(yè)的正常運行,這是對系統(tǒng)高可靠性的一次檢驗;但同時通過這次故障事件,也發(fā)現(xiàn)了我們的許多不足,并且也為日常維護提供了一個經(jīng)驗和教訓(xùn)。

3.1 系統(tǒng)可靠性驗證

由于在系統(tǒng)設(shè)計上考慮了用戶文件系統(tǒng)高可用性的設(shè)計以及全局的用戶環(huán)境一致性,職稱論文 同時在日常維護工作中對用戶文件系統(tǒng)都做了備份,因此對業(yè)務(wù)用戶沒有造成影響。

3.2 系統(tǒng)本身的問題

SWITCH設(shè)備故障率比較高:從系統(tǒng)投入運行以來,SWITCH設(shè)備的故障率就比較高。2006年5月1日到10月31日期問,科研分區(qū)就出現(xiàn)了39次SWITCH硬件故障,其中光纖卡故障22次,銅卡故障6次,主板故障1次、電源故障10次;業(yè)務(wù)分區(qū)有17次SWITCH硬件故障,其中光纖卡故障8次,電源故障9次。

故障診斷定位難:在對SWITCH設(shè)備維護時,光纖卡和銅卡的故障診斷相對容易,故障現(xiàn)象明顯,有冗余連接,一般不影響系統(tǒng)和用戶的正常使用;而SWITCH背板故障及電源微碼不一致等故障,則不容易定位具體的故障點,對系統(tǒng)的影響也比較大。

3.3 日常維護及管理問題

日常維護不夠深入:在日常的維護過程中,主要還是停留在處理現(xiàn)象明顯的軟硬件故障,并沒有對系統(tǒng)的一些潛在故障進行分析研究,而且對系統(tǒng)了解不夠深入,在出現(xiàn)大的故障時不知如何判斷處理。

管理流程不完善:從本次故障來看,備件不能滿足在重大情況下的處理要求;廠家技術(shù)支持不暢通,響應(yīng)速度慢,這都直接延長了故障恢復(fù)時問。

4 后續(xù)工作和建議

此次故障發(fā)生后,陸續(xù)完成和制定了一些工作計劃。

(1)完成了業(yè)務(wù)分區(qū)電源微碼的檢查。察看了業(yè)務(wù)分區(qū)SWITCH的微碼版本,發(fā)現(xiàn)也存在需要重新安裝的警告提示,但是由于報錯的機柜比較少,并沒有對系統(tǒng)造成影響,目前已經(jīng)完成對業(yè)務(wù)分區(qū)電源微碼的統(tǒng)一刷新。

(2)制定了IBM 高性能計算機系統(tǒng)業(yè)務(wù)應(yīng)急備份方案。當(dāng)遇到緊急情況時,能夠快速評估當(dāng)前狀況并進行處理。

(3)完成了系統(tǒng)存儲資源的擴充。擴大了目前用戶的存儲資源,并滿足了業(yè)務(wù)應(yīng)用系統(tǒng)備份的資源需求。

(4)完成了HPGS系統(tǒng)的微碼升級。2007年4月已經(jīng)將整個系統(tǒng)HPS的Service Pack版本級別升級到21。

(5)加強管理。督促廠家人員完善技術(shù)緊急支持的響應(yīng)速度和流程,保證技術(shù)支持的暢通;同時要確保備件的充足可用。

(6)加強維護手段和交流。在日常維護中,工作總結(jié) 不僅是滿足于簡單的問題解決,需要深入分析診斷,找到問題的真正原因,避免潛在的隱患故障;同時要多通過學(xué)習(xí)以及技術(shù)交流,加深對全系統(tǒng)的了解,不斷提高維護水平,提高自己的故障解決能力。

5 結(jié)束語

此次故障雖然沒有對我們的業(yè)務(wù)造成影響,但是通過此次故障情況,我們看到了我們還存在的許多不足,需要我們在以后的工作中加以改進。通過不斷地分析和總結(jié),維護好我們的系統(tǒng),保持系統(tǒng)高效穩(wěn)定的運行。

參考文獻

篇4

盡管如此,我國在高性能計算領(lǐng)域也取得了驕人的成績。目前世界高性能計算機TOP500中,中國已經(jīng)擁有29臺高性能計算機,占世界總數(shù)的5.6%,居第四位。其中,星盈超級刀片計算機因為擁有自主知識專利,設(shè)計理念獨到,實力倍為業(yè)界看好。

據(jù)了解,2004年,蜆殼星盈公司成功推出了一臺運算速度為每秒4.046萬億次,實際運算效率高達84.35%的超級刀片計算機,乃世界同類產(chǎn)品中運算效率最高的。2005年,星盈GT4000型超級刀片計算機被列入了世界高性能計算機TOP500的第100位。

傳統(tǒng)缺陷制約推廣

當(dāng)今社會,服務(wù)器已經(jīng)進入了技術(shù)、應(yīng)用和市場互動并迅速發(fā)展的新階段,越來越多的領(lǐng)域都需要采用高性能計算機提高自身競爭力。如國防、氣象、航天、交通、電信、金融、醫(yī)療、商務(wù)和科學(xué)等。然而,隨著需求的進一步擴大,傳統(tǒng)的高性能計算機在某些方面的不足更顯突出,在一定程度上又制約著高性能計算機的進一步推廣,主要表現(xiàn)在以下幾個方面:

一、機群系統(tǒng)瓶頸。在氣象服務(wù)、石油勘探、新材料、新藥物研制等領(lǐng)域?qū)τ嬎闳蝿?wù)要求都非常高,它們往往需要在較短的時間內(nèi)解決一些數(shù)據(jù)規(guī)模龐大,算法結(jié)構(gòu)十分復(fù)雜的問題。這就不僅需要對這些數(shù)據(jù)進行高速運算,而且還要求存儲系統(tǒng)有著巨大的空間來支持。而目前傳統(tǒng)機群系統(tǒng)很難達到相應(yīng)的高速運算與海量存儲要求。另外,機群系統(tǒng)內(nèi)部的一些缺陷,如I/O接點的數(shù)量與計算節(jié)點的數(shù)量不匹配、I/O節(jié)點與存儲設(shè)備之間的吞吐能力、節(jié)點間的大量的網(wǎng)絡(luò)數(shù)據(jù)交換等,這些瓶頸都會嚴重的影響系統(tǒng)整體效率。

二、系統(tǒng)的穩(wěn)定性與安全憂。由于企業(yè)常常要對數(shù)據(jù)進行大規(guī)模的海量運算,任何中斷情況都會使之前的數(shù)據(jù)計算白忙一場,從而影響整個工作效率,因此保持系統(tǒng)運轉(zhuǎn)的持續(xù)穩(wěn)定性十分重要。而在安全性上,隨著信息技術(shù)的發(fā)展,對企業(yè)來講沒有什么比核心數(shù)據(jù)失竊更為嚴重的事情了,而傳統(tǒng)設(shè)計在數(shù)據(jù)保護方面考慮相對較弱。

三、可拓展性和現(xiàn)有資源的利用性較差。隨著應(yīng)用的深入,每一個企業(yè)的計算需求都可能逐漸增長,但它們往往不愿意“棄舊換新”,而是希望將新的計算節(jié)點循序漸進地添加到原有的系統(tǒng)中去,逐步擴展為一個“包含舊系統(tǒng)”的新系統(tǒng),從而更大限度地保護原有資源。傳統(tǒng)的機群系統(tǒng),不僅購入的初始成本高昂,而且升級過程繁瑣拓展性差,再加上各個廠家的技術(shù)標(biāo)準(zhǔn)各不相同,產(chǎn)品不能兼容使用。這些問題對企業(yè)來講都是頭痛的問題。

四、管理與維戶的復(fù)雜性。部署多個服務(wù)器是一個耗時和資源密集的過程。管理員需要將每個服務(wù)器安裝在機架中,進行電源和網(wǎng)絡(luò)布線,并為其安裝軟件。在高密度的環(huán)境下,布線尤其是部署中令人頭疼的難題之一。而一般的企業(yè)都缺乏專門系統(tǒng)運營與維護人員,一旦發(fā)生故障,將會使管理與維護工作十分麻煩。

先進設(shè)計理念引領(lǐng)

為了克服上述缺陷,星盈超級刀片計算機采用了一系列革命性的設(shè)計理念,其理論運算速度可超過每秒100萬億次浮點,資料存儲量可超過1000萬億字節(jié),達到美日等先進國家高性能電腦的水平。星盈超級刀片計算機中的每個“刀片”就是一個運算單元,可以在不停機的情況下隨時增加或更換。如此設(shè)計可以使產(chǎn)品具有以下幾種優(yōu)勢:

首先,星盈超級刀片計算機采用Infiniband等高帶寬和低延遲的開放和標(biāo)準(zhǔn)的網(wǎng)絡(luò)互聯(lián)設(shè)備, 并且采用的存儲網(wǎng)格更進一步為支持高性能計算機系統(tǒng)提供可伸縮的存儲和I/O能力,消除了I/O瓶頸。值得一提的是,隨著高性能刀片計算機的體系結(jié)構(gòu)向基于標(biāo)準(zhǔn)的、機架密集的服務(wù)器的轉(zhuǎn)變,數(shù)據(jù)中心將產(chǎn)生許多問題,星盈超級刀片計算機的體系結(jié)構(gòu)將能夠緩解和解決這些問題。使用星盈超級刀片計算機,Linux操作系統(tǒng)和InfiniBand等現(xiàn)代互聯(lián)技術(shù)來建立的高性能計算機不僅能夠提供高性能,而且能夠提供高密度,改善可管理性,降低功率消耗,增強部署和可服務(wù)性,大大降低總擁有成本,可以幫助用戶把計算資源最大化整合,提供了最大化計算性能密度。

其次,星盈超級刀片計算機支持最新RAID-6技術(shù),確保存儲數(shù)據(jù)安全。RAID-6加速技術(shù)使系統(tǒng)能夠以最高性能運行,即使剛剛從多個磁盤故障中得以恢復(fù)也不例外。這種存儲加速能力可為星盈超級刀片計算機提供更快的吞吐率,并可提高數(shù)據(jù)在輸入輸出硬盤時的可靠性。

再次,星盈超級刀片計算機將傳統(tǒng)的高端服務(wù)器的所有功能集中在一塊高度壓縮的電路板中,然后再插入到機箱中。在同一系統(tǒng)里,星盈計算刀片和貯存單元可隨時升級。通過獨有的中板專利技術(shù)與內(nèi)存的高性能I/O標(biāo)準(zhǔn)接口,升級只需增加刀片或貯存單元,不需要重新布線或配置,也無需更換系統(tǒng)及操作和應(yīng)用軟件,具有超長的使用生命,使得總體擁有的成本(包括購買、維護、機房、電力、人員和管理費用)大大降低。

最后,在安裝星盈超級刀片計算機時,管理員只需要對機架進行安裝和布線,單獨的刀片服務(wù)器無需布線。由于多個刀片服務(wù)器可以共用冗余電源,因此最大限度地減少了機架布線。對于寸土寸金的數(shù)據(jù)中心來說,根據(jù)設(shè)計和供應(yīng)商的不同,星盈超級刀片計算機能夠使服務(wù)器的密度比目前1U的機架優(yōu)化的系統(tǒng)增加100%到800%,更大的節(jié)約空間。

星盈高性能刀片計算機

篇5

隨著IBM高性能計算機“走鵑”于2008年6月誕生,高性能計算機(HPC)邁入千萬億次門檻。用戶對高性能計算需求的持續(xù)增長,推動著HPC規(guī)模越做越大。在由CPU構(gòu)成的高性能計算的世界中,由于CPU計算性能的提升速度遠遠落后于高性能計算需求增長的速度,增加CPU的個數(shù)便成為提高HPC性能的主要途徑。如今全球高性能計算500強(Top500)中已經(jīng)出現(xiàn)內(nèi)核累計總數(shù)多達20多萬個的HPC。

但是,在提升性能的同時,CPU個數(shù)的增加也給HPC增添了復(fù)雜性,并帶來可用性降低、系統(tǒng)功耗驚人、成本高居不下等問題,讓HPC廠商日益感到頭痛。于是,高性能計算廠商開始探索新的提升HPC性能的途徑。IBM的“走鵑”就是采用CPU和Cell處理器的混合架構(gòu),AMD和Intel也都分別對外了各自的CPU+GPU(圖形處理器)的混合架構(gòu)。

作為GPU領(lǐng)域龍頭老大的NVIDIA自然不會放棄在高性能計算這一CPU的傳統(tǒng)領(lǐng)地炫耀性能的機會。它先是推出了CUDA架構(gòu),使得程序員可以用C語言對CPU和基于CUDA架構(gòu)的GPU進行統(tǒng)一編程,從而解決了因編程復(fù)雜而被程序員敬而遠之所造成的GPU應(yīng)用難以普及的問題。進而,它又推出了面向高性能計算的Tesla系列GPU。2008年11月21日,NVIDIA在美國德克薩斯州奧斯汀市舉辦的2008超級計算大會上聯(lián)手HPC的巨頭Crayon推出個人HPC。與此同時,會上公布的Top500中,采用Tesla技術(shù)的HPC首戰(zhàn)便占據(jù)了第29名的位置,標(biāo)志著NVIDIA從個人HPC和高端HPC全面切入高性能計算領(lǐng)域。

為此,本報記者獨家專訪了NVIDIA高性能計算事業(yè)部總經(jīng)理Andy Keane。

HPC中的GPU

記者:GPU在高性能計算中的性能已經(jīng)到達了何種地步?

Keane:CPU的運算速度在很大程度上還取決于緩存的大小,而GPU則是在任務(wù)并行化后用大量的線程來進行運算。雖然CPU已經(jīng)多核心化,可以多達8個內(nèi)核,但在并行計算時,顯然不是GPU上千個線程的對手。

比利時有所大學(xué),以前用的是512個CPU組建的HPC,當(dāng)他們了解到GPU的運行功能很強后,試著自己搭建了一臺配置有8個GPU的臺式機,結(jié)果性能竟與以前512個CPU的HPC不相上下。

記者:既然GPU的性能遠遠超過CPU,那么NVIDIA何時開始關(guān)注GPU的計算能力?

Keane:15年前,我們就開始針對3D游戲開發(fā)GPU了。但GPU的編程很復(fù)雜,因而應(yīng)用主要是集中在圖形顯示領(lǐng)域。之后,我們開發(fā)了CUDA架構(gòu),你可以把CUDA想象成與x86相似的硬件架構(gòu),它允許應(yīng)用開發(fā)者用他們熟悉的語言對GPU進行快速編程,從而為GPU拓寬了應(yīng)用范圍。現(xiàn)在,NVIDIA所有的GPU都支持CUDA架構(gòu)。

記者:懂得計算機的人都知道,并行編程要比串行編程復(fù)雜得多。程序員如何在CUDA平臺上對CPU和GPU統(tǒng)一編程?

Keane:盡管CPU與GPU之間在架構(gòu)上存有很大的區(qū)別,但我們覺得CPU與GPU的結(jié)合才是最好的計算架構(gòu)。于是我們在CUDA上推出了C語言編譯器,程序員在開發(fā)應(yīng)用程序時,只要對序列執(zhí)行的程序代碼和并行執(zhí)行的程序代碼簡單地進行標(biāo)注,C編譯器就可以向PC解釋哪部分該由CPU做,哪部分該由GPU做。

記者:CUDA的編程看來不難,那么搭建一個個人HPC難不難?

Keane:用Tesla組建個人HPC是件很容易的事。你只要把買到的Tesla卡插到PC主板上的PCI插槽,你的PC就變成了1臺個人HPC。

記者:Tesla貴嗎?

Keane:4個GPU的價格在9500美元~1萬美元之間,3個GPU的Tesla價格為7000多美元。但與同等價位的工作站相比,我們的性能應(yīng)該有百倍的提升。

競爭對手

記者:我們看到現(xiàn)在全球性能最高的HPC“走鵑”所采用的CELL處理器實際上就是一個集成了8個流處理器和一個CPU內(nèi)核的處理器,而GPU也是由數(shù)百個流處理器構(gòu)成的。你是如何看待CELL的?

Keane:CELL的編程要比CUDA復(fù)雜得多。CUDA本身就是一個GPU架構(gòu),我們所有GeForce、Quadro和Tesla產(chǎn)品線都可以很完美地對其提供支持。它的編程模式是很簡單的,語言與C語言非常接近,編譯器與C語言也基本一致。唯一的改變是將之前的串行計算更新為并行計算。在過去的一年中,CUDA積累了大量的應(yīng)用程序,而且在美國,也有很多活躍的論壇討論CUDA的編程問題。我們也在CUDA中文網(wǎng)站上開設(shè)了CUDA中國專區(qū),上面有144個使用的案例。對于程序員而言,這些編碼都是開放的。

記者:在基于Tesla搭建的HPC中,GPU與CPU從指令集上看是異構(gòu)的。而英特爾最新展示的具有80個內(nèi)核的Larrabee卻采用的是x86指令集,從而實現(xiàn)了CPU和GPU在指令集上的兼容,對于程序員來說,這是否會比Tesla編程更為容易呢?

Keane:我并不這樣認為。在NVIDIA的CUDA平臺上,不管面對何種架構(gòu),編程人員都可以用很普及的C語言去對CPU和GPU進行統(tǒng)一編程。對于程序員來說,Tesla的編程是很簡單的。而Larrabee無法用C語言來編程,程序員要學(xué)習(xí)這種新架構(gòu)和它的語言并用兩種語言分別對CPU和GPU進行編程。

記者:AMD選擇GPGPU(通用GPU)來切入高性能計算領(lǐng)域,對此你有何見解?

Keane:關(guān)鍵要看它的普及率了。這里有兩個數(shù)據(jù):英特爾x86處理器市場占有85%的份額,AMD只占15%;同時,AMD的FireStream只有5%的使用率。你為客戶定制產(chǎn)品的確會又好又快,但如果產(chǎn)量不高,成本無法有效攤薄,價格就會非常高。 而我們主要針對主流市場,用更加標(biāo)準(zhǔn)的界面來制作,讓用戶很容易使用,而且有能力承受。我們能夠讓很多研究人員將原本要跑到數(shù)據(jù)中心去做的計算轉(zhuǎn)移到插有Tesla卡的工作站上,并很容易地獲得高性能計算的體驗。

應(yīng)用領(lǐng)域

記者:TOP 500中,x86架構(gòu)CPU已經(jīng)占據(jù)了90%的地盤。請問Tesla進入高性能計算市場的機會有多大?

Keane:幾乎是100%。我們強調(diào)的是異構(gòu)計算,GPU不可能完全取代CPU,只是能顯著地減少CPU的數(shù)量。如果我們從另外一個角度上看這個問題,其實全都采用一樣的架構(gòu)未必是件好事。如同在GPU領(lǐng)域,因為有我們GPU、Intel的Larrabee和AMD的ATI的存在,因此大家可以互相激勵,充分開展競爭,刺激創(chuàng)新。但是服務(wù)器領(lǐng)域的架構(gòu)幾乎統(tǒng)一,這對創(chuàng)新是不利的。

記者:那么在工作站方面呢?

Keane:工作站的限制主要在于工作站機箱內(nèi)部空間的限制,例如工作站的電源只能提供1000W的功率,那么,我們可以在這1000W之內(nèi)給你提供盡可能高的計算性能,比如說1T的性能。

記者:無疑,Tesla個人高性能計算機的性能遠好于現(xiàn)在的工作站,但目前工作站上的很多應(yīng)用軟件都是基于UNIX系統(tǒng),廠商們愿意把它們移植到Tesla平臺上嗎?

Keane:這些開發(fā)商面臨著決定應(yīng)用何種并行運算解決方案的選擇。其中之一為多核CPU解決方案,即將計算工作分配到雙核、四核甚至八核上。這樣,對于開發(fā)人員來說,如果他們要想通過并行計算來得到性能的提升,就必須將應(yīng)用分解為4塊甚至8塊。這其中最大的挑戰(zhàn)是如何將計算工作劃分為完全均衡的4塊或者8塊。另外一種解決方案類似Intel的Larrabee,開放人員可以用比多核解決方案更為簡單的方式解決并行計算的問題。但是針對并行運算,GPU架構(gòu)可以非常簡單地實現(xiàn)非常大規(guī)模的并行計算。如果你要按照時間和效率來衡量這幾種選擇方案,GPU無疑是效率最高的。

記者:未來工作站會不會被Tesla個人超級計算機替代?

Keane:對于任何使用集群的用戶,都有應(yīng)用Tesla GPU的需要。我將努力說服他們中的所有人。利用工作站進行高性能計算的用戶也是我們的目標(biāo)人群,我們也希望讓他們認識到我們的好處。事實上,如果用戶很看重預(yù)算和效率,對成本和時間很敏感,那么Tesla對他們來說就很有價值。

未來發(fā)展

記者:在CPU領(lǐng)域,虛擬化是一個很時尚的話題,Tesla也能虛擬化嗎?

Keane:如果CPU可以做到虛擬化,那么GPU也可以做到虛擬化。因為他們都是基于處理器架構(gòu)的。就好像將GPU作為CPU的一個資源,只要CPU可以實現(xiàn)虛擬化,那么GPU也可以作為CPU的資源實現(xiàn)虛擬化。

記者:Tesla現(xiàn)在使用C語言編程。我們知道C語言與硬件很容易結(jié)合,也易于控制。聽說NV還要在Tesla上使用Fortran,這樣會不會影響到效率?未來還會有其他語言嗎?

Keane:Fortran是非常結(jié)構(gòu)化的語言,并行計算的性能非常好,在GPU上的執(zhí)行效率甚至更高。同時,在未來我們還將增加C++等語言。

記者:既然在Tesla計算機中,Tesla GPU要與CPU協(xié)同工作,那么,未來GPU和CPU會不會集成在一個芯片上?

Keane:我們不認為GPU和CPU將會融合。因為目前GPU的設(shè)計比CPU還要復(fù)雜,GPU擁有更多的核心,更高的內(nèi)存容量,芯片的面積也很大。我們的客戶也對計算性能和內(nèi)存提出更高的要求。我們所能做的是提升制造工藝,從而降低芯片的面積。

我們當(dāng)然可以把一個小型CPU集成進來,但這樣對GPU計算性能的提升并沒有益處。就高性能計算而言,高速異構(gòu)計算架構(gòu)是一個CPU搭配多個GPU,然后更多的CPU搭配更多的GPU,這樣,GPU就可以發(fā)揮加速器的作用。

篇6

有人問,浪潮對高性能計算機有什么看法?也許發(fā)問的人應(yīng)該首先弄清楚高性能計算機是什么。高端計算機=高性能計算=HPC=linpack?高端應(yīng)用=高性能計算 =高性能科學(xué)計算=科研計算?事實上,我們應(yīng)該把高端應(yīng)用理解為高性能計算機,把高性能計算機理解為高性能科學(xué)計算,這與國外的理解是不太一樣的。

像IBM和HP,在這一領(lǐng)域稱得上壟斷者,他們花了很少的精力來講高性能計算,花了更多的精力來講高端服務(wù)器,他們?yōu)槭裁催@么做?其實,在總結(jié)了這些廠商在國內(nèi)外的盈利情況之后,我們發(fā)現(xiàn),高性能計算產(chǎn)品并沒有為IBM這樣的廠商帶來很大的利潤,反而是商業(yè)應(yīng)用為他們帶來了更多的收入。但目前我國做高性能計算研究的企業(yè)主要面向科研和高效市場,而要讓這些用戶拿出很多的錢來買一個產(chǎn)品是不現(xiàn)實的。這又是一個我國與國外的差異所在。

另外的差異就體現(xiàn)在研究方面。在國內(nèi),無論是企業(yè)界還是學(xué)術(shù)界,大家在講到體系結(jié)構(gòu)的時候會比較注重于集群,在其他重要體系結(jié)構(gòu)的研究上投入較少,也就是說,國內(nèi)的高性能計算體系結(jié)構(gòu)以集群為主,對SMP/NUMA等體系結(jié)構(gòu)的研究較少,過于依賴國外底層技術(shù),對處理器、芯片組、交換互連的研究投入不足;重單一指標(biāo),不重綜合指標(biāo),重系統(tǒng)浮點計算性能指標(biāo),對綜合應(yīng)用能力的重視不夠;重視數(shù)值計算類應(yīng)用,強調(diào)高端系統(tǒng)數(shù)值計算能力,不重視OLTP指標(biāo)、SPECWEB等面向商業(yè)應(yīng)用的指標(biāo)。即使在高性能計算領(lǐng)域也有這樣的問題,如比較注重計算能力的提升,而對應(yīng)用建模的研究和算法這些方面的研究就比較弱一些。所以在這種情況下,我們應(yīng)該在戰(zhàn)略的角度上更加關(guān)注高端商業(yè)產(chǎn)業(yè)的發(fā)展,提供一些基礎(chǔ)技術(shù)。

從目前來看,無論是國內(nèi)還是國外的企業(yè)都很注重虛擬技術(shù),對于如何把高端的服務(wù)器產(chǎn)品折合成小的服務(wù)器產(chǎn)品滿足不同的應(yīng)用,或者如何把小的產(chǎn)品整合成大的產(chǎn)品,來滿足大的需求,也有不同的看法。未來的一個發(fā)展方向是,我們做出的中高端服務(wù)器產(chǎn)品要是一流的產(chǎn)品,而且能逐漸應(yīng)用在越來越多的領(lǐng)域中。

篇7

第一,基于多核CPU技術(shù)的刀片服務(wù)器已經(jīng)成為高性能計算的發(fā)展趨勢。值得關(guān)注的是,排名全球第一的高性能計算機“走鵑”,采用的就是混合架構(gòu),并且涵蓋了CELL芯片。

第二,GPU技術(shù)會給地球物理、高密度運算、可視化處理帶來新機會。GPU技術(shù)被證明是一項加快計算、可視化、圖像分析、模式識別、計算機視覺完美結(jié)合的技術(shù)。東方地球物理公司研究院(以下簡稱東方地球)也在做應(yīng)用GPU技術(shù)的相關(guān)實驗,并且應(yīng)用了768個節(jié)點。整個中石油一共用了7套系統(tǒng)做實驗,應(yīng)用環(huán)境就是油田,并且目前已經(jīng)取得了一些進展。國外的一些同行公司也在應(yīng)用了GPU的混合架構(gòu)上成功地開發(fā)了自己的應(yīng)用軟件。隨著地震軟件商對GPU技術(shù)的支持,可視化處理解釋系統(tǒng)、疊前遷移數(shù)字建模的效率很可能會大幅度提升。目前這項技術(shù)存在的最大問題是很少有支持這個平臺的應(yīng)用軟件。

第三,高密度、多路服務(wù)器技術(shù)將會成為地震處理和綜合解釋研究的新平臺。我們與專家交流后認為,四路服務(wù)器可能是比較合適的選擇,不僅胖節(jié)點可以采用多路服務(wù)器,包括東方地球現(xiàn)在進行的信息化建設(shè)也是采用多路服務(wù)器來作為一個大平臺,分區(qū)給不同應(yīng)用使用。

第四,萬兆以太網(wǎng)將給高性能計算的發(fā)展帶來新生機。盡管目前由于成本太高,萬兆以太網(wǎng)和Infiniband的應(yīng)用市場不及千兆以太網(wǎng),但它們還是相當(dāng)有競爭力的。1995年新興的網(wǎng)絡(luò)技術(shù)只能提供10兆以太網(wǎng),到1998年,已經(jīng)發(fā)展成為千兆以太網(wǎng),1999年更推出了萬兆以太網(wǎng)。如今,超萬兆以太網(wǎng)已經(jīng)脫離了實驗階段。有專家預(yù)測,到2011年~2018年的時候,網(wǎng)絡(luò)技術(shù)才會出現(xiàn)比較大的改進,萬兆以太網(wǎng)也會因為成本的降低而逐步替代目前的千兆以太網(wǎng)。

篇8

關(guān)鍵詞:高性能計算;應(yīng)用;中醫(yī)藥

中圖分類號:R-3 文獻標(biāo)識碼:A 文章編號:2095-5707(2016)06-0010-03

Abstract: High performance computing (HPC), as a new and important research tool, has been applied in many fields successfully. Application of HPC in the TCM field is still in the exploratory stage. HPC in the future may be innovatively applied in the field of genomics Chinese herbal medicine, virtual medicine screening of new TCM, TCM data mining and big data analytics, modeling and simulation and so on.

Key words: high performance computing (HPC); application; TCM

高性能計算是計算機科學(xué)的一個分支,研究并行算法和開發(fā)相關(guān)軟件,致力于開發(fā)高性能計算機。高性能計算是世界各國競相發(fā)展的前沿技術(shù),是體現(xiàn)一個國家綜合實力和科技競爭力的重要指標(biāo)。

科學(xué)計算作為科研方法變革的產(chǎn)物,已經(jīng)發(fā)展成為與傳統(tǒng)的理論、實驗并駕齊驅(qū)的第三種科研方法,并且日益成為越來越重要的科研方法。科學(xué)計算方法的運用,是高性能計算應(yīng)用的基礎(chǔ)和前提條件,而使高性能計算真正發(fā)揮作用主要取決于高性能計算的應(yīng)用研究水平[1]。本文對于促進高性能計算未來在中醫(yī)藥領(lǐng)域的應(yīng)用、豐富中醫(yī)藥信息學(xué)的研究內(nèi)容及由此產(chǎn)生的中醫(yī)藥科研方法的創(chuàng)新具有推動作用。

1 高性能計算應(yīng)用概況

1.1 我國在高性能計算應(yīng)用領(lǐng)域仍處于落后水平

在高性能計算的研發(fā)和應(yīng)用領(lǐng)域美國一直處于世界領(lǐng)先水平,日本和歐洲國家緊隨其后長期位居世界先進行列。近年來,我國在高性能計算硬件的研發(fā)方面取得了突破性進展,通過自主創(chuàng)新逐步掌握了一批硬件研發(fā)的關(guān)鍵技術(shù)。中國國防科技大學(xué)研制的天河系列超級計算機連續(xù)多次在世界超級計算機排行榜中名列首位,標(biāo)志著我國高性能計算的硬件研究水平目前已經(jīng)接近國際先進水平。但在應(yīng)用軟件方面的發(fā)展嚴重滯后于硬件的發(fā)展水平,自主開發(fā)的高性能計算應(yīng)用軟件嚴重匱乏,需要大量購買和引進國外開發(fā)的應(yīng)用軟件,重要和關(guān)鍵部門的應(yīng)用受制于人[2]。應(yīng)用軟件是高性能計算應(yīng)用的基礎(chǔ),由于應(yīng)用軟件研發(fā)水平的嚴重落后,目前我國在高性能計算應(yīng)用領(lǐng)域仍處于落后水平。

1.2 國內(nèi)外高性能計算主要的應(yīng)用領(lǐng)域

高性能計算作為嶄新和重要的科研工具,目前已經(jīng)在眾多的領(lǐng)域得到了成功應(yīng)用,各種前沿科學(xué)研究、技術(shù)開發(fā)和工程設(shè)計都越來越多地使用了高性能計算,高性能計算已經(jīng)日益成為科技創(chuàng)新的重要力量。目前主要的應(yīng)用領(lǐng)域包括氣象數(shù)值模擬與預(yù)報、地震預(yù)報、納米技術(shù)、生物醫(yī)學(xué)、環(huán)境科學(xué)、空間科學(xué)、材料科學(xué)、計算物理、計算化學(xué)、流體力學(xué)、地震三維成像、石油勘探、天體星系模擬、大氣與海洋模擬、固體地球模擬、工業(yè)設(shè)計、核武器研究、全球氣候模型、湍流分析、飛行動力學(xué)、海洋環(huán)流、流體力學(xué)和超導(dǎo)模型等[1]。在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用目前主要集中在人類基因組學(xué)、蛋白質(zhì)組學(xué)、藥物設(shè)計、分子動力學(xué)模擬等方面。

1.3 高性能計算應(yīng)用的瓶頸

高性能計算雖然已經(jīng)在眾多領(lǐng)域得到了成功應(yīng)用,但由于技術(shù)難度等的限制,仍然屬于高投入高產(chǎn)出的非普及型應(yīng)用。目前制約高性能計算應(yīng)用的主要問題包括軟件開發(fā)的技術(shù)難度非常大,系統(tǒng)使用成本過高,不僅體現(xiàn)在軟硬件購置費用昂貴,而且系統(tǒng)運行維護成本過高,大型系統(tǒng)的年電費需上千萬元[2]。比較高精尖的應(yīng)用范圍、非常高的技術(shù)要求和過高的使用成本,這些都限制了高性能計算的廣泛應(yīng)用。

2 高性能計算在中醫(yī)藥領(lǐng)域應(yīng)用的可行性分析

2.1 高性能計算在領(lǐng)域應(yīng)用的前提條件

高性能計算在領(lǐng)域應(yīng)用的條件首先需要應(yīng)用領(lǐng)域具有較高的科研水平,特別是能夠通過科學(xué)計算的方法建立相應(yīng)的數(shù)學(xué)物理模型和應(yīng)用軟件來解決實際問題,利用高性能計算才有可能促成應(yīng)用領(lǐng)域研究水平的大幅度提高。通過對高性能計算應(yīng)用領(lǐng)域的最高學(xué)術(shù)獎戈登獎獲獎項目的分析,這些獲獎的應(yīng)用項目絕大多數(shù)都具有多學(xué)科交叉融合的背景,這反映了高性能計算的應(yīng)用需要應(yīng)用領(lǐng)域與計算機科學(xué)、數(shù)學(xué)等學(xué)科的跨學(xué)科合作[3]。隨著高性能計算的應(yīng)用,近些年高性能計算與應(yīng)用學(xué)科的交叉學(xué)科不斷涌現(xiàn),產(chǎn)生了計算化學(xué)、計算物理學(xué)、計算生物學(xué)等許多新興學(xué)科,這些交叉學(xué)科的產(chǎn)生標(biāo)志著高性能計算在這些領(lǐng)域得到了高水平應(yīng)用。

2.2 計算生物學(xué)的啟示

計算生物學(xué)是一門以生命科學(xué)中的現(xiàn)象和規(guī)律作為研究對象,以解決生物學(xué)問題為最終目標(biāo),通過模擬和仿真的方法對生物學(xué)問題進行定量和定性研究的新興學(xué)科。計算生物學(xué)與生物信息學(xué)比較,最大的不同之處在于生物信息學(xué)側(cè)重于生物信息的采集、存儲、處理和分析,而計算生物學(xué)側(cè)重于對生命現(xiàn)象進行研究、解決生物學(xué)問題[4]。目前計算生物學(xué)領(lǐng)域的研究主要集中在蛋白質(zhì)行為的模擬、藥物分子的篩選、基因測序等方面。

雖然目前中醫(yī)藥領(lǐng)域還不滿足高性能計算的應(yīng)用條件,但通過借鑒計算生物學(xué)的研究方法,未來有可能在中醫(yī)藥領(lǐng)域開展具有創(chuàng)新性的高性能計算的應(yīng)用研究。

3 高性能計算在中醫(yī)藥領(lǐng)域應(yīng)用的展望

3.1 中藥植物藥的基因組學(xué)

基因組學(xué)是遺傳學(xué)的一個分支,研究生物基因組和如何利用基因,涉及基因作圖、測序和整個基因組功能分析,研究內(nèi)容包括以全基因組測序為目標(biāo)的結(jié)構(gòu)基因組學(xué)和以基因功能鑒定為目標(biāo)的功能基因組學(xué)?;蚪M學(xué)是高性能計算應(yīng)用的一個重要方向,沒有高性能計算人類的基因組計劃就不可能實現(xiàn),高性能計算已經(jīng)成為基因組學(xué)研究不可或缺的科研工具。隨著基因組學(xué)研究的深入、技術(shù)的成熟和成本的大幅度下降,使得基因組學(xué)的研究逐漸由人類的基因組學(xué)擴展到動物、植物等多個相近領(lǐng)域。利用高性能計算在基因組學(xué)方面成熟的應(yīng)用軟件開展中藥植物藥的基因組學(xué)研究未來有可能是高性能計算在中醫(yī)藥領(lǐng)域的重要應(yīng)用。

3.2 中藥新藥的虛擬藥物篩選

利用高性能計算進行虛擬藥物篩選目前已經(jīng)成為西藥新藥開發(fā)的一條嶄新和重要的途徑。新藥研發(fā)的核心工作之一是從大量的化合物樣品庫中發(fā)現(xiàn)有藥理活性的化合物,計算機虛擬篩選輔助新藥開發(fā)是利用統(tǒng)計學(xué)和分子模型化技術(shù)來指導(dǎo)新的先導(dǎo)結(jié)構(gòu)的發(fā)現(xiàn)或設(shè)計,從而減少實驗室的工作量,縮短開發(fā)周期、降低開發(fā)成本。近年來對多靶點藥物的研究已經(jīng)成為國際上新藥開發(fā)的一個重要的研究熱點,中藥是天然的多靶點藥物,蘊含著巨大的新藥創(chuàng)制的潛力[5-6]。應(yīng)用高性能計算開展中藥新藥的虛擬藥物篩選有可能成為中藥新藥開發(fā)的嶄新途徑。

3.3 中醫(yī)藥數(shù)據(jù)挖掘和大數(shù)據(jù)分析

數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。大數(shù)據(jù)分析是指對規(guī)模巨大的數(shù)據(jù)進行分析,目前世界各國對大數(shù)據(jù)分析技術(shù)高度重視,大數(shù)據(jù)被視為國家重要的戰(zhàn)略資源。數(shù)據(jù)挖掘和大數(shù)據(jù)分析是高性能計算應(yīng)用的重要領(lǐng)域之一。目前中醫(yī)藥領(lǐng)域的數(shù)據(jù)挖掘和大數(shù)據(jù)分析主要集中在對方劑配伍規(guī)律、中醫(yī)證治規(guī)律等的研究,現(xiàn)有的研究水平還不能構(gòu)成對高性能計算的迫切需求。隨著數(shù)據(jù)挖掘和大數(shù)據(jù)分析在中醫(yī)藥領(lǐng)域應(yīng)用水平的提高,數(shù)據(jù)研究的內(nèi)容、方法和結(jié)果的日趨豐富,隨著數(shù)據(jù)量的積累和研究方法復(fù)雜度的提高,中醫(yī)藥數(shù)據(jù)挖掘和大數(shù)據(jù)分析未來有可能成為高性能計算在中醫(yī)藥領(lǐng)域富有潛力的應(yīng)用。

3.4 模擬與仿真

模擬與仿真是依靠計算機通過數(shù)值計算和圖像顯示的方法,對工程、物理、生物等各類問題進行研究。高性能計算不僅具有強大的計算功能,還可以模擬或代替由于受經(jīng)濟或者其他條件限制不能進行的實驗。2013年10月,哈佛大學(xué)教授Martin Karplus、斯坦福大學(xué)教授Michael Levitt和南加州大學(xué)教授Arieh Warshel因“為復(fù)雜化學(xué)系統(tǒng)創(chuàng)立了多尺度模型”而獲得諾貝爾獎,評委會聲明中稱這一成果意味著對于化學(xué)家來說計算機已經(jīng)成為同試管一樣重要的工具[1]。

計算機模擬方法在生命科學(xué)中已經(jīng)得到了迅速的發(fā)展和廣泛的應(yīng)用。高性能計算應(yīng)用領(lǐng)域的最高學(xué)術(shù)獎戈登獎獲獎項目“在20萬CPU核和異構(gòu)體系結(jié)構(gòu)上的千萬億次持續(xù)性能血流模擬”,該項目模擬了血液流動狀態(tài),可以輔助血栓的早期病理學(xué)診斷及抗血栓藥物的研究。另一項獲獎項目“呼之欲出的貓:包含109規(guī)模神經(jīng)元、1013規(guī)模突觸的大腦皮質(zhì)模擬”,對神經(jīng)元和突觸規(guī)模與貓大腦相當(dāng)?shù)拇竽X皮質(zhì)功能進行了模擬,并以此為基礎(chǔ)開展了認知計算的研究[3]。此外國內(nèi)外大量的高性能計算被用于分子動力學(xué)模擬,分子動力學(xué)模擬是一種數(shù)值模擬方法,通過將分子抽象為由化學(xué)鍵連接的質(zhì)點按照基于牛頓力學(xué)的數(shù)學(xué)模型迭代求解分子體系的行為。利用高性能計算進行分子動力學(xué)模擬已經(jīng)成為化學(xué)和生物學(xué)研究中與實驗手段相當(dāng)?shù)臉?biāo)準(zhǔn)研究方式[7-8]。模擬和仿真技術(shù)在中醫(yī)藥研究中的應(yīng)用未來有可能成為高性能計算在中醫(yī)藥領(lǐng)域創(chuàng)新性的應(yīng)用。

4 小結(jié)

高性能計算的應(yīng)用是使高性能計算真正發(fā)揮作用的軟實力,是高性能計算領(lǐng)域重要的研究內(nèi)容。高性能計算的應(yīng)用需要多學(xué)科的交叉與合作,計算生物學(xué)的產(chǎn)生標(biāo)志著高性能計算在生物醫(yī)學(xué)領(lǐng)域得到了成功應(yīng)用。

高性能計算在中醫(yī)藥領(lǐng)域的應(yīng)用目前還處于探索階段,尚不具備大規(guī)模應(yīng)用的條件和基礎(chǔ)。未來有可能通過借鑒計算生物學(xué)的研究方法在中藥植物藥的基因組學(xué)、中藥新藥的虛擬藥物篩選、中醫(yī)藥數(shù)據(jù)挖掘和大數(shù)據(jù)分析、模擬與仿真等領(lǐng)域進行開創(chuàng)性的應(yīng)用研究。高性能計算在中醫(yī)藥領(lǐng)域的應(yīng)用將會對中醫(yī)藥科研方法的創(chuàng)新與發(fā)展產(chǎn)生深刻的影響。

參考文獻

[1] 顧蓓蓓,武虹,遲學(xué)斌,等.國內(nèi)外高性能計算應(yīng)用發(fā)展概況分析[J].科研信息化技術(shù)與應(yīng)用,2014,5(4):82-91.

[2] 周興銘.高性能計算技術(shù)發(fā)展[J].自然雜志,2011,33(5):249-254.

[3] 張理論,鄧小剛.戈登獎――分析與思考[J].計算機工程與科學(xué), 2012,34(8):44-52.

[4] 徐書華,金力.計算生物學(xué)[J].科學(xué),2009,61(4):34-37.

[5] 朱偉,羅頌平.治療輸卵管阻塞性不孕的中藥多靶活性成分計算機虛擬篩選[J].時珍國醫(yī)國藥,2012,23(6):1531-1532.

[6] ,孫曉波.網(wǎng)絡(luò)藥理學(xué):中醫(yī)藥現(xiàn)代化的新機遇[J].藥學(xué)學(xué)報,2012,47(6):696-703.

篇9

技術(shù)的進步正在帶來資源的解放。在石油勘探領(lǐng)域,這絕不是一句空話。在高性能計算逐漸成為石油勘探海量數(shù)據(jù)分析的基礎(chǔ)保障后,每一次技術(shù)的演進都會帶來勘探效率的提升及勘探技術(shù)革新的可能。所以,對于更強大的高性能計算技術(shù)的出現(xiàn),石油勘探行業(yè)甚至已經(jīng)從“需求”變成了“渴求”。業(yè)內(nèi)眾多研究機構(gòu)一直在期盼數(shù)年后才會成熟的、比目前全球最先進高性能計算技術(shù)強大數(shù)百倍的百億億級(即每秒能實現(xiàn)百億億次浮點計算)高性能計算技術(shù)能夠更快到來,為其所用。但在今年召開的以石油行業(yè)應(yīng)用為核心的第七屆高性能計算(HPC)及企業(yè)解決方案研討會上,記者發(fā)現(xiàn),隨著國內(nèi)石油勘探難度的加大,用戶對更強、更先進的高性能計算平臺和相關(guān)技術(shù)的需求也出現(xiàn)了新的變化。

開源+節(jié)流 化解“找油難”

在今年的研討會上,東方地球物理公司研究院處理中心總工程師賴能和特別強調(diào)了石油勘探行業(yè)目前面臨的三大“計算”挑戰(zhàn):可控震源高效采集技術(shù)的快速發(fā)展和廣泛應(yīng)用,使日產(chǎn)數(shù)據(jù)采集量直線上升,計算壓力進一步加大;高密度高覆蓋采集提高了勘探的精度,使精細化的數(shù)據(jù)分析成為可能,對計算能力的提升產(chǎn)生了更強烈的需求;高密度采集成為一種新趨勢,數(shù)據(jù)體越來越大,導(dǎo)致了計算效能的降低。

和去年相比,東方地球物理公司研究院處理中心今年承接的高密度海量數(shù)據(jù)3D項目更多、數(shù)據(jù)體也更大。賴能和告訴記者,處理中心目前承載的薩科桑3D、塔里木哈7、新疆瑪湖、新疆大慶3D、博孜3D等30個寬方位資料和科研攻關(guān)項目共涉及19029平方公里、384.8TB的數(shù)據(jù)量,均是采用高密度海量數(shù)據(jù)處理。這對處理中心的軟硬件處理能力、技術(shù)和資源配置都帶來了巨大壓力。

事實上,東方地球物理公司研究院處理中心的壓力恰恰來自“找油難”。石油是不可再生資源,當(dāng)大區(qū)塊開發(fā)告一段落后,石油勘探業(yè)一方面要用更精細化的手段在原有開采區(qū)塊發(fā)掘新機會,一方面則要積極向海洋拓展或到過去“看不上”的區(qū)域去找油。這種轉(zhuǎn)變帶來的直接影響正是賴能和所說的因數(shù)據(jù)體量飛速增長而產(chǎn)生的計算壓力?!暗刭|(zhì)結(jié)構(gòu)越來越復(fù)雜,對計算的需求也會越來越大。以海洋石油的開采為例,其計算量往往要比陸地石油開采大好幾倍。近年來主流軟件的演變從時間偏移到深度偏移再到逆時偏移,計算量越來越大。盡管集群單個節(jié)點的計算性能在提升,但集群節(jié)點量的增速也并沒有降低?!庇⑻貭枺ㄖ袊┢髽I(yè)解決方案部能源行業(yè)資深企業(yè)客戶經(jīng)理杭曉東認為石油勘探行業(yè)產(chǎn)生的“開源”需求,僅依靠提升CPU的計算能力已無法滿足,這也是讓英特爾改變產(chǎn)品發(fā)展方向,從異構(gòu)向微異構(gòu)調(diào)整的原因。今年,英特爾推出的Xeon Phi協(xié)處理器就是這樣的產(chǎn)品,在提升單點性能

得到大幅提升,從而讓高性能計算的效能提升。

在英特爾數(shù)據(jù)中心及互聯(lián)系統(tǒng)事業(yè)部技術(shù)計算和平臺應(yīng)用支持團隊平臺架構(gòu)師何萬青看來,高性能計算技術(shù)不僅能幫用戶“開源”,還能幫用戶“節(jié)流”,以提高產(chǎn)量。他說:“Xeon Phi的出現(xiàn)提供了一種可能性——用比較少的節(jié)點提供更高密度的計算能力。如野外的數(shù)據(jù)采集工作,就可以因為顯卡被集成到處理器中的特性而實現(xiàn)現(xiàn)場粗粒度的計算處理工作,減輕數(shù)據(jù)總量負擔(dān)。”云與大數(shù)據(jù)應(yīng)用的可能

高性能計算與可視化應(yīng)用難以落實到云計算系統(tǒng)的現(xiàn)實,曾一度讓業(yè)界認為“云”將與石油勘探行業(yè)無緣。目前,對非結(jié)構(gòu)化數(shù)據(jù)的分析更有價值的Hadoop,對于幾乎沒有非結(jié)構(gòu)化數(shù)據(jù)的石油勘探行業(yè)似乎也是無用之物。云計算與大數(shù)據(jù)真的不適合石油勘探行業(yè)嗎?這個問題已經(jīng)出現(xiàn)了新的答案。

在石油行業(yè),斯倫貝謝、蘭德馬克、Nice等服務(wù)公司正在提供功能較為完整的石油軟件云服務(wù)解決方案,并已被多家國際知名石油公司所采用。中石油也已經(jīng)啟動了云技術(shù)平臺建設(shè)項目。

“三年前我們開始探討虛擬化機制,嘗試勘探開發(fā)上的一些應(yīng)用。去年正式立項做云計算的技術(shù)測試、跟蹤并組織隊伍,主要進行四點應(yīng)用的實驗,今年爭取搭一個實用的環(huán)境?!敝袊痛髴c油田公司勘探開發(fā)研究院總工程師張鐵剛?cè)缡墙榻B了中石油云計算平臺項目的進展情況。他說,目前中石油總部的云計算平臺主要在考慮如何實現(xiàn)數(shù)據(jù)中心的整合、資源優(yōu)化、高效利用,結(jié)合能源應(yīng)用的特點,讓云平臺在地學(xué)綜合研究、辦公經(jīng)營管理業(yè)務(wù)以及生產(chǎn)管理方面發(fā)揮價值。

對于高密度采集這類應(yīng)用,中石油已經(jīng)完成了基于虛擬化技術(shù)的實驗,實驗證明云平臺確實可以大幅降低地學(xué)應(yīng)用研究的成本。張鐵剛很看好云平臺在中石油生產(chǎn)管理效率提升和辦公運維管理簡化方面的前景。據(jù)他介紹,初期測試結(jié)果顯示,通過資源整合,中石油可以將各單位門戶服務(wù)器的利用率從20%提高到70%,將專業(yè)應(yīng)用服務(wù)器的利用率從20%提高到40%。他直言,在中石油云技術(shù)平臺建設(shè)項目中,英特爾提供了很多重要的技術(shù)支持,特別是將其為互聯(lián)網(wǎng)公司構(gòu)建云計算系統(tǒng)的經(jīng)驗,傳遞到了高性能計算領(lǐng)域。

在石油勘探業(yè),高性能計算集群規(guī)模越來越大,卻未必能帶給用戶最佳的投資回報。計算的高峰期資源不足,低谷期資源卻被閑置。特別是,在集群空載狀態(tài)下同樣要支付巨額電費。與互聯(lián)網(wǎng)企業(yè)的需求一樣,不少高性能計算用戶也希望能彈性調(diào)配計算資源,分享低谷期的計算平臺,用于日常生產(chǎn)、辦公。今天,中石油的嘗試已經(jīng)把云的設(shè)想變?yōu)楝F(xiàn)實。

石油勘探行業(yè)是個典型的海量數(shù)據(jù)行業(yè),但它對數(shù)據(jù)處理的需求與大數(shù)據(jù)目前的定義還存在很大差距。雖然目前石油勘探行業(yè)的典型應(yīng)用還沒有必須依賴Hadoop的需要,但賴能和認為,這項新技術(shù)依舊值得他們長期跟蹤。因為如果Hadoop發(fā)展到了適合其應(yīng)用模型時,就會成為大幅降低硬件采購成本的一個選擇。

相關(guān)鏈接

跳出“石油”看高性能計算

篇10

關(guān)鍵詞:聚羧酸系高性能減水劑混凝土 減水率

前言

近年來,我國的基礎(chǔ)建設(shè)如高鐵、公路、機場、大壩、市政工程等一直保持高速增長,同時也推動了混凝土外加劑技術(shù)的飛速發(fā)展?;炷镣饧觿┑陌l(fā)展大致可分以下幾個階段:第一階段是起步階段,以普通減水劑木質(zhì)素為代表;第二階段以萘系高效減水劑為代表的發(fā)展階段,涌現(xiàn)了三聚氰胺、氨基磺酸鹽系、脂肪族減水劑等多種減水劑;第三階段即現(xiàn)階段,是混凝土外加劑走向高科技領(lǐng)域的階段,以聚羧酸系高性能減水劑為主要代表。自20世紀(jì)80年代后期,歐美等國家開始對聚羧酸系減水劑進行研究開發(fā),并于90年代中期開始推廣應(yīng)用,其中日本推廣比較成功。與傳統(tǒng)的減水劑相比它具有摻量少、減水率高、堿含量低、強度增加大、塌落度損失小、環(huán)境友好等特點。同時,萘資源的緊缺 、工業(yè)萘價格的不斷上漲、萘系減水劑生產(chǎn)周期較長、環(huán)境污染等問題日益突出,也使聚羧酸系減水劑的應(yīng)用勢在必行。它必將代替萘系減水劑,成為主流產(chǎn)品。本文介紹的聚羧酸系減水劑生產(chǎn)工藝過程簡單,所有原料基本全部轉(zhuǎn)化為減水劑,不需要分離提純,無三廢排放,所合成的減水劑質(zhì)量穩(wěn)定,非常適合工業(yè)化生產(chǎn)。

1聚羧酸系減水劑的作用機理

混凝土中摻入減水劑后,可在保持流動性的條件下顯著地降低水灰比。減水劑產(chǎn)生減水的效果主要是由于混凝土對減水劑的吸附和分散作用。而減水劑實際上就是一種使水泥粒子高度分散并使分散體系穩(wěn)定的表面活性劑,分散效果越好,體系越穩(wěn)定,減水效果越好,其混凝土的性能就越好。而水泥粒子的分散穩(wěn)定性又取決于吸附表面的活性劑的靜電斥力和立體穩(wěn)定效應(yīng)。據(jù)DLVO理論,水泥在水溶液中醚鍵的氧與水分子反應(yīng)形成強力的氫鍵,并形成親水保護膜,據(jù)分析立體保護膜提供了分散穩(wěn)定性。

傳統(tǒng)的減水劑在被水泥顆粒表面吸附后呈剛性鏈平臥吸附狀態(tài),立體穩(wěn)定效應(yīng)沒有發(fā)揮出來。而聚羧酸系減水劑一方面由于-COOH、―SO3負離子提供靜電斥力,另一方面聚羧酸系減水劑分子結(jié)構(gòu)中醚鍵與水分子形成氫鍵,從而形成親水性立體保護膜,該保護膜既有分散性又提供了水泥粒子的分散穩(wěn)定性,因此聚羧酸系減水劑在低水灰比條件下能夠更好的保持混凝土的工作性能及坍落度 。

2試驗

2.1合成原料:聚乙二醇(分子量1000)、引發(fā)劑、阻聚劑、甲基丙烯酸、丙烯酸羥丙酯、催化劑、自制A料和B料。

2.2儀器設(shè)備:電子稱、分析天平、電熱套、磁力攪拌器、溫度管、燒杯、恒溫水浴鍋 、水泥凈漿攪拌機、60L單臥軸式強制攪拌機等。

2.3試驗原料:鼎鑫普通硅酸鹽水泥、曲寨普通硅酸鹽水泥、正定河砂、鹿泉人工碎石

2.4合成步驟

大單體的合成:稱取定量的溶融的聚乙二醇、催化劑和阻聚劑在100℃~120℃下進行酯化反應(yīng),時間約2個小時,測定酯化率合格后,反應(yīng)結(jié)束。

減水劑的合成:將定量的大單體和甲基丙烯酸、丙烯酸羥丙酯等按比例混合,加入助劑A料和B料在水溶液中聚合,時間約為5小時,然后用濃度為32%的液堿中和至 pH值6-7即得。

2.5水泥凈漿流動度試驗

試驗參照GB8077-2000《混凝土外加劑勻質(zhì)性實驗方法》進行,稱取水泥300g,水87g,外加劑摻量為0.20%時測定摻不同羧酸減水劑的水泥凈漿流動度,并以此作為表征其性能的參數(shù)。

2.6混凝土減水率試驗

減水率測試按國家標(biāo)準(zhǔn)GB8076-2008《混凝土外加劑》測試坍落度損失。

2.7 凝結(jié)時間的測定

參照GB/T1346-2001《水泥標(biāo)準(zhǔn)稠度用水量、凝結(jié)時間、安定性檢測方法》測定水泥凈漿凝結(jié)時間。

3結(jié)果與討論

3.1減水劑的勻質(zhì)性指標(biāo)

按照國標(biāo)GB8077-2000《混凝土外加劑勻質(zhì)性實驗方法》檢測所合成的減水劑勻質(zhì)性項目指標(biāo).見表1.

表1 聚羧酸系減水劑勻質(zhì)性指標(biāo)

由勻質(zhì)性指標(biāo)可知,所合成的減水劑氯離子幾乎沒有,堿含量也比較低,完全符合混凝土配制的要求。

3.2水泥凈漿流動度試驗

分別用鼎新水泥P.042.5和曲寨水泥P.042.5兩種不同品牌的水泥,用本試驗羧酸(代號為A)和某品牌羧酸減水劑在三個不同摻量(摻量以固體計)下進行對比試驗。見表2

表2水泥凈漿流動度試驗情況

從上表可以看出,A 羧酸系減水劑對不同品牌的水泥適應(yīng)性較好,在摻量允許范圍內(nèi)隨著摻量增加,凈漿流動度逐漸增大,且狀態(tài)良好。與同類羧酸減水劑相比性能也具有一定的優(yōu)越性。但從經(jīng)濟角度講,推薦摻量為0.20%。

3.3不同摻量的減水率試驗情況

本實驗采用鼎新水泥P.042.5和基準(zhǔn)水泥P.042.5 兩種水泥分別進行測試,且分別采用0.12%、0.16%、0.20%三個不同的摻量予以確定。 結(jié)果見表3。

表3A羧酸減水劑減水率情況表

從上表可以看出A羧酸減水劑的減水率隨著摻量的增加明顯的增大,而且其在摻量較低時仍具有很高的減水率。

3.4混凝土性能試驗情況

本實驗采用鼎新水泥P.042.5 為試驗水泥,比較本試驗羧酸(代號A)和某品牌羧酸在相同摻量0.20%下的混凝土性能。詳見表4

表4不同羧酸的混凝土性能試驗表

從上表可以看出,A羧酸減水劑所表現(xiàn)出的性能指標(biāo)均符合GB8076-2008標(biāo)準(zhǔn)要求,且在同摻量下性能指標(biāo)優(yōu)于某品牌羧酸產(chǎn)品,所表現(xiàn)出的高減水率和增強性有利于配制高標(biāo)號或大坍落度要求的混凝土。

4結(jié)論:

用聚乙二醇、催化劑和阻聚劑、甲基丙烯酸、丙烯酸羥丙酯等原料兩步合成出性能優(yōu)異、質(zhì)量穩(wěn)定的聚羧酸系高性能減水劑。

本工藝生產(chǎn)的聚羧酸系高性能減水劑堿含量小于1.5%,且基本不含氯離子,無毒,對環(huán)境無污染,屬綠色環(huán)保產(chǎn)品。

本工藝生產(chǎn)的聚羧酸系高性能減水劑具有較高的減水率,適于配制商品混凝土、泵送混凝土、高強高性能混凝土等。

參考文獻

[1]郭延輝等.聚羧酸高性能減水劑及其應(yīng)用技術(shù)―現(xiàn)狀、發(fā)展趨勢和我們的任務(wù).聚羧酸系高性能減水劑及其應(yīng)用技術(shù).北京:機械工業(yè)出版社 ,2005.8

[2]姜國慶.日本高性能AE減水劑的研究進程及應(yīng)用現(xiàn)狀.化學(xué)建材,2000(2):42

[3]朱俊林等.聚羧酸系高性能混凝土減水劑的研制.聚羧酸系高性能減水劑及其應(yīng)用技術(shù).北京:機械工業(yè)出版社 ,2005.8