大數(shù)據(jù)平臺解決方案范文

時間:2023-03-20 18:17:38

導語:如何才能寫好一篇大數(shù)據(jù)平臺解決方案,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

大數(shù)據(jù)平臺解決方案

篇1

EMC Isilon:橫向擴展 性能突出

數(shù)據(jù)存儲不是一類單獨的產(chǎn)品,它有很多實現(xiàn)方式。EMC Isilon存儲事業(yè)部總經(jīng)理楊蘭江概括說,大數(shù)據(jù)存儲應該具有以下一些特性:海量數(shù)據(jù)存儲能力,可輕松管理PB級乃至數(shù)十PB的存儲容量;具有全局命名空間,所有應用可以看到統(tǒng)一的文件系統(tǒng)視圖;支持標準接口,應用無需修改可直接運行,并提供API接口進行面向對象的管理;讀寫性能優(yōu)異,聚合帶寬高達數(shù)GB乃至數(shù)十GB;易于管理維護,無需中斷業(yè)務即可輕松實現(xiàn)動態(tài)擴展;基于開放架構,可以運行于任何開放架構的硬件之上;具有多級數(shù)據(jù)冗余,支持硬件與軟件冗余保護,數(shù)據(jù)具有高可靠性;采用多級存儲備份,可靈活支持SSD、SAS、SATA和磁帶庫的統(tǒng)一管理。

通過與中國用戶的接觸,楊蘭江認為,當前中國用戶最迫切需要了解的是大數(shù)據(jù)存儲有哪些分類,而在大數(shù)據(jù)應用方面面臨的最大障礙就是如何在眾多平臺中找到適合自己的解決方案

EMC針對不同的應用需求可以提供不同的解決方案:對于能源、媒體、生命科學、醫(yī)療影像、GIS、視頻監(jiān)控、HPC應用、某些歸檔應用等,EMC會首推以Isilon存儲為核心的大數(shù)據(jù)存儲解決方案;對于虛擬化以及具有很多小文件的應用,EMC將首推以VNX、XtremIO為核心的大數(shù)據(jù)存儲解決方案;對于大數(shù)據(jù)分析一類的應用需求,EMC會綜合考慮客戶的具體需求,推薦Pivotal、Isilon等一體化的解決方案。在此,具體介紹一下EMC用于大數(shù)據(jù)的橫向擴展NAS解決方案——EMC Isilon,其設計目標是簡化對大數(shù)據(jù)存儲基礎架構的管理,為大數(shù)據(jù)提供靈活的可擴展平臺,進一步提高大數(shù)據(jù)存儲的效率,降低成本。

EMC Isilon存儲解決方案主要包括三部分:EMC Isilon平臺節(jié)點和加速器,可從單個文件系統(tǒng)進行大數(shù)據(jù)存儲,從而服務于 I/O 密集型應用程序、存儲和近線歸檔;EMC Isilon基礎架構軟件是一個強大的工具,可幫助用戶在大數(shù)據(jù)環(huán)境中保護數(shù)據(jù)、控制成本并優(yōu)化存儲資源和系統(tǒng)性能;EMC Isilon OneFS操作系統(tǒng)可在集群中跨節(jié)點智能地整合文件系統(tǒng)、卷管理器和數(shù)據(jù)保護功能。

楊蘭江表示,企業(yè)用戶選擇EMC Isilon的理由可以歸納為以下幾點。第一,簡化管理,增強易用性。與傳統(tǒng)NAS相比,無論未來存儲容量、性能增加到何種程度,EMC Isilon的安裝、管理和擴展都會保持其簡單性。第二,強大的可擴展性。EMC Isilon可以滿足非結構化數(shù)據(jù)的存儲和分析需求,單個文件系統(tǒng)和卷中每個集群的容量為18TB~15PB。第三,更高的處理效率,更低的成本。EMC Isilon在單個共享存儲池中的利用率超過80%,而EMC Isilon SmartPools軟件可進一步優(yōu)化資源,提供自動存儲分層,保證存儲的高性能、經(jīng)濟性。第四,靈活的互操作性。EMC Isilon支持眾多行業(yè)標準,簡化工作流。它還提供了API可以向客戶和ISV提供OneFS控制接口,提供Isilon集群的自動化、協(xié)調和資源調配能力。

EMC Isilon大數(shù)據(jù)存儲解決方案已經(jīng)在醫(yī)療、制造、高校和科研機構中有了許多成功應用。

方案點評

EMC Isilon是一個強大但簡單的橫向擴展NAS方案,適用于希望投資數(shù)據(jù)管理而不是單純存儲的企業(yè)。當初,EMC將收購來的分布式數(shù)據(jù)倉庫軟件廠商Greenplum的軟件與Isilon存儲組合成了EMC最早的大數(shù)據(jù)解決方案。用戶既可以分開選擇Greenplum軟件或Isilon存儲,也可以選擇由Greenplum軟件和Isilon存儲組成的一體機解決方案。現(xiàn)在,Greenplum軟件雖然已歸Pivotal公司,但EMC是Pivotal的經(jīng)銷商與合作伙伴,Greenplum與Isilon存儲的組合方案并不會因此受到影響。

HDS UCP:統(tǒng)一平臺 應用優(yōu)化

HDS中國區(qū)解決方案與專業(yè)服務事業(yè)部總監(jiān)陳戈認為,大數(shù)據(jù)存儲應該是一個解決方案:“大數(shù)據(jù)解決方案是由基礎架構的各部件組成的,包含數(shù)據(jù)存儲、計算和分析,而存儲是此架構中的一部分。”

大數(shù)據(jù)的存儲類型與傳統(tǒng)的存儲類型有一定區(qū)別:在大數(shù)據(jù)存儲中,更多的應用是一次寫、多次讀,讀得更多是大數(shù)據(jù)存儲的一個特點,而在傳統(tǒng)的數(shù)據(jù)存儲中,讀寫是隨機的,由于每個應用不同,其讀寫的比例也是隨機的;大數(shù)據(jù)存儲需要具有橫向的可擴展性,并可支持多種接口、多種數(shù)據(jù)訪問協(xié)議,便于不同數(shù)據(jù)進入這個大數(shù)據(jù)平臺。

談到中國用戶在大數(shù)據(jù)存儲應用中最迫切的需求是什么,陳戈認為,中國用戶最迫切的需求是如何逐步實現(xiàn)大數(shù)據(jù)應用,即用戶從現(xiàn)有的模式如何過渡到大數(shù)據(jù),如何更好地利用大數(shù)據(jù)進行經(jīng)營分析。

大數(shù)據(jù)的經(jīng)典定義可以歸納為四個“V”,但企業(yè)不可能一步到位實現(xiàn)四個“V”,這需要一個循序漸進的過程。海量的、多種類型的數(shù)據(jù)是一次性全部載入到大數(shù)據(jù)中,還是通過現(xiàn)有的平臺進行數(shù)據(jù)初選,再導入到大數(shù)據(jù)平臺中,是兩種不同的實現(xiàn)途徑。“先通過現(xiàn)有平臺進行數(shù)據(jù)初選,再導入到大數(shù)據(jù)平臺,這種方式更適合于客戶逐漸實現(xiàn)大數(shù)據(jù),可以縮短用戶實現(xiàn)大數(shù)據(jù)應用的時間。”陳戈表示,“大數(shù)據(jù)主要是非結構化數(shù)據(jù)。用戶可以使用基于對象數(shù)據(jù)存儲的HCP,利用其獨特的元數(shù)據(jù)采集和智能工具,對非結構化文件數(shù)據(jù)進行管理,實現(xiàn)智能的自動化,這有助于對數(shù)據(jù)進行深度分析,幫助客戶從單一系統(tǒng)中存儲、共享、同步、保護、保存、分析和檢索文件數(shù)據(jù),減少垃圾數(shù)據(jù),進而為大數(shù)據(jù)分析建立一個良好的基礎。”

談到用戶在大數(shù)據(jù)應用中遇到的主要障礙,陳戈表示,一方面,應用軟件本身的智能程度是否能滿足行業(yè)應用需求,應用軟件是否已經(jīng)成型,大數(shù)據(jù)人才是否具備等,是讓大數(shù)據(jù)應用落地的關鍵;另一方面,如何抽取數(shù)據(jù),放在大數(shù)據(jù)平臺中進行相應的計算是另一個關鍵問題。

HDS可為所有數(shù)據(jù)提供單一、可擴展的虛擬化集成平臺。HDS推出了“三步”云戰(zhàn)略,從基礎架構、內容和信息三個層面幫助客戶解決目前所遇到的問題。具體來看,通過“基礎架構云”,HDS可以幫助客戶進行虛擬化和集成管理,實現(xiàn)數(shù)據(jù)中心的整合;在第二層的“內容云”當中,HDS可以按需提供內容,更可以不受應用限制地進行數(shù)據(jù)搜索和集成;在第三層的“信息云”中,針對所有數(shù)據(jù)類型,HDS在其存儲平臺中融入了分析功能,使客戶可以從數(shù)據(jù)信息中獲取洞察力。

HDS提供的UCP for SAP HANA集成了基于大量數(shù)據(jù)集的創(chuàng)新和內存分析技術,并提供實時的洞察力,從而使當前的信息驅動型企業(yè)可以加快其商業(yè)決策的速度。陳戈介紹說,UCP for SAP HANA解決方案結合了HDS刀片服務器技術、企業(yè)級存儲系統(tǒng)和業(yè)內領先的網(wǎng)絡組件,在這樣一個集成的、高性能的硬件平臺上可以快速交付SAP下一代內存計算技術。全球已有超過200家客戶在使用HDS和SAP的大數(shù)據(jù)解決方案。

方案點評

其實,HDS的“三步”云戰(zhàn)略也可以看成是其大數(shù)據(jù)戰(zhàn)略。HDS借助以UCP為核心的大數(shù)據(jù)平臺,可以幫助企業(yè)用戶構建從基礎架構到內容歸檔和搜索,直至信息提取和分析的全面、高效的大數(shù)據(jù)解決方案。HDS的“信息云”直接與大數(shù)據(jù)相關。UCP是一個集成了計算、存儲與網(wǎng)絡的一體化平臺,它既可以提供像一體機一樣的整合性、簡單性,又可以提供靈活的選擇,連接第三方的設備組件。HDS還通過與包括SAP在內的眾多大數(shù)據(jù)分析類的合作伙伴合作,針對行業(yè)定制優(yōu)質的大數(shù)據(jù)解決方案。

HP StoreAll :快速部署 極速搜索

中國惠普有限公司企業(yè)集團存儲產(chǎn)品部存儲架構師張楠向記者表示,大數(shù)據(jù)存儲是一套解決方案,應該能夠對大數(shù)據(jù)的Volume、Velocity、Variety和Value四個方面提供全面的支持。

第一,大數(shù)據(jù)存儲要支持海量級的數(shù)據(jù)存儲,比如具有PB級的存儲能力。第二,大數(shù)據(jù)存儲要支持更高的存儲速度,支持10Gb甚至更高的網(wǎng)絡連接。第三,大數(shù)據(jù)存儲要支持數(shù)據(jù)的多樣性,如圖片、文本、視頻、音頻等。第四,大數(shù)據(jù)最重要的是價值的體現(xiàn),而為了實現(xiàn)這一點,存儲本身應該具備快速、智能的數(shù)據(jù)檢索能力。“在存儲的最底層提供最直接、快捷的數(shù)據(jù)檢索。這一過程簡單說就是,將上層的數(shù)據(jù)挖掘工作下移,充分利用存儲強大的處理能力和數(shù)據(jù)識別能力。”張楠舉例說,“比如,在秒級的單位內對數(shù)據(jù)進行極速的搜索, 從幾千萬甚至上億個文件中找到目標數(shù)據(jù)。”

另外,模糊查詢能力也是大數(shù)據(jù)存儲不可缺少的功能。智能的模糊查詢將為大數(shù)據(jù)平臺提供更加便捷的存儲服務能力,使得存儲更像一臺智能的高速計算設備。

目前,很多中國用戶在存儲廠商的引導下,片面追求存儲的大容量和高性能,而忽略了大數(shù)據(jù)存儲本身應該提供的其他額外屬性。中國用戶在實施大數(shù)據(jù)的過程中經(jīng)常遇到的障礙有以下兩方面:第一,無法將存儲與大數(shù)據(jù)平臺進行對接;第二,無法充分利用大數(shù)據(jù)存儲的價值,也很難將其運用到實際的業(yè)務中。張楠表示,究其原因,主要在于有些大數(shù)據(jù)存儲產(chǎn)品沒有開放的接口協(xié)議,或沒有針對用戶的大數(shù)據(jù)場景進行特別優(yōu)化,也沒有用戶容易接受的易用的管理方式等。

惠普在大數(shù)據(jù)方面可以提供軟硬結合的解決方案。惠普在收購Autonomy公司之后,將其軟件與惠普的硬件平臺進行了整合, 形成了一套完整的大數(shù)據(jù)解決方案。張楠介紹說,在存儲方面,惠普擁有像StoreAll這樣的大數(shù)據(jù)存儲平臺。借助HP StoreAll硬件平臺,用戶除了可以實現(xiàn)海量數(shù)據(jù)的存儲和高速數(shù)據(jù)訪問以外,還能實現(xiàn)高級的數(shù)據(jù)檢索功能,對特殊文件進行快速定位。同時,結合HP Autonomy軟件的特性,惠普還引入了模糊查詢、智能語義庫等概念,可以幫助企業(yè)用戶通過存儲底層為上層業(yè)務帶來所需的大數(shù)據(jù)業(yè)務價值。

如今,閃存不僅在大數(shù)據(jù)領域,而且在Tier 1存儲市場同樣占據(jù)著十分重要的地位。對于大數(shù)據(jù)平臺來說,閃存可用來提升存儲的存取速度,降低I/O的響應時間等。針對那些I/O壓力十分明確的大數(shù)據(jù)平臺, SSD可以發(fā)揮其效果, 提升存儲的整體性能。但是,SSD并不是萬能的。因為大部分的數(shù)據(jù)都是非結構化的,而非結構化數(shù)據(jù)對I/O的響應要求遠遠沒有對帶寬的需求大,所以,讓用戶花數(shù)倍的價格購買SSD存儲在目前來看還是比較困難的。從目前情況看,引入閃存的大數(shù)據(jù)解決方案還不是很普遍。

方案點評

惠普在大數(shù)據(jù)方面收購了兩個軟件公司Vertica與Autonomy,然后將它們的軟件與原有的硬件平臺進行整合,針對結構化和非結構化的數(shù)據(jù)都可以提供針對性的解決方案。惠普在將大數(shù)據(jù)軟件與存儲硬件結合上也進行了嘗試,其中一個成功的例子就是HP StoreAll大數(shù)據(jù)存儲平臺。HP StoreAll具有以下特點:橫向擴展,最大可以擴展到16TB;集成HP Autonomy搜索引擎,可以快速搜索,實現(xiàn)實時大數(shù)據(jù)的價值;內置對OpenStack的支持,可快速部署;支持文件和對象類型的數(shù)據(jù)存儲。

NetApp:統(tǒng)一架構 無限擴展

如今,企業(yè)若想獲得成功,就必須想方設法應對具有前所未有的復雜性、高性能的海量數(shù)據(jù),并盡可能地管理這些數(shù)據(jù),從中發(fā)掘更大的商業(yè)價值。

對于國內用戶來說,無論企業(yè)的規(guī)模和數(shù)據(jù)量大小如何,運用大數(shù)據(jù)的關鍵在于,企業(yè)是否把大數(shù)據(jù)作為一個真正的工具,去體現(xiàn)企業(yè)的差異化,從而提升競爭力。隨著越來越智慧的企業(yè)信息化的發(fā)展,IT不再是束縛企業(yè)發(fā)展的瓶頸,而是真正地融入了企業(yè)自身的業(yè)務中。越來越多的公司將大數(shù)據(jù)成功地運用于企業(yè)的商業(yè)模式。例如,在歐美,很多企業(yè)已經(jīng)著手將大量資源投放在大數(shù)據(jù)領域。反觀國內,在金融領域,有為數(shù)不少的企業(yè)通過大數(shù)據(jù)的分析工具來分析金融的走勢,實現(xiàn)風險管理,進行信用卡的追蹤等。此外,像零售、制造、電信等行業(yè)也已在嘗試利用大數(shù)據(jù)分析工具為企業(yè)營銷和決策提供支撐。

無論企業(yè)現(xiàn)在是否正在使用大數(shù)據(jù)工具,企業(yè)都應全面地考慮自身未來發(fā)展的需求,選擇一個廠家的平臺與之共同發(fā)展,這可以有效避免因數(shù)據(jù)和應用遷移帶來的麻煩。

在大數(shù)據(jù)方面,NetApp能夠幫助企業(yè)實現(xiàn)數(shù)據(jù)管理,應對業(yè)務挑戰(zhàn)的極限,將以數(shù)據(jù)為導向的洞察轉化為有效行動。若想將數(shù)據(jù)轉化為商機,僅僅提升管理能力是不夠的,需要徹底轉變數(shù)據(jù)和業(yè)務之間的聯(lián)系模式。NetApp可以幫助企業(yè)用戶持續(xù)管理數(shù)據(jù),迅速把握意料之外的新商機,永久保存所有數(shù)據(jù),并在靈活、開放的存儲平臺之上打造屬于企業(yè)自己的大數(shù)據(jù)解決方案。

NetApp提供了可高效處理、分析、管理和訪問大規(guī)模數(shù)據(jù)的大數(shù)據(jù)解決方案。NetApp的解決方案組合可劃分為分析、帶寬和內容三個主要用例,這被稱之為大數(shù)據(jù)的“ABC”基本要素。

具體來看,分析(Analysis)是指針對極大數(shù)據(jù)集的高效分析。NetApp分析解決方案就是幫助用戶深入了解和利用數(shù)字世界,將數(shù)據(jù)轉化為高質量的信息,以及提供關于業(yè)務的更深入見解,從而幫助企業(yè)做出更好的決策。

帶寬(Bandwidth)是指適用于數(shù)據(jù)密集型工作負載的性能。此類解決方案著重于為速度非常快的工作負載提供更高的性能。高帶寬應用包括高性能計算(能以極快的速度執(zhí)行復雜的分析)、用于監(jiān)控和任務規(guī)劃的高性能視頻流、媒體和娛樂領域中的視頻剪輯和播放。

內容(Content)是指無限的安全數(shù)據(jù)存儲。此類解決方案著重于滿足可擴展的安全數(shù)據(jù)存儲需求。內容解決方案必須支持存儲的無限擴展能力,以便企業(yè)可以根據(jù)需要存儲任意多的數(shù)據(jù),并能在需要時找到所需的數(shù)據(jù)。

NetApp致力于通過一系列解決方案來提供高性能的運算和大數(shù)據(jù)的應用。2013年11月,NetApp再次更新了E系列家族產(chǎn)品,推出E2700和E5500。該系列產(chǎn)品采用可輕松擴展的設計,適用于要求99.999%的可靠性且穩(wěn)定、高性能的工作負載。

用戶在采購大數(shù)據(jù)存儲產(chǎn)品時,需要注意以下五個方面的問題:大數(shù)據(jù)存儲必須具有向上擴展與向外擴展的能力;架構必須是針對工作負載進行優(yōu)化的,具有實時處理能力;具有整合的數(shù)據(jù)保護功能;保證7×24小時運行不中斷,可在線進行容量擴展,實施數(shù)據(jù)遷移等;可以實現(xiàn)服務的自動化。

方案點評

NetApp的技術優(yōu)勢集中體現(xiàn)在其統(tǒng)一存儲平臺上,從入門級產(chǎn)品到企業(yè)級產(chǎn)品,全部基于同一個體系架構和操作系統(tǒng),不僅部署和使用方便,而且升級和擴展非常簡單。當初,NetApp收購LSI Engenio,其中一個重要的原因就是為了大數(shù)據(jù)。2013年,NetApp不斷更新E系列產(chǎn)品線,推出E2700和E5500等。E5500可以支持高IOPS混合工作負載和數(shù)據(jù)庫、高性能文件系統(tǒng)和帶寬密集型流等應用,可確保數(shù)據(jù)的高可用性、完整性和安全性。

曙光XData:高度集成 貼近行業(yè)

關于大數(shù)據(jù)存儲,目前業(yè)界沒有一個通用的定義。曙光信息產(chǎn)業(yè)股份有限公司總裁助理兼存儲產(chǎn)品線產(chǎn)品總監(jiān)惠潤海從曙光大數(shù)據(jù)平臺和解決方案角度,概括出大數(shù)據(jù)存儲的主要特征。

首先,大數(shù)據(jù)存儲必須支持全類型數(shù)據(jù), 包括結構化、半結構化和非結構數(shù)據(jù),實現(xiàn)統(tǒng)一數(shù)據(jù)支持。

其次,存儲性能上,一方面,大數(shù)據(jù)存儲要支持海量數(shù)據(jù),并且要在保證數(shù)據(jù)可靠性的基礎之上,實現(xiàn)容量與性能的線性擴展;另一方面,為了實現(xiàn)大數(shù)據(jù)的價值,批處理和實時處理兩種措施都需要高性能的數(shù)據(jù)訪問獲取能力。

最后,在系統(tǒng)達到一定規(guī)模之后,系統(tǒng)的易用性和可管理性也是不可或缺的。

從應用角度來說,目前中國用戶在大數(shù)據(jù)存儲應用中最迫切的需求,是如何真正實現(xiàn)用戶數(shù)據(jù)的價值,如何驅動業(yè)務發(fā)展,實現(xiàn)決策和運營。“從系統(tǒng)構建層面說,要實現(xiàn)數(shù)據(jù)高性價比的存儲和管理,同時滿足數(shù)據(jù)服務的相關需求。”惠潤海表示。

針對用戶對大數(shù)據(jù)存儲的需求, 曙光推出了像大數(shù)據(jù)一體機這樣的全類型數(shù)據(jù)分析型產(chǎn)品,同時還基于該產(chǎn)品構建了基于行業(yè)的解決方案,以幫助用戶實現(xiàn)大數(shù)據(jù)落地。

“除此之外, 我們還提供了大數(shù)據(jù)統(tǒng)一數(shù)據(jù)中心解決方案, 涵蓋了像主攻事物處理的DS900、DS800,以及針對文件存儲的Parastor等存儲產(chǎn)品。我們基于這些存儲產(chǎn)品構建了大數(shù)據(jù)運營管理平臺。”惠潤海介紹說,“曙光的優(yōu)勢不僅在于可以提供全面的產(chǎn)品支撐,更重要的是能夠提供數(shù)據(jù)生命周期過程服務支持。目前,我們提供的免費維保期限為5年。”

曙光開發(fā)了針對不同行業(yè)和應用場景的大數(shù)據(jù)存儲解決方案。以金融行業(yè)為例,目前國內四大行的應用系統(tǒng)每年產(chǎn)生的非結構化數(shù)據(jù)量已達到PB級,結構化數(shù)據(jù)也以百TB計。面對如此大量的數(shù)據(jù),如何存儲、管理、利用和盤活它們呢?惠潤海認為,只有通過商業(yè)智能和高級分析應用解決方案才能將數(shù)據(jù)的價值最大程度地發(fā)揮出來。

針對金融行業(yè)用戶的需求,曙光開發(fā)的XData大數(shù)據(jù)解決方案利用優(yōu)化的大數(shù)據(jù)處理技術,對文件管理、歷史數(shù)據(jù)查詢和數(shù)據(jù)分析類應用等進行深入研究,為數(shù)據(jù)爆炸式增長帶來的海量數(shù)據(jù)存儲及分析應用提供高可靠的解決方案。

曙光金融行業(yè)XData大數(shù)據(jù)解決方案采用曙光自主研發(fā)的SN-MPP并行數(shù)據(jù)庫,同時結合大數(shù)據(jù)處理事實標準Hadoop,并充分考慮了多方面的數(shù)據(jù)收集,加入ETL工具和連接驅動器,提供了類SQL的接口,還和現(xiàn)有金融業(yè)務系統(tǒng)進行對接。

針對金融行業(yè)歷史數(shù)據(jù),XData大數(shù)據(jù)解決方案在方案設計上主要考慮了數(shù)據(jù)的安全性、歷史數(shù)據(jù)高效導入、快速訪問與分析報表。曙光金融行業(yè)大數(shù)據(jù)解決方案立足于基礎平臺建設,同時切實貼合金融行業(yè)用戶需求,提供了優(yōu)質的軟硬一體化解決方案,為用戶一攬子解決了部署、業(yè)務移植開發(fā)等技術難題,幫助用戶跨過應用門檻。

篇2

這正是白宮網(wǎng)站的《大數(shù)據(jù)研究和發(fā)展倡議》所追求的——“通過收集、處理龐大而復雜的數(shù)據(jù)信息,獲得知識和洞見,提升能力,加快科學、工程領域的創(chuàng)新步伐,轉變教育和學習模式”。

各行各業(yè)都能用得上大數(shù)據(jù),只是對大數(shù)據(jù)重要性的意識程度不同:凱捷咨詢(Capgemini)的調研結果顯示,76%能源和自然資源行業(yè)的高管相信公司是數(shù)據(jù)驅動的,在醫(yī)療醫(yī)藥行業(yè)和生物科技行業(yè)這個數(shù)字為75%,在金融行業(yè)為73%。包括英特爾在內的有能力提供大數(shù)據(jù)解決方案的IT廠商正在努力讓各行各業(yè)的企業(yè)切實感受到大數(shù)據(jù)的魔力。

能否置身事外?

隨著網(wǎng)絡應用和多媒體應用的興起,互聯(lián)網(wǎng)成為大數(shù)據(jù)的主要來源。隨之而產(chǎn)生的網(wǎng)絡營銷調整圍繞大數(shù)據(jù)而展開。淘寶是國內公認的對用戶數(shù)據(jù)利用得較好的公司——淘寶網(wǎng)利用大數(shù)據(jù)統(tǒng)計分析得到諸如“歐洲杯的球隊勝負如何影響各隊球衣的銷量?花露水的最佳搭配是電蚊拍還是痱子粉?”等問題的有趣結果,并以此為依據(jù)來更好地調整營銷戰(zhàn)略。

近日,阿里巴巴集團宣布,將在集團管理層面設立首席數(shù)據(jù)官崗位(Chief Data Officer),負責全面推進阿里巴巴集團成為“數(shù)據(jù)分享平臺”的戰(zhàn)略。這直接證明了大數(shù)據(jù)對于互聯(lián)網(wǎng)企業(yè)的意義。

別的行業(yè)能不能對大數(shù)據(jù)冷眼旁觀呢?賽迪智庫軟件與信息服務業(yè)研究所研究員安暉認為,雖然目前大數(shù)據(jù)的主要來源是互聯(lián)網(wǎng),但許多以信息流作為核心競爭力,如金融、電信、零售等行業(yè)的機構或企業(yè),其數(shù)據(jù)量也不容低估。例如,美國國家海洋和大氣管理局(NOAA)數(shù)據(jù)中心存儲的數(shù)據(jù)超過20PB,沃爾瑪數(shù)據(jù)中心的存儲能力超過4PB,eBay分析平臺每天處理的數(shù)據(jù)量高達100PB。并且,由于這些機構和企業(yè)所存儲的數(shù)據(jù)更加有針對性,其數(shù)據(jù)的價值密度更高,進行大數(shù)據(jù)處理的意義更強,運用大數(shù)據(jù)的需求也更為迫切。

安暉以數(shù)個典型行業(yè)為例來說明大數(shù)據(jù)能帶來什么好處——電信行業(yè)可以從龐大的數(shù)據(jù)中分析出不同群體的差異化需求,實現(xiàn)套餐制定等精準營銷;制造行業(yè)可以通過整合來自研發(fā)、工程和制造部門的數(shù)據(jù)以實行并行工程,顯著縮短產(chǎn)品上市時間并提高質量;交通行業(yè)可以通過整合和處理相關數(shù)據(jù),實現(xiàn)智能交通(管理)與高效物流調度。

賽迪顧問軟件與信息服務業(yè)研究中心研究總監(jiān)胡小鵬認為,金融行業(yè)中證券、信用卡、電子支付等數(shù)據(jù)規(guī)模龐大,具有使用對象多樣化、信息可靠性、實時性、保密性要求高等特點;電信行業(yè)中大數(shù)據(jù)主要體現(xiàn)為電信業(yè)務系統(tǒng)產(chǎn)業(yè)的計費賬務數(shù)據(jù)和用戶信息(包括客戶資料、客戶服務數(shù)據(jù)等),不僅數(shù)據(jù)量大,而且保存時間長;能源行業(yè)大數(shù)據(jù)主要集中在石油勘探以及電力生產(chǎn)、經(jīng)營、管理等數(shù)據(jù),具有數(shù)據(jù)量大、分散、類型復雜等特點。其中,在金融行業(yè),利用大數(shù)據(jù)的挖掘和分析改善用戶體驗、監(jiān)督欺詐行為、驗證合規(guī)性、服務創(chuàng)新等,從而助力金融智能決策,提升競爭力;而對于電力行業(yè),大數(shù)據(jù)分析有利于電網(wǎng)安全高效運行(安全檢測與控制、災難預警與處理、供電與電力調度決策支持和負荷預測)、電力營銷(用戶用電行為分析)、集團集中管控與精細化管理等。

大數(shù)據(jù)這場盛宴上,哪個行業(yè)也不愿意沒有一席之地。

誰能站出來?

大數(shù)據(jù)的熱度可以由英特爾、IBM、EMC、惠普等廠商紛紛推出面向大數(shù)據(jù)的一體化產(chǎn)品和解決方案直接反映出來。

然而,一個不能逃避的現(xiàn)實是,雖然越來越多的行業(yè)用戶嘗試應用大數(shù)據(jù)的解決方案,但是大多數(shù)行業(yè)用戶對于大數(shù)據(jù)的認知仍然比較有限。面對林林總總的不同廠商提供的大數(shù)據(jù)解決方案,用戶分不清這些解決方案的差異在哪里,也就不會真正了解哪種解決方案適合自己。

有用戶反映,大數(shù)據(jù)解決方案容易給人的錯覺是該解決方案就是把數(shù)據(jù)分布存儲,再并行處理。即使采用國外廠商的工具,這些工具成熟度不是特別高,導致解決實際問題的時間過長。

英特爾相關專家表示,從總體上看,中國大數(shù)據(jù)市場發(fā)展迅速,特征明顯,相關技術和應用可改進和提升的空間巨大。而且大數(shù)據(jù)要落地,必須實現(xiàn)包括芯片商、軟件企業(yè)等在內的IT基礎設施與服務層平臺的開放。

英特爾在硬件上的領先無需多言。在軟件層面,考慮到Hadoop的開源特性,很多廠商都有機會在Hadoop的基礎上推出產(chǎn)品,但行業(yè)解決方案提供商面臨的一個苦惱是,他們不得不進行底層開發(fā)。實際上,底層解決方案是有很多共性的。對行業(yè)解決方案提供商來說,如果有一個由可靠廠商優(yōu)化過的平臺再好不過了。利用這個平臺,行業(yè)解決方案提供商可以拋開重復的、無意義的勞動,將注意力和精力更加集中在行業(yè)特點上,進而開發(fā)出滿足行業(yè)所需的實打實的行業(yè)解決方案。在這種情況下,英特爾適時地推出了英特爾Hadoop發(fā)行版,打造一個優(yōu)秀的、高價值的底層平臺。

對于如何從大數(shù)據(jù)中發(fā)掘價值,英特爾指出,這需要在IT基礎設施與服務層、數(shù)據(jù)組織與管理層、數(shù)據(jù)分析與發(fā)現(xiàn)層、決策支持與IT服務層全面引入新的技術,特別是在堪稱大數(shù)據(jù)應用“載體”的IT基礎設施與服務層,采用基于開放架構的平臺將是最佳選擇。

O‘Reilly Strata和Open Source Convention大會委員會主席Edd Dumbill曾指出,使大數(shù)據(jù)真正變得強大的方式之一就是讓上層程序員可以將精力放在數(shù)據(jù)而非底層Hadoop設施的抽象特征上。他們編寫更簡短的程序,能夠更清晰地表達出對數(shù)據(jù)所做的處理。這些將有助于為非程序員創(chuàng)建更好的工具。

延伸到企業(yè)層面,“行業(yè)解決方案提供商需要穩(wěn)定性和可用性都足夠好的平臺。在這樣的平臺上,行業(yè)解決方案提供商可以從不必要的重復性勞動中解放出來,從而把更多的精力放在提供差異化特色方案和服務上。”英特爾亞太研發(fā)有限公司總經(jīng)理、英特爾軟件與服務事業(yè)部中國區(qū)總經(jīng)理何京翔的看法類似。進而,他解讀了英特爾Hadoop發(fā)行版的優(yōu)勢:“英特爾Hadoop發(fā)行版的優(yōu)勢在于:處理接近于實時;能在英特爾平臺上實現(xiàn)最優(yōu)化的性能,比非英特爾發(fā)行版有成倍的增長;通過和電信、智能城市、醫(yī)療等行業(yè)客戶的合作,英特爾Hadoop還做了更進一步的優(yōu)化。”

除了提供平臺,英特爾(中國)行業(yè)合作與解決方案部中國區(qū)總監(jiān)凌琦強調,英特爾還會把大數(shù)據(jù)解決方案的研究和服務作為投資部門的重點。英特爾的風險投資部門也對大數(shù)據(jù)中所涉及的關鍵平臺、關鍵應用、提供商,給予關注。

行業(yè)側重點

英特爾硬件平臺的特點讓其可以用“通吃”來形容,行業(yè)特色則由軟件來體現(xiàn)。

正如英特爾Hadoop發(fā)行版白皮書所指出的,它“為企業(yè)應用而優(yōu)化”,其擁有的增強高可靠性、增強分布式文件系統(tǒng)HDFS擴展性(使集群的I/O吞吐量能夠隨著節(jié)點數(shù)量的增加而線性增加)、動態(tài)調整數(shù)據(jù)復制策略(提高熱點數(shù)據(jù)的并發(fā)訪問能力)、改進分布式計算框架調度算法(避免并行任務退化成串行執(zhí)行)、增加Hadoop集群監(jiān)控管理、優(yōu)化HBase查詢、實現(xiàn)細粒度的HBase合并調度控制(避免合并風暴)、創(chuàng)建異地HBase大表、均衡負載等相對開源Hadoop和其他Hadoop發(fā)行版的核心優(yōu)勢在多個行業(yè)中均不可或缺。

篇3

日前,在戴爾公司召開的2012年高層客戶峰會上,戴爾亞太及日本地區(qū)總裁、全球新興市場董事長閔毅達(Amit Midha)表示,IT市場目前呈現(xiàn)出五大趨勢:IT系統(tǒng)簡化、虛擬化與云計算逐步普及、數(shù)據(jù)大爆炸、新興市場發(fā)展、IT消費化。因此,他認為,推動部署虛擬化、降低IT系統(tǒng)運營成本、管理快速增加的復雜數(shù)據(jù)、管理工作人員所使用的各種IT設備,這些都成為企業(yè)面臨的挑戰(zhàn)。戴爾近年來同樣通過轉型,努力提高全面服務于客戶的能力,為用戶提供端到端的解決方案。

收購加速能力提升

在IT界,一直以來都不乏通過對具有先進技術的公司的收購,來迅速提升本公司能力的案例,對于以往以PC等終端設備見長的戴爾來說,要想轉型進軍企業(yè)級市場,收購無疑是一條快速實現(xiàn)目標的捷徑。從2008年開始,戴爾就將目光投向了在存儲、網(wǎng)絡、安全、軟件、服務等領域有特色的廠商,開始了有計劃、有步驟的收購行動。

至今,戴爾已經(jīng)收購了20多家廠商,其中不少很成功的收購為業(yè)界所津津樂道。例如對存儲廠商EqualLogic的收購,兩年時間就使其業(yè)績達到10億美元,而用戶數(shù)增加了8倍;2010年年底收購的智能存儲廠商Compellent,使戴爾的存儲解決方案上了一個臺階,Compellent的“流動數(shù)據(jù)”理念現(xiàn)在已經(jīng)成為戴爾存儲的設計理念;對咨詢服務廠商佩羅的收購更是填補了戴爾企業(yè)級咨詢服務的空白,使戴爾的解決方案成為名副其實的“端到端”,并有效地帶動了戴爾其他產(chǎn)品線的銷售。

正是這一次次的收購,使戴爾迅速轉型,業(yè)績不斷提升,在當今云計算和大數(shù)據(jù)時代,也有了更多的話語權。戴爾全球企業(yè)解決方案事業(yè)部副總裁Cheryl Cook認為,戴爾在大數(shù)據(jù)方面擁有創(chuàng)新性的解決方案,不僅可以為用戶節(jié)省大筆資金,同時可提供極高的價值。她認為,大數(shù)據(jù)從開始到成熟分為5個階段,即從混亂、保留、優(yōu)化到簡單分析、復雜分析。在這5個階段里,戴爾針對前3個階段,可提供大數(shù)據(jù)保留解決方案;而對于后兩個階段,戴爾則擁有大數(shù)據(jù)分析解決方案。Cheryl Cook認為,戴爾創(chuàng)新性的解決方案可處理成熟度模型范圍內的結構化、半結構化和非結構化內容,她特別說道,戴爾將利用Hadoop,并與從事Hadoop開發(fā)的Cloudera公司合作,為用戶提供大數(shù)據(jù)分析解決方案;而在大數(shù)據(jù)保留解決方案中,戴爾將充分發(fā)揮在存儲方面的優(yōu)勢,通過存儲虛擬化和整合、應用程序優(yōu)化、數(shù)據(jù)保護、災難恢復以及數(shù)據(jù)保留和管理等技術,為“流動的數(shù)據(jù)”提供存儲和保護。

深諳用戶需求

在戴爾2012年高層客戶峰會上,戴爾服務部首席創(chuàng)新官James Stikeleather就“IT的未來”進行了演講,他認為,企業(yè)IT未來將面臨著來自IT價值、所有權和角色等方面的五大根本性變化,這些變化包括:信息超越流程、IT嵌入在業(yè)務服務之中、外部化的服務交付、企業(yè)合作伙伴的責任更大、減弱的獨立IT角色。

作為IT解決方案供應商,戴爾同樣也是一家企業(yè),James Stikeleather認為,在當今這個轉型的時代,戴爾已經(jīng)成功地轉型成為高效企業(yè),它將戰(zhàn)略性支出從2008年占IT預算的20%提高到今天的52%。這期間,戴爾的IT經(jīng)過了標準化、簡化、自動化,并最終實現(xiàn)云,比如將97%的系統(tǒng)遷移到x86平臺;大力推進虛擬化,從而減少了6000臺服務器;僅用一個控制臺就可管理13萬臺服務器和客戶端;運用云平臺聆聽客戶的聲音、信息和進行交互。這些舉措使戴爾更加了解用戶,更有針對性地為用戶提供適合的解決方案,真正解決用戶的問題。

閔毅達介紹說,戴爾目前針對不同行業(yè)推出了不同的解決方案,尤其在金融、教育、醫(yī)療、制造業(yè)等行業(yè)中更是擁有大量的用戶,并與用戶一起合作開發(fā)和培養(yǎng)人才。在會上,戴爾與教育部教育管理信息中心針對教育信息化建設和管理人才技術培訓及試點合作簽訂了備忘錄,與北京大學計算機科學技術研究所簽署了戴爾虛擬集成系統(tǒng)(VIS)聯(lián)合實驗室項目備忘錄,還與中國東方航空就長期發(fā)展簽署了合作備忘錄。

篇4

一體化方案確保信息回報

一項由惠普主導的調查表明,亞太地區(qū)60%的受訪企業(yè)表示今年將把至少10%的IT創(chuàng)新預算用于大數(shù)據(jù),而在中國這一數(shù)字為56%。三分之一的亞太地區(qū)和中國受訪企業(yè)還堅信,大數(shù)據(jù)是其最大的差異化競爭優(yōu)勢。然而,調查卻發(fā)現(xiàn),近一半的亞太地區(qū)受訪企業(yè)所實施的大數(shù)據(jù)計劃都失敗了,而在中國,這一數(shù)字為55%。很顯然,大數(shù)據(jù)中蘊含著巨大的商業(yè)價值,然而駕馭大數(shù)據(jù)不是一件容易的事,并不是所有企業(yè)都具備像Google一樣“玩轉”數(shù)據(jù)的基因與技術儲備。許多行業(yè)除了需要做好大數(shù)據(jù)思維上的轉變之外,還需要有不同工具來進行大數(shù)據(jù)的處理與分析。

通過對收購的Vertica、Autonomy、ArcSight等產(chǎn)品進行優(yōu)化整合,惠普在融入Hadoop等大數(shù)據(jù)技術的基礎上打造了大數(shù)據(jù)分析平臺HAVEn。“HAVEn平臺提供了大量的應用開發(fā)接口(API),惠普希望通過HAVEn與合作伙伴共同打造一套完整的大數(shù)據(jù)分析生態(tài)系統(tǒng),讓更多應用解決方案落地到行業(yè)。它可以充分利用惠普的分析軟件、硬件和服務,創(chuàng)建新一代為大數(shù)據(jù)準備的分析應用和解決方案。” 惠普公司軟件集團大中華區(qū)總經(jīng)理于志偉表示,“同時,HAVEn平臺還支持各種主流硬件平臺,為客戶提供最佳的投資回報(Return On Investment)與信息回報(Return On Information)。”

不只是軟件平臺

“HAVEn”這個名字實際上來源于其各個組件的首字母,即Hadoop(HDFS)、Autonomy、Vertica、Enterprise Security以及nApp(行業(yè)解決方案)。可以看出,HAVEn平臺實際上是一個惠普大數(shù)據(jù)產(chǎn)品的組合。實際上,HAVEn解決方案中除了包含此前提到的四方面內容外,還支持Hadoop這樣通用的技術,而且是“雙向集成”。同時HAVEn并不是一個孤立的軟件產(chǎn)品,而是更多軟、硬件產(chǎn)品的服務能力的體現(xiàn)。“HAVEn不只是一個軟件平臺,更是一個生態(tài)環(huán)境。”于志偉表示。

篇5

【關鍵詞】大數(shù)據(jù) 體系架構 國產(chǎn)化 自主可控

1 前言

在全球已經(jīng)全面進入信息時代的今天,數(shù)據(jù)已經(jīng)成為與水、石油、天然氣同等重要的國家戰(zhàn)略資源。IDC報告指出,截止2011年底,全球的數(shù)據(jù)量已達到了1.8萬億GB,未來十年還將增長50倍,迅速積累的海量數(shù)據(jù)蘊含著重大的商業(yè)價值和社會價值。作為云計算領域的重要延伸,大數(shù)據(jù)在行業(yè)內的熱度在不斷升溫。2012年我國大數(shù)據(jù)市場規(guī)模為4.5億元,同比增長40.6%。IDC預計,全球大數(shù)據(jù)2016年將達238億美元,中國市場規(guī)模未來5年將增長近7倍。

大數(shù)據(jù)技術最近幾年在迅速發(fā)展,國內外的廠商和組織已經(jīng)推出了多種大數(shù)據(jù)解決方案。在金融領域,已經(jīng)利用大數(shù)據(jù)技術解決詐騙檢驗、IT風險管理和自助服務等問題,未來大數(shù)據(jù)技術將會起到越來越重要的作用。目前國內外很多金融機構如摩根大通、花旗銀行,以及風電、太陽能發(fā)電、石化企業(yè)等制造業(yè)企業(yè)也開始采用大數(shù)據(jù)的解決方案進行設備監(jiān)控、優(yōu)化和故障預防[1]。

由于國內外針對商業(yè)機構系統(tǒng)頻頻發(fā)生的安全事件,國內各行業(yè)的信息化目前正在向基于國產(chǎn)軟硬件和自主可控方向發(fā)展,大數(shù)據(jù)也是目前國內各行業(yè)重點關注的技術。很多廠商和企業(yè)紛紛進行技術研究、方案準備和內部測試,并逐步開始在歷史數(shù)據(jù)查詢、分析,非結構化數(shù)據(jù)檢索等方向上開始使用[2]。從最近幾年的趨勢來看,安全、自主可控的大數(shù)據(jù)解決方案在大數(shù)據(jù)的行業(yè)領域有非常大的市場需求。

國內的很多關鍵行業(yè)應用,如金融信息系統(tǒng)的許多關鍵設備都沒有采用國產(chǎn)產(chǎn)品,導致無法準確判斷其安全隱患,這使得我國信息化建設的安全底數(shù)不清。迫切需要國內IT企業(yè)和行業(yè)共同研發(fā)自主可控、自主知識產(chǎn)權的信息系統(tǒng)、信息環(huán)境和信息安全產(chǎn)品。針對這種狀況國家銀監(jiān)會提出了“自主可控,持續(xù)發(fā)展,科技創(chuàng)新”的三大戰(zhàn)略[3],國產(chǎn)的信息化產(chǎn)品,在金融領域的應用已經(jīng)開始了破冰之旅,事實也已經(jīng)開始證明,自主可控的軟硬件產(chǎn)品,在關鍵行業(yè)領域的應用是可行的,但是缺乏完整的經(jīng)過驗證的整體解決方案和實際案例,無法復制和推廣。

本文基于國產(chǎn)軟硬件產(chǎn)品進行自主可控的大數(shù)據(jù)體系架構研究要打破國外技術依賴,掌握技術命脈。針對現(xiàn)有行業(yè)關鍵系統(tǒng)多數(shù)是直接引用國外成熟技術,關鍵、復雜、核心的應用系統(tǒng)大多是建立在非自主產(chǎn)品上,形成了對國外的技術嚴重依賴的現(xiàn)狀,本文的研究將可以在大數(shù)據(jù)領域打破國外技術的壟斷,形成有競爭力的國產(chǎn)解決方案。

2 主要研究內容

本文主要研究面向行業(yè)應用、基于自主可控基礎軟硬件產(chǎn)品的大數(shù)據(jù)體系架構,研究內容主要包括:

2.1 行業(yè)大數(shù)據(jù)應用的需求分析

2.1.1 面向多源異構業(yè)務數(shù)據(jù)的采集和管理需求

在客戶信息為例,行業(yè)內的集團企業(yè)經(jīng)常會面臨急需解決的數(shù)據(jù)集成問題,企業(yè)存在大分散的客戶信息資源,并由各系統(tǒng)自主采集和維護,沒有良好的共享體系,客戶信息、訂單信息等異構的存在不同數(shù)據(jù)源中,沒有橫跨多個業(yè)務領域的客戶信息的統(tǒng)一管理和分發(fā)體系。因此,要求統(tǒng)一建設行業(yè)信息大數(shù)據(jù)管理系統(tǒng),是一套為所有在線業(yè)務服務的、整合的行業(yè)信息大數(shù)據(jù)管理與分析系統(tǒng),并具有行業(yè)先進水平的大數(shù)據(jù)管理和分析能力,以滿足企業(yè)形成市場競爭優(yōu)勢的要求。

2.1.2 針對海量異構大數(shù)據(jù)的高性能存儲需求

通過調研發(fā)現(xiàn)很多大型企業(yè)的信息系統(tǒng)已經(jīng)積累了大量的業(yè)務數(shù)據(jù),而且隨著業(yè)務拓展的需求,大數(shù)據(jù)分析的數(shù)據(jù)源已經(jīng)不僅局限于企業(yè)內部,如對客戶流失分析或者產(chǎn)品銷售趨勢預測,就還需要互聯(lián)網(wǎng)社交網(wǎng)絡或者電商消費信息等。這些多源、異構、海量的數(shù)據(jù)對于大數(shù)據(jù)平臺的存儲提出了極高的要求。以某大型企業(yè)集團的客戶和生產(chǎn)經(jīng)營信息為例,數(shù)據(jù)規(guī)模已經(jīng)達到上百TB容量,且相關數(shù)據(jù)量,特別是生產(chǎn)線的傳感器數(shù)據(jù)和用戶行為等數(shù)據(jù)還在持續(xù)大幅增長。

2.1.3 多樣性大數(shù)據(jù)分析和處理需求

大數(shù)據(jù)分析系統(tǒng)不但集成了多個系統(tǒng)的數(shù)據(jù)源,未來大數(shù)據(jù)分析應用系統(tǒng)也會被多個部門,多個業(yè)務中使用,而且不同的部門和不同業(yè)務對大數(shù)據(jù)分析處理 的響應時間、數(shù)據(jù)量、結果準確程度以及具體的分析算法都會有很大差異。因此需要完整的對這些分析和處理需求進行分析,以便于設計滿足當前和潛在需求的大數(shù)據(jù)分析處理架構。

2.1.4 行業(yè)大數(shù)據(jù)的安全監(jiān)控和隱私保護需求

面向行業(yè)和企業(yè)的大數(shù)據(jù)平臺都將集成來自于不同數(shù)據(jù)源的數(shù)據(jù),其中有很多數(shù)據(jù)會涉及商業(yè)秘密和個人隱私等安全問題,所以這些數(shù)據(jù)在大數(shù)據(jù)平臺中應該被合理的授權使用,并有完善的安全監(jiān)控和隱私保護措施,以避免引起數(shù)據(jù)泄密或者隱私糾紛。

2.1.5 行業(yè)大數(shù)據(jù)平臺的業(yè)務應用和可視化展現(xiàn)的需求

大數(shù)據(jù)分析的結果是更好的支持業(yè)務推廣和運營決策,所以企業(yè)大數(shù)據(jù)分析還是要和現(xiàn)有的業(yè)務應用緊密結合,并且以簡單友好的操作,以及可視化的方式直觀的展現(xiàn)分析結果,這樣才能被各部門和各級別的人員使用好大數(shù)據(jù)系統(tǒng)。

篇6

5月5日,亞信數(shù)據(jù)推出了OCDP的最新版本4.0。亞信數(shù)據(jù)橘云產(chǎn)品線總經(jīng)理朱軍表示:“新產(chǎn)品的還在其次,我們現(xiàn)在更關注的是打造大數(shù)據(jù)生態(tài)圈,充分釋放開源大數(shù)據(jù)技術的能力,讓各類合作伙伴在以OCDP為核心的數(shù)據(jù)操作平臺之上開發(fā)垂直應用,讓大數(shù)據(jù)解決方案變得更加簡單、易用。”呼應亞信集團的整體戰(zhàn)略,亞信數(shù)據(jù)要打造以大數(shù)據(jù)為核心的PaaS,走出有自己特色的大數(shù)據(jù)發(fā)展之路。

充分釋放開源技術的能力

Hadoop商業(yè)發(fā)行版何其多,亞信數(shù)據(jù)OCDP到底有何過人之處?簡單說,亞信數(shù)據(jù)OCDP的基礎還是那些開源技術組件,不過OCDP是針對企業(yè)級用戶的需求設計的,并在局部功能上進行了增強。總之,來自開源,優(yōu)于開源,高于開源。如果非要給OCDP找個對標的產(chǎn)品,它與Hortonworks有幾分相似。

產(chǎn)品的更新?lián)Q代只是一方面,為了更好地推動大數(shù)據(jù)應用,亞信數(shù)據(jù)于2015年加入了大數(shù)據(jù)ODPi國際組織。它不僅僅是一個技術組織,更是一個大數(shù)據(jù)企業(yè)聯(lián)盟,包括Hortonworks、IBM、Pivotal、SAS等在內的國際知名的大數(shù)據(jù)企業(yè)都參與其中。亞信數(shù)據(jù)此舉,既可以讓自己在大數(shù)據(jù)方面具有開放性和國際化眼光,同時也能將國際先進的理念、技術與中國用戶的需求和自身的實踐經(jīng)驗相結合,更好地服務于企業(yè)級大數(shù)據(jù)應用。朱軍表示,亞信數(shù)據(jù)的大數(shù)據(jù)產(chǎn)品定位其實很簡單:在技術上,充分利用開源技術,保持國際領先;在產(chǎn)品化方面,結合中國行業(yè)應用的特點,不斷增強底層技術,率先在運營商、金融、公安、政府等領域實現(xiàn)突破。

OCDP為企業(yè)級用戶在大數(shù)據(jù)中心搭建統(tǒng)一的分布式操作平臺,實現(xiàn)統(tǒng)一的資源分配、應用管理和數(shù)據(jù)治理,并支持并發(fā)多用戶在OCDP基礎上采用敏捷方式整合大數(shù)據(jù)分析應用的開發(fā)與運維。OCDP意在敏捷開發(fā)和智能運維,它為企業(yè)提高業(yè)務創(chuàng)新效率、改善數(shù)據(jù)中心資源利用率提供了堅實的系統(tǒng)支撐平臺,同時為企業(yè)的開源節(jié)流提供了有效的產(chǎn)品和技術保障。

朱軍告訴記者:“市場上的Hadoop商業(yè)發(fā)行版80%的功能是通用、相似的。為了保持領先性和差異化,有些廠商在通用功能上又加入了自研的技術。而OCDP始終堅持走開放和國際化的道路,100%開源,保證了透明性,將開源技術的價值釋放出來,并在此基礎上針對企業(yè)用戶的需求,增強了產(chǎn)品本身的性能,簡化了應用。”

其實,企業(yè)用戶并不關心具體的技術細節(jié),他們只是希望能夠利用新技術解決實際的應用問題。開源軟件的一個好處是,所有人都可以為開源軟件做貢獻,使得開源軟件的價值能夠充分釋放。像亞信數(shù)據(jù)這樣的企業(yè),可以在開源技術的基礎上,面對垂直行業(yè)增加差異化的功能。朱軍介紹說:“OCDP既能滿足運營商的需求,也可以支持商業(yè)企業(yè)的應用,并且充分保證系統(tǒng)的穩(wěn)定和安全。在提供80%的通用功能的基礎上,我們會針對不同行業(yè)客戶的個性化需求,增強相應的能力。比如,公安行業(yè)對圖形圖像存儲的要求很高,我們會針對此提供定制化的解決方案,尤其是充分發(fā)揮硬件的性能優(yōu)勢。”

大數(shù)據(jù)不是技術驅動的

目前,在眾多大數(shù)據(jù)產(chǎn)品中,用戶選擇Hadoop的比例較高。但是在不同的行業(yè),人們對大數(shù)據(jù)的需求不同,因此如何應用Hadoop也會有差異。

朱軍介紹說,國內在大數(shù)據(jù)應用方面走得比較靠前的是運營商,以及金融、保險行業(yè)的客戶。在大數(shù)據(jù)上升為國家戰(zhàn)略后,政府、公安等行業(yè)的客戶也對大數(shù)據(jù)有了更深刻的認識,開始有意識地應用大數(shù)據(jù)手段解決業(yè)務問題。

運營商、金融客戶對大數(shù)據(jù)有明確的、自發(fā)的需求,它們希望將開源技術與Hadoop的能力充分釋放出來,實現(xiàn)實時的數(shù)據(jù)處理和分析。在其他很多行業(yè),比如農(nóng)業(yè)、水利、物聯(lián)網(wǎng)等,大數(shù)據(jù)還是一個待挖掘的金礦,如何收集、使用數(shù)據(jù),數(shù)據(jù)能夠為這些行業(yè)的用戶帶來什么樣的價值,以及如何將數(shù)據(jù)轉化為資產(chǎn),通過深入分析和挖掘,找到新的價值點,還需要像亞信數(shù)據(jù)這樣有經(jīng)驗的廠商幫助用戶一起分析,提高認知度。朱軍表示:“我們的數(shù)據(jù)操作平臺側重計算、存儲和分析能力的提升。而亞信現(xiàn)有的數(shù)據(jù)資產(chǎn)管理軟件,可以有效促進用戶對數(shù)據(jù)的理解和分析。當用戶一旦明白了如何應用數(shù)據(jù)后,不管采用什么樣的技術手段,都可以很快切入,找到數(shù)據(jù)價值所在。”

大數(shù)據(jù)市場并不是單純由技術驅動的,對于廠商來說,必須找到適合大數(shù)據(jù)的應用場景,然后針對用戶的具體需求提供定制化、差異化的解決方案。亞信數(shù)據(jù)就是這樣做的。朱軍對自己的技術團隊和產(chǎn)品都十分有信心。去年,亞信數(shù)據(jù)做了一個開源項目,圍繞資源調度策略平臺YARN做了增強,同時使用Docker容器實現(xiàn)了應用隔離。“這些技術和產(chǎn)品上的優(yōu)化,目的是讓企業(yè)用戶的大數(shù)據(jù)應用變得更加簡單,讓用戶更放心。今年,我們還計劃利用大數(shù)據(jù)技術監(jiān)控大數(shù)據(jù)集群的運維情況,比如系統(tǒng)資源的利用率是否合理,如何進行優(yōu)化和調配等。”朱軍介紹說。

提供一站式的大數(shù)據(jù)解決方案是亞信數(shù)據(jù)的獨特優(yōu)勢。以OCDP為核心,整合亞信集團其他業(yè)務部門的產(chǎn)品,比如數(shù)據(jù)資產(chǎn)管理軟件,以及Hadoop一體機等,亞信數(shù)據(jù)可以提供覆蓋數(shù)據(jù)采集到梳理、開發(fā)整個過程的整體解決方案,為客戶提供一站式的大數(shù)據(jù)服務。用戶根本不用操心大數(shù)據(jù)系統(tǒng)的安裝、部署和調試,直接拿來就可以使用。

從底層的硬件,到數(shù)據(jù)操作平臺,再到上層的大數(shù)據(jù)應用,這是一個完整的生態(tài)鏈,同時也是一個完整的大數(shù)據(jù)應用體系。朱軍告訴記者,現(xiàn)在越來越多的企業(yè)級用戶開始構建完整的大數(shù)據(jù)系統(tǒng)。舉例來說,運營商開始想方設法將以前“煙囪式”的集群整合起來,制定統(tǒng)一的大數(shù)據(jù)規(guī)劃。一個完整的大數(shù)據(jù)體系包含多個層次,要自下而上逐層構建、夯實。在這個過程中,用戶要特別注意保證整體架構的可伸縮性,為以后逐步增加更多應用做好準備。

大數(shù)據(jù)PaaS平臺

隨著大數(shù)據(jù)應用逐漸走向深入,人們對大數(shù)據(jù)又有了更加深刻的認識,而不僅僅是一個“大”字。“我們并沒有刻意強調大數(shù)據(jù)的‘大’,而是大力倡導數(shù)據(jù)操作平臺的概念。從某種程度上說,數(shù)據(jù)操作平臺相當于一個操作系統(tǒng),可為數(shù)據(jù)共享和運營提供支持,從而改變了傳統(tǒng)的大數(shù)據(jù)運營模式。”朱軍解釋說。

既然OCDP是一個大數(shù)據(jù)平臺,那么它就應該有新的商業(yè)模式和打法。亞信數(shù)據(jù)早就有了準備,推出了相關的合作伙伴計劃,希望吸引更多的垂直應用廠商,基于OCDP打造面向不同行業(yè)應用的解決方案,或者一體機。在本次OCDP新版本會上,亞信數(shù)據(jù)和合作伙伴一起展示了基于OCDP構建的智慧醫(yī)療、智慧旅游等解決方案,以及亞信數(shù)據(jù)Hadoop一體機解決方案。另外,亞信數(shù)據(jù)還深挖亞信集團內部潛力,將兄弟部門的BI產(chǎn)品與OCDP相結合,提供一些新型的服務,比如利用運營商的位置信息提供實時營銷服務等。“我們專注于底層的大數(shù)據(jù)平臺,保證平臺的質量、穩(wěn)定性和安全性,以滿足企業(yè)用戶的嚴苛需求,同時提供行之有效的運維支持。這樣做的目的是為了讓合作伙伴更放心地選擇我們的產(chǎn)品,在我們的大數(shù)據(jù)平臺之上充分展現(xiàn)他們的價值,共同為客戶創(chuàng)造新的應用價值。”朱軍表示。

為了更好地實現(xiàn)上述目標,亞信數(shù)據(jù)在研發(fā)方面下了大力氣,計劃將現(xiàn)有的研發(fā)團隊擴展到百人左右的規(guī)模,并以西安、北京兩地為研發(fā)基地,主要的產(chǎn)品研發(fā)集中在西安,北京主要保留一些高端的技術人才。

篇7

若論存儲新產(chǎn)品的數(shù)量,今年的云計算大會不如去年,這主要是因為華為存儲已經(jīng)擁有了比較齊全的存儲產(chǎn)品線,現(xiàn)在只是在原有基礎上的豐富和優(yōu)化。不過從華為存儲旗幟鮮明地進入企業(yè)級市場后,“存以智用,融以致遠”的華為融合存儲戰(zhàn)略就從未動搖過,而且“智”、“融”的特色越來越突出。

高端存儲一年考

傳統(tǒng)上,高端存儲市場一直是國外廠商的天下,中國存儲廠商通常會從中低端存儲起步,然后慢慢向高端市場滲透。華為存儲從進軍企業(yè)級市場那天就把高端存儲當成了奮斗的目標,不斷在技術上推陳出新,并且在一些重點行業(yè)領域實現(xiàn)了突破。華為IT存儲產(chǎn)品線總裁范瑞琦在云計算大會上告訴記者:“我們的高端存儲產(chǎn)品正式面市雖然只有一年多,但已經(jīng)在運營商、公安、金融、稅務、電力、大企業(yè)、政府、社保、醫(yī)療、交通、石油等20余個重點行業(yè)實現(xiàn)了突破,累計銷售超過70套。”

Gartner的報告顯示,2013年第一季度,華為存儲取得了中國區(qū)出貨量第一,全球收入排名第九的好成績。據(jù)范瑞琦透露,在第二季度中,華為存儲依舊保持了強勁增長的態(tài)勢。華為存儲整體實力增強的同時,其在一些重點產(chǎn)品線上,比如高端HVS存儲、大數(shù)據(jù)存儲N9000等也實現(xiàn)了突破。

在本次云計算大會上,IDC與華為聯(lián)合了《企業(yè)高端存儲安全可信白皮書》。IDC在白皮書中建議,企業(yè)在選擇存儲系統(tǒng)時,應重點關注存儲系統(tǒng)在硬件架構、數(shù)據(jù)存儲、業(yè)務應用三個層面的可靠性。華為高端存儲領域經(jīng)理趙海龍表示:“安全可信、彈性高效是華為高端存儲設計的核心理念。從Smart Matrix全冗余系統(tǒng)架構設計到基于全虛擬化設計理念的XVE存儲操作平臺,再到革命性的RAID 2.0+兩層虛擬化數(shù)據(jù)管理模式、自檢測自修復端到端的數(shù)據(jù)保護機制等。”

在本次云計算大會召開之前,很多業(yè)內的記者都在猜測,本次大會上最重要的存儲產(chǎn)品是什么?大家一致認為是全閃存陣列。果不其然,范瑞琦在大會上正式了華為首款全閃存高端存儲OceanStor 18800F。它具有百萬級IOPS、微秒級的穩(wěn)定時延和“0”硬盤失效率三大特性,此外還具備出色的抗震、抗腐蝕等性能。不過,記者在解決方案展示區(qū)沒有看到OceanStor 18800F的實物,商業(yè)化的產(chǎn)品據(jù)說明年才能上市。

大數(shù)據(jù)存儲追求高效

媒資是華為大數(shù)據(jù)存儲解決方案最先落地的行業(yè)之一。在本次云計算大會上,華為宣布將與中央電視臺共同研發(fā)深度節(jié)能的大容量存儲設備,據(jù)稱可以比傳統(tǒng)設備節(jié)省能耗60%~80%。

隨著數(shù)字化技術的不斷完善以及高清電視、IMAX/3D電影、移動新媒體市場的快速增長,媒體的生產(chǎn)者必須及時提供高清化、多樣化的媒體節(jié)目,而傳統(tǒng)以磁帶設備為核心的媒資存儲平臺已經(jīng)不能滿足需求。華為可以為媒體提供以N9000系列存儲為核心的大數(shù)據(jù)存儲架構。N9000集海量數(shù)據(jù)的存儲、歸檔和分析于一體,具有極強的橫向擴展能力,可支持超大單一文件系統(tǒng)(最大為40PB),實現(xiàn)非結構化數(shù)據(jù)的存儲與共享。

華為存儲的媒資解決方案順應傳統(tǒng)電視媒體向全媒體演進的趨勢,以開放、融合的ICT基礎架構為核心,全面兼容業(yè)內主流的上層應用系統(tǒng),可提供全臺網(wǎng)、高清制作、無帶化媒資庫、媒體云、網(wǎng)絡互聯(lián)及協(xié)同辦公等業(yè)務支持。華為存儲秉承“被集成”的策略,與業(yè)內許多知名的媒體應用提供商合作。

篇8

隨著移動互聯(lián)網(wǎng)、云計算、4K大視頻、大數(shù)據(jù)、物聯(lián)網(wǎng)等新業(yè)務的迅猛發(fā)展,爆發(fā)式的數(shù)據(jù)流量增長和海量的設備連接對通信網(wǎng)絡提出了更高的要求,傳統(tǒng)的剛性、煙囪式網(wǎng)絡已難以為繼,運營商需要打造更加敏捷、智能、開放的新一代網(wǎng)絡架構,用來承載未來更加多樣化、智能化的業(yè)務應用。隨著IT和CT的深度融合,由此而產(chǎn)生的云計算、SDN/NFV等新技術,為運營商的網(wǎng)絡與業(yè)務轉型帶來了巨大的機遇。

作為國際知名信息通信網(wǎng)絡產(chǎn)品與解決方案提供商,烽火通信近年來積極探索并加速ICT轉型,立足于光通信,業(yè)務深入拓展至信息技術與通信技術融合而生的廣泛領域,如云計算、智慧城市、4K融合視訊、SDN/NFV等,客戶遍布國內、國際和信息化三大市場,為客戶提供領先的端到端信息通信網(wǎng)絡產(chǎn)品和解決方案。

在12月27日舉行的2016中國通信產(chǎn)業(yè)大會暨第十一屆中國通信技術年會上,烽火通信NFV產(chǎn)品線市場總監(jiān)鄭發(fā)金向《通信產(chǎn)業(yè)報》(網(wǎng))記者詳細介紹了烽火通信面向ICT轉型的云、網(wǎng)、端產(chǎn)業(yè)布局和基于SDN/NFV的FitNet戰(zhàn)略。

深化ICT轉型 全面布局云、網(wǎng)、端

近年來,隨著“寬帶中國”、“智慧城市”、“互聯(lián)網(wǎng)+”、“中國制造2025”等國家戰(zhàn)略的實施和推進,光通信、4G網(wǎng)絡、數(shù)據(jù)中心等經(jīng)歷了較快的發(fā)展階段,大數(shù)據(jù)、云計算、SDN/NFV、物聯(lián)網(wǎng)等新技術有望迎來新的發(fā)展機遇。烽火通信基于穩(wěn)健增長的光通信、光纖光纜等傳統(tǒng)網(wǎng)絡業(yè)務,業(yè)務領域逐漸向云和端進行擴展,已經(jīng)取得了令人矚目的成績。烽火通信在武漢、南京、西安、成都、長春、珠海等地部署產(chǎn)業(yè)基地,深化ICT轉型進行產(chǎn)業(yè)布局和新技術研究開發(fā)。

云:烽火通信積極布局云計算、智慧城市等業(yè)務,借力“智慧湖北”建設的重要發(fā)展契機推動大數(shù)據(jù)業(yè)務的開展,在原有烽火集成、烽火網(wǎng)絡、烽火星空、南京數(shù)據(jù)中心等業(yè)務范圍基礎上,積極構建“大集成”框架,并成立智慧地鐵公司、教育資源平臺運營公司、武漢光谷智慧科技有限公司、湖北省楚天云有限公司等,并了“智慧城市解決方案暨FitCloud云網(wǎng)一體化技術戰(zhàn)略”,全自主開發(fā)的“大數(shù)據(jù)平臺+應用開發(fā)+數(shù)據(jù)分析”產(chǎn)業(yè)鏈正逐步形成。烽火通信在南京投資建設的云計算中心一期項目順利進行,自主研發(fā)的FitCloud云計算平臺現(xiàn)已成功應用在湖北省教育云、湖北省政務云(楚天云)中。

網(wǎng):伴隨全球加快邁向信息社會,光通信產(chǎn)業(yè)成為最具潛力、增長速度最快的領域之一,大容量、高帶寬仍是未來光網(wǎng)絡發(fā)展的基本需求。烽火通信立足于光通信,目前已擁有光通信O備、數(shù)據(jù)通信設備、SDN/NFV、關鍵芯片等全系列網(wǎng)絡產(chǎn)品和解決方案。烽火通信光通信系統(tǒng)、光纖光纜的綜合競爭力均排名世界前五,數(shù)通市場排名世界前七。在SDN/NFV新技術方面,烽火通信不斷加大研發(fā)投入,目前有從接入到核心的全系列SDN產(chǎn)品,包括SPTN、SIPRAN、SDON、光與IP協(xié)同SDN控制器等,并已在多個項目中成功應用;在NFV方面,積極布局X86服務器NFVI基礎設施,在虛擬化、VNFs、MANO等方面不斷加強產(chǎn)品方案的研究開發(fā)。

端:烽火通信終端產(chǎn)品從無到有,經(jīng)過幾年的沉淀與積累,現(xiàn)已擁有寬帶終端、智能網(wǎng)關、OTT盒子、無線路由等全系列終端產(chǎn)品,銷售額裂變式地增長,全球累計出貨超過1200萬臺,全線產(chǎn)品大規(guī)模應用于亞歐拉美市場,樹立了全球知名的終端品牌形象。2016年4月,烽火通信了全新一代4K融合視訊平臺及CDN解決方案,助力運營商做大做強視頻業(yè)務和提供基礎服務保障的同時,也在不斷地挖掘新的商業(yè)價值。

網(wǎng)絡云化 推出FitNet解決方案

從語音時代,到數(shù)據(jù)時代,再到未來的智能化時代,通信網(wǎng)絡也經(jīng)歷了數(shù)字化、IP化和IT化的階段。隨著IT和CT技術的深度融合,國內外運營商紛紛提出了網(wǎng)絡轉型計劃,如AT&T提出了Domain2.0計劃,中國聯(lián)通提出了CUBE-Net 2.0新一代網(wǎng)絡架構,中國移動提出了NovoNet 2020未來網(wǎng)絡,中國電信提出了CT-Net 2025計劃。在此背景下,烽火通信提出了FitNet網(wǎng)絡解決方案,以SDN、NFV、云計算等技術為基礎,以DC為中心重構未來網(wǎng)絡,不斷豐富產(chǎn)品方案,助力運營商未來網(wǎng)絡和業(yè)務轉型。

FitNet是烽火通信面向ICT轉型,基于光與IP融合、云網(wǎng)一體化以及SDN/NFV等新技術,面向運營商、行業(yè)用戶推出的泛在、超寬、極簡、隨需、開放的網(wǎng)絡整體解決方案。烽火通信FitNet解決方案通過SDN實現(xiàn)網(wǎng)絡靈活控制、業(yè)務自動部署,通過NFV實現(xiàn)網(wǎng)絡軟硬件解耦,硬件平臺標準化、網(wǎng)絡功能虛擬化,廣泛應用于政企承載、園區(qū)網(wǎng)、廣域網(wǎng)、數(shù)據(jù)中心等業(yè)務場景,實現(xiàn)業(yè)務隨需部署,資源全局調度,容量彈性伸縮,架構靈活調整,能力全面開放,為客戶提供最佳的網(wǎng)絡解決方案和業(yè)務體驗。

烽火通信FitNet解決方案有以下幾個特點:1.極簡網(wǎng)絡架構,以DC為中心,實現(xiàn)光與IP融合、云和網(wǎng)融合、網(wǎng)絡與數(shù)據(jù)融合、CT與IT融合。2.泛在連接,超寬管道,全網(wǎng)SDN智能控制,網(wǎng)元功能虛擬化部署,實現(xiàn)資源池化、彈性部署、按需使用、自助服務。3.運營級品質,電信級可靠性,以用戶為導向,開放式設計,傳統(tǒng)網(wǎng)絡平滑演進,異廠家兼容互通,合作共贏。FitNet戰(zhàn)略體現(xiàn)了烽火通信對云計算、大數(shù)據(jù)時代ICT融合架構演進的深入思考,是烽火通信整體實力的集中呈現(xiàn)。

深耕SDN/NFV 重構未來網(wǎng)絡

根據(jù)Infonetics預測,到2018年,全球SDN市場規(guī)模將達180億美元。HIS預測,到2019年,全球NFV軟硬件及服務市場達116億美元。2016年4月中國SDN/NFV大會《NFV產(chǎn)業(yè)發(fā)展白皮書》,指出未來五年,SDN/NFV國內市場規(guī)模接近2500億元。SDN/NFV市場將會逐漸覆蓋數(shù)據(jù)中心組網(wǎng)、DCI互聯(lián)、光網(wǎng)絡、接入網(wǎng)、移動核心網(wǎng)、IMS等領域。

目前烽火通信擁有從接入、匯聚到核心的全系列SDN產(chǎn)品和解決方案,如SPTN、SD-UTN、SIPRAN、SDON、SD-WAN等,同時自主研發(fā)了全系列“光+IP”協(xié)同控制器、數(shù)據(jù)中心SDN交換機等產(chǎn)品,通過開放標準的API接口,實現(xiàn)了跨域、跨網(wǎng)、跨廠商互通,并實現(xiàn)了傳統(tǒng)網(wǎng)絡平滑升級,控制器與網(wǎng)管完美融合。烽火通信在SDN國際標準領域取得重大突破,主導制定的G.7711標準已獲得ITU正式批準。

篇9

自從VMware在2013年的全球用戶大會上推出vSphere Big Data Extention(BDE)以來,大數(shù)據(jù)這匹駿馬越來越受到大家的追捧。當然BDE主要針對是Hadoop的大數(shù)據(jù)應用,其實大數(shù)據(jù)不僅僅是Hadoop,即使只算Hadoop也還有不同的版本。但是無論Hadoop的哪個版本或者哪個大數(shù)據(jù)平臺,都蜂擁開始追隨云計算,就像好馬配好鞍一樣重要,那怎樣的云計算平臺才是大數(shù)據(jù)的好鞍呢?運行環(huán)境平臺:多租戶、資源供應和管理。

在過去幾個月的客戶溝通中,我學習了運行大數(shù)據(jù)的多種不同平臺,包括Twitter使用的Mesos、Fedex使用的虛擬化和Yahoo使用的Yarn。而不同的云計算平臺特性能解決大數(shù)據(jù)應用的不同問題。比如:Yarn的目標是支持Hadoop上的非M-R應用。而Twitter使用的Mesos則可以支持混合的負載,并且會利用操作系統(tǒng)的虛擬化。由于企業(yè)的大數(shù)據(jù)應用場景往往是多樣的,所以需要選擇一種平臺適合不同的應用場景,這包括:

部署新的大數(shù)據(jù)應用極其簡單:可以通過自動化和自助服務來完成;

可以支持多種不同的負載:也就是能運行多種大數(shù)據(jù)應用,不僅僅限于Map-Reduce,還可支持一些Hadoop生態(tài)圈應用、SQL服務和其他通用應用;

可靠的安全隔離:如果需要將某些敏感信息隔離,該平臺有能力確保數(shù)據(jù)集和環(huán)境安全;

安全的資源隔離:為了能夠提供足夠的資源來滿足整體SLA要求,可以將吵鬧的鄰居隔離來確保性能;

多版本支持能力:能運行多個不同版本的運行環(huán)境,滿足不同用戶、開發(fā)者要求;

企業(yè)級的可用性:確保整個系統(tǒng)的強壯性,提供企業(yè)等級的可用性。

網(wǎng)絡的挑戰(zhàn)

對網(wǎng)絡而言,挑戰(zhàn)和機遇并存。今天兩層核心聚合交換網(wǎng)絡不能跨機架提供足夠的帶寬。機架內的帶寬應該沒有問題,經(jīng)常可以達到每秒幾百Gbit,但機架間的帶寬往往十分有限,為此往往需要優(yōu)化流量到本地,也就是數(shù)據(jù)和計算完全整合的模式。幸運的是,新的網(wǎng)絡拓撲,包括CLOS和主干加分支設計都提供了很好的解決方案。使用這些新型的網(wǎng)絡拓撲,可以在整個集群延時基本恒定的情況下確保足夠的帶寬,無論是機架內還是機架間都不會有帶寬問題。

存儲平臺的選擇

隨著存儲技術的不斷發(fā)展,大數(shù)據(jù)的存儲選擇越來越豐富。當然Hadoop的HDFS處于最核心圈,但其他的存儲平臺也可以提供跟Hadoop類似、即插即用的兼容能力,并且提供了某些獨特的價值。幾個主要的存儲選項如下:

傳統(tǒng)的SAN或者NAS:這應該算是支撐大數(shù)據(jù)應用的最佳存儲選項,因為目前大量的數(shù)據(jù)中心都可以提供這樣的存儲選項,并且也包括了各種存儲服務,例如:快照、歸檔、復制等;

服務器內置磁盤構建的軟件定義存儲:這方面HDFS是主要的代表,其他的選項包括CEPH、Gluster和MAPR,他們都可以建立文件系統(tǒng),滿足大數(shù)據(jù)的應用;

橫向擴展存儲方案:很多獨具特色的新興公司提供了可以替代HDFS橫向擴展存儲,很好解決了成本和帶寬問題。比如Isilon的橫向擴展存儲方案,提供了3到144個節(jié)點的解決方案,可以擴展到15PB、每秒85GB吞吐能力,成為橫向擴展存儲的典型代表。

篇10

關鍵詞: 智能數(shù)據(jù)平臺 產(chǎn)學研 整合思路

一、社會治理智能數(shù)據(jù)平臺的構建思路

隨著信息化時代的到來,人們對大數(shù)據(jù)的研究開始日漸加深。研究者開始越來越多地強調對大數(shù)據(jù)的深層次挖掘,其中這種挖掘使得研究者能有越來越多探討和發(fā)現(xiàn)原來所不存在的事物之間的相關關系。可以說,大數(shù)據(jù)的出現(xiàn),是“長尾理論”和“黑天鵝”理論的雙重驗證――原本被統(tǒng)計學剔除在外的小概率事件納入其中。但是,值得深思的是,目前對大數(shù)據(jù)的研究仍然過多地集中在理論層面,缺乏實踐性的探討,更缺乏深層次的具有統(tǒng)籌規(guī)劃方案能力的全方位的探測。因此,在高校研究和社會治理層面,這種非計算機科學的社會應用,如果能夠行之有效地將大數(shù)據(jù)概念引入實踐化,就成了擺在社會科學研究者眼前的重中之重。特別是構建一套完整智能數(shù)據(jù)平臺,幫助社會科學研究者在數(shù)據(jù)收集、數(shù)據(jù)分析和同用戶反饋交流中起到平臺作用,進而實現(xiàn)生產(chǎn)、教學和科研三位一體的布局戰(zhàn)略。

智能數(shù)據(jù)平臺所實現(xiàn)的這三個功能既是獨立的又是相輔相成的。說這三者是獨立的,原因在于這三個功能個各司其職地完成了相對較為獨立的任務。其中,智能數(shù)據(jù)平臺的生產(chǎn)功能為用戶滿足商業(yè)、政府、NGO等社會組織數(shù)據(jù)收集、數(shù)據(jù)分析及滿足市民在各種生活情境中對信息的精確獲取功能。智能數(shù)據(jù)平臺的教學功能為以學生為主體,深入細致地挖掘智能數(shù)據(jù)平臺中生活情境中可能存在的需求。而科研功能則在通過完成軟件的生產(chǎn)和教學功能的同時,進一步拓展了軟件的價值。其中,科研的方向可以有二:第一,科研人員可以根據(jù)特定情境下智能數(shù)據(jù)平臺收集到的數(shù)據(jù)進行深入加工和挖掘,在獲得深層次變量關系的同時,完成滿足社會需求的科研論文和項目。此外,圍繞智能數(shù)據(jù)平臺的功能拓展,也是一項重要的科研功能。三者雖然擁有各自的功能,但是在另外一個層面三者之間也存在不可分離的關聯(lián)。其中生產(chǎn)功能以需求為導向為智能平臺的建設提出了方向,這種方向性的指引保證教學過程中能以社會情景、社會組織和社會人的需求為方向進行知識傳授。這種以生產(chǎn)為導向的知識傳授正是現(xiàn)代應用型技術人才培養(yǎng)的需要。最后,在教學中,由于學生教師以智能數(shù)據(jù)平臺為工具的社會需求解決方案設計,能夠進一步保證教師的科研有明確的方向性和應用性。這種應用型將會進一步影響智能數(shù)據(jù)分析平臺的生產(chǎn)和教師的教學。可以說智能平臺的構建是能夠真正地從滿足社會需求方面出發(fā)培養(yǎng)應用應用技能性人才,提高教師科研能力較好的解決方案。

二、圍繞智能數(shù)據(jù)平臺建設的產(chǎn)學研示例探討

圍繞智能數(shù)據(jù)平臺出發(fā)制訂產(chǎn)學研三位一體的發(fā)展方案不僅能夠有效地拓展應用型技術人才培養(yǎng)的思路,而且能夠提高實際教學質量,使得教師從原本簡單的知識講解轉換到和學生一起尋找具體社會問題的解決方案。例如,在傳統(tǒng)的社會工作類專業(yè)中,一般都會部署發(fā)展社會學、西方社會學、社會組織管理、社會調查研究方法和數(shù)據(jù)分析技術這5門課程。按照傳統(tǒng)意義的劃分來看,這5門課程分別對應了社會理論和研究方法的課程。從傳統(tǒng)課程的講解體系上來看,這5門課程都是自成一體的,依照教學大綱對應著不同的細致知識點。但是從構建智能數(shù)據(jù)平臺建設為核心的產(chǎn)學研研究中,這5門課程便可以有效整合成為一個整體。特別是在以社會情景需求為專題突破口的前提下,這5門課程更是成為統(tǒng)一專題服務的工具,它們以不同的視角指向了同一目標。例如,以“如何了解市民的心理健康程度,保障社會安全”的社會需求為例,教師可以在西方社會學和發(fā)展社會學這兩門課程中向學生引出該主題,同時要求運用這兩門課程的知識,明確能夠解決需求的社會理論。學生在理論的確定過程中,通過與教師和其他同學的討論明確了理論的本質和解決問題的思路,此后將依據(jù)理論界定出關鍵概念和研究主題與研究假設。在社會組織管理課程中,學生將依據(jù)研究主題和假設,明確社會需求可能解決的突破點――選擇和那些具體的社會組織進行合作與探討,從數(shù)據(jù)收集和分析的角度科學化地提出一整套解決方案。在未來的社會調查研究方法和數(shù)據(jù)分析技術中,研究者將可以通過已確定研究主題、假設和社會組織的具體情況進行概念操作化和問卷設計,并將問卷、測量或其他形式的數(shù)據(jù)收集方式置入智能數(shù)據(jù)平臺中。在數(shù)據(jù)分析技術課程中,學生將按照已經(jīng)設定好的研究方案運用智能數(shù)據(jù)分析平臺對分析數(shù)據(jù)并輸出報告。最終,這些報告和數(shù)據(jù)結果將有針對性地提交給對應的社會管理組織,在實踐中評估其對社會需求的解決程度。

參考文獻:

[1]陳陽,張梅.大數(shù)據(jù)基礎上抽樣調查在社會治理中的應用探討[J].理論界,2015,11:151-155.

[2]陳陽,魏玉東.大數(shù)據(jù)影響下的政府社會經(jīng)濟調查動向探尋[J].遼寧經(jīng)濟,2015,01:76-77.