大暑詩句范文
時間:2023-04-06 11:42:25
導語:如何才能寫好一篇大暑詩句,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
不過,每一次概念或工具的履新,尤其是商業層面,其有確定意義或意義的確定的前提,都是為企業客戶降低了成本,也使普遍的消費者獲得了更好的服務。
盡管“大數據”在最近幾年才引起人們的關注,但許多互聯網公司走在了時代的前面,他們作為大數據時代的先行者,為如今的“大數據”的興起奠定了基礎,并在歷史的經歷中卓有成效,有時也成為追逆或效仿的對象。以下,希望從IBM、SAP、Oracle、Facebook、亞馬遜、百度、阿里巴巴、騰訊、京東這十家大數據的先行踐行者們,看看他們都在各自的領域創造了哪些有關大數據的基礎與標準,以便讓更多的B和C再進一步了解一下“大數據”應用的邏輯。
IBM、SAP、Oracle:
我們只是大數據的搬運工
前段時間IBM賣掉了自己的芯片業務,這表明了IBM對自己的未來有著一些清晰的規劃――減少硬件業務,將精力投入云計算、分析以及智慧地球的項目之上。IBM全球副總裁Eric Sall說,“IBM不能裝作這世界一成不變,這世界當然在隨時變化”。IBM此舉也恰巧說明了一個行業的趨勢,即數據在未來的發展至關重要,而分析數據的能力則顯得尤為突出。從信息時代到數據時代,是一種抽象的簡化。
作為一個以大數據為基礎為各行業提供解決方案的企業來說,硬件業務的多少與好壞似乎已并不能衡量自身的實力,自身的軟件服務才更可能決定一些根本性的東西。在今年,IBM宣布以10億元組建新部門,目的是發展公司最新的電腦系統Watson,它將據客戶過往的歷史記錄,幫助企業更好地認識客戶,隨時隨地以客戶選擇的方式進行接洽,并在需要行動時提供強大支持。因此它將大大節省企業/客戶的人工成本,以便更好地做出決策,更快的實現業務成效,而在去年,這一系統已經開始應用于醫療以及零售領域,幫助行業實現轉型。
盡管如此,IBM仍然是到了一個艱難的時刻,盡管投入了較大資金發展全球數據中心,比如以20億美元收購云計算基礎架構服務提供商SoftLayer,但其在云計算領域取得的收入應屬是杯水車薪,面對來勢洶洶的后起之秀,IBM這個藍色巨人可能需要放下過去的慢熱,雖然大象和螞蟻轉身需要的能級不同。
說到IBM就不得不提SAP,這個由前IBM員工成立的軟件公司如今已經發展為全球最大的企業應用軟件供應商。然而,SAP所涉及的領域不僅于此,他已經將自己的觸角伸及到了體育界。相信大家對2014巴西世界杯德國隊的奪冠記憶猶新,在這背后或有“大數據”的力量,可謂是德國隊的“第十二人”。早在此次世界杯之前,德國足協便與SAP公司合作,定制名為“Match In-sights”的足球解決方案,用以迅速收集、處理分析球員和球隊的技術數據,基于“數字和事實”優化球隊配置,從而提升球隊作戰能力,并通過分析對手技術數據。通過此種方式,德國隊在戰術制定上的時間成本大大縮短,這可以算所是“大數據”的一種勝利,同時也是未來體育發展的一種趨勢,即引入當今世界最發達的技術,提高自身比賽水平,借助大數據強有力的分析處理能力制定合理的訓練計劃與比賽戰術,而非像以前那樣單純的依靠球隊的不斷操練來實現。我們可以相信,在未來,不只是體育屆,任何范疇內的決策都會要借助“大數據”的分析結果來完成,因為它可以既便捷又準確。
這就是“大數據”的力量。百度李明遠有一句話:“大數據的特點就是發現人們原來看不到的數據,將這些數據應用于商業,改變認知的核心工具。”由此才產生了諸多在接入“大數據”業務后,發展迅猛的公司,Oracle就是其中之一。
Oracle最初的業務僅是數據庫,這也是他存在的基礎,直到1987他才成立了一個僅有7人的軟件開發部門,管理也十分成松散,而這個部門成立的理由只是因為Oracle公司需要一個財務管理系統。就在這種偶然下Oracle開始了“大數據”業務的發展,至1996年,Oracle贏得了華為的合作,稍后又拿到了美的、中興的訂單,直到1998年,他們已經擁有了1300位客戶。僅用了6年時間,Oracle就超越了諸多前輩一躍成為應用軟件業的第二,雖然同SAP仍有很大差距,但已經是一個不小的成績。
Oracle應用軟件的創始人杰夫?沃克說過:“盡管SAP有R/3,但在應用軟件市場上,他們并沒有達到高不可及的程度,他們并沒有真正做到象Oracle那樣成功。”到目前為止Orcale已經成為了應用軟件業僅次于SAP的公司,為戴爾公司、蘇格蘭皇家銀行等業界巨頭提供服務。其中,波士頓醫學中心在使用了Orcale的應用服務以優化其臨床及數據存儲環境之后,不僅消減了存儲成本并且使其性能也提高了74%。
不論是IBM、SAP還是Oracle,都是依靠應用軟件服務來創造盈利,他們在“大數據”的數據服務上已經取得了成功,其占據的市場份額是后起之秀們難以企及的。其實他們所做的并不復雜,可他們發現了前任未曾發現的信息。國內外的企業中,做應用軟件的不少,意圖涉足大數據領域更多,可是卻仍在低端市場中苦苦掙扎,這并非管理水平偏低的原因,而是因為太過看重自身的利益而忽略了“大數據”業務發展的必然條件,成本的降低與服務的提高,只有針對這些不變的點,才能真正走上“大數據”的發展道路,成為下一代領導者。
百度、google:不要再把我們看做搜索引擎,我們正在做些別的事情
“新一代的數據收集不僅是數據工具,數據本身會有很大的發展。”李彥宏如是說。
同樣是2014巴西世界杯期間,百度“世界杯預測”上線,盡管足球是一件不確定性極高的事情,可在比賽結束后發現,百度這次的預測無一錯誤。想想世界杯時無數走上天臺的小伙伴們,若是知道百度有此神器,應該是有些感想的吧。
在其賽事預測的產品說明中寫到“百度大數據部收集了2010-2013年全世界范圍內所有國家隊及俱樂部的賽事數據,構建了現在的賽事預測模型”,這是其利用“大數據”在傳統領域的又一次嘗試,并且他們希望在建立起成熟的模型之后,在球隊訓練、體彩等方面發揮商業價值。可以推斷,百度應該在“大數據”上有著極大的野心。
球賽預測的結果是可喜的,不過百度在另一項事情的預測上則栽了跟頭。在《黃金時代》上映之前,百度會上宣布電影《黃金時代》的票房預期可達2.0―2.3億,當時的媒體都認為這個數字估計的太過于保守,然而截止到10月16日,《黃金時代》的累計票房為4698萬,如此成績對于片方、媒體和公眾而言都是出乎意料,2.0億的票房估計竟然已經算是十分樂觀。這并不是百度第一次做票房預測了,早在7月14日愛奇藝就透露在內部,百度票房的預測已經有了百分之八十的準確率。百度也因為此次的預測失敗而推遲了票房預測產品的上線,我們可以看到在百度預測中,電影票房預測那一項仍是灰色,標注著“即將上線,敬請期待”的字樣。對此,可能的原因是類似《黃金時代》的文藝類影片樣本較少,不確定性大。
同百度這次失敗同樣的,他的競爭對手Google也有馬失前蹄的時候。在2008年Google推出了他的Google Flu Trends流感預測服務,在這之后的幾年時間中,預測的結果都是準確的。這也幫助各國對即將到來的流感進行了有效的預防,避免了更大的損失。直到2013年2月,Nature上出現文章,表示GFT預測的全國范圍的流感樣疾病(占全國人口的比例)近乎是實際值的2倍,這是由于Google所抓取的數據是直接從搜索引擎中來,這就使得真正的流感患者同跟風搜索流感的人混淆在一起,最終夸大了流感人口的比例。
可見,“大數據”中最重要的不是分析數據而恰恰是數據本身,如果數據本身存在著問題,那么不論算法如何正確出來的結果也是失之千里。
當然這僅僅是兩個微小的錯誤,并不能就此否定這兩家公司在“大數據”上做出的努力,畢竟以搜索引擎起家的他們天生就具有“大數據”應用研究與實踐的優勢。如今百度已經有了一套看起來更完整的“大數據”引擎系統,共三個部分:開放云,百度的大規模分布式計算和超大規模存儲云,對應到Google則是他舉世聞名的數據中心以及基于Colossus的云;數據工廠,百度將海量數據組織起來的軟件能力,對應到Google,其近年來為迎接大數據時代不斷改造核心技術,包括比MapReduce批處理索引系統搜索更快的Caffeine,專為BigTable設計的分布式存儲Colossus,Dremel和PowerDrill管理和分析大數據,以及Instant和Pregel。百度大腦,能夠應用這些數據的算法,對應到Google,Google提供的大數據分析智能應用包括多個方面,技術有Big Query、趨勢圖等。如果說百度大數據引擎是一個程序,那么它的數據結構就是數據工廠+開放云,而算法則對應到百度大腦。可以說二者在如和發展“大數據”上思路及其一致。在百度預測的界面我們可以看到已經能夠看到一個預測開放平臺,為每一個用戶提供平臺化的預測服務。借助這種服務,應該能夠更準確地預見未來的趨勢,趨利避害。譬如通過“疾病預測”,可以知道同類疾病全國哪家醫院最好,同城醫院中,哪家醫院現在排隊人數較少,或者當前天氣需要預防那種流行病;通過“景點預測”,我們能夠有效地規劃出游行程,只能看人不能看景的情況,而景區也能夠據此作出正確的判斷而非依靠以往模糊的經驗。對于企業來說,能夠有效地規避風險,調整戰略,進而減低成本,縮減開支,最終達到效率與收益的提高。
在如今搜索引擎市場已經不能為他們帶來更多盈利的情況下,百度與Google將目光同時轉向了“大數據”開發與研究。曾經有一個這樣的問題,問百度能夠依靠大數據做些什么,答可以分析網上賣假藥的情況。這固然是針對百度搜索中側邊經常顯示的廣告的調侃,但也反映了百度所面臨的尷尬,搜索業務所能提供的利潤已經接近飽和,盈利模式的更新已經迫不及待,而通過“大數據”變現,在目前是一條最有希望的道路。有消息稱,Google每年通過“大數據”可獲得約80億美元的收入,這一數字遠遠超過了百度。若百度能通過“百度預測”這一系列產品獲得成功,那么他所能獲得的不僅僅是更加海量的數據,更是源源不斷的現金流。
亞馬遜、京東、阿里巴巴:
當你們在瀏覽商品時……
眼下隨著日子的臨近,一年一度的雙十一又要來了,在那些網頁彈出的廣告中,不難注意到那些推薦的產品,正是曾經搜索過或者瀏覽過的,這正是基于“大數據”的結果。而這種智能推薦的服務是“大數據”應用商業化中較為成功的例子。
說道電商中“大數據”方面做得最成功的無疑是亞馬遜了,亞馬遜是云計算的奠基者,他在用戶偏好、商業領域等方面的“大數據”能力可以說甚至超過了Google。他從每一位客戶上捕捉大量數據,如購買記錄、瀏覽記錄、瀏覽時間等,從這些雜亂的數據中找到產品的關聯性,從而產生最適合推薦給用戶的產品。亞馬遜不對人進行分類,而是對用戶的需求分類,從而產生了亞馬遜的推薦系統,而此舉它帶去30%的銷售收入。反映在網頁上,我們可以看到亞馬遜會將智能推薦的過程貫穿購物的始終。此外,亞馬遜也會向用戶發送郵件,推薦少量的商品,甚至是你未來可能會用到的商品。更為重要的是這一系列過程并不會令人產生反感,用戶體驗也隨之提高。
對應到國內,不得不提的是阿里巴巴,作為國內最早運作云的部門,他的推薦系統同樣優秀。在淘寶首頁你會很容易看到一個名為“發現?好貨”的瀏覽框,其中的物品全部都同你最近瀏覽購買或搜索的類似。
淘寶作為一個擁有海量用戶數據的平臺,每天都有上千萬交易發生,數據從手機端、電腦中上傳,為阿里提供了一個數據庫。自去年3月起阿里上線了自己的云服務平臺――御膳房,旨在為第三方軟件服務商和品牌商提供大數據計算、挖掘、存儲的云環境開發平臺,構建阿里數據生態。這也是其在以“云計算、大數據”為核心的DT戰略上邁出的一步。截止到目前,僅一年多的時間,就同300多家第三方軟件服務商形成了合作,提供了包含流量推廣、商品管理、數據分析、CRM、ERP、廣告精準投放等多個支撐工具,覆蓋了180萬天貓、淘寶商家,為他們帶去了利潤。例如,通過“日報單品分析”服務能夠使得運營人員方便的進行單品優化、頁面調整,分析人員能夠清晰地進行業務分析;通過“財務對賬”服務能夠使得線上付款、線下交易更加融合,節省了中間周轉的成本。阿里數據平臺事業部王賁表示:“我們就像一個廚房,提供了最優質的原材料、最鋒利的工具,讓開發者、服務商這樣的大廚能夠快速實現大數據應用的各種idea。”
同樣的還有京東,雖然目前在云計算領域還遠遠達不到阿里的高度,但仍有著自己的努力。作為一個直接為用戶提品的電商,供應量變得十分關鍵,京東通過銷售情況、市場預期、時間日期的綜合數據,形成一個預測系統,最后自動形成訂單發送給供應商,避免缺貨情況的存在。另外,在我們搜索商品時,出現的標簽往往并不是商品的分類而是來自于商品的評價,這讓我們能夠更為準確的找到自己想要的商品。這一服務源自京東對于后臺搜索數據分析的結果,他們發現在京東商城進行購買的用戶往往對商品的分類并不清楚,而經常以商品的功能或作用來進行尋找,因此在他們看來,更重要的是在搜索欄中出現商品的評價而非分類,而主動將此類標簽加入搜索系統中能使用戶更好的找到自己想要的商品,加強了對用戶的服務,使得購物體驗大為提升,而這一舉措更是使自身的贏利大為增加。
然而這三家電商所收集的數據較多的為非結構化數據,在理解與分析上較為困難,因此偶有推薦系統向客戶并不需要的商品的情況的發生。
馬云在卸任演講上說:“很多人還沒搞清楚什么是PC互聯網,移動互聯網來了,我們還沒搞清楚移動互聯網的時候,大數據時代又來了。”“大數據”為平臺提供了更好的信息支持,創造出更優質的服務,更優質地服務又能帶來更多的數據,更多的數據樣本使分析結果更為精確,為用戶提供更佳的體驗,如此則有更多的人投入使用中來,這樣便形成了一個數據的良性循環。如此,“大數據”可以說是未來電商們發展的基礎資源及優勢所在,透過“大數據”的支撐,能夠提高用戶數量,提供優質服務,降低運營成本,提升總體盈利。
騰訊、facebook:
交流的是情感,看到的是數據
還記得今年情人節時Facebook發表的那份關于戀愛的數據么,通過“大數據”他能知道你們何時會戀愛,何時可能分手,甚至你本身尚未意識到時,他就已經察覺了。這是基于2.7億活躍用戶的統計結果。
同傳統的戀愛過程類似,社交網絡中的愛情也有一段“追求”的階段,在這一階段中,每位用戶每日會至少推送一條消息,而在關系確定之后推送的頻率則會直線下降。另一個趨勢是在找到伴侶后,由于愛意的增加,情侶間互動的內容會越來越甜蜜,正能量的傳遞也會隨之增多。不僅如此,Facebook甚至能夠推算出這段感情能夠維持多長時間,最長的可達4年以上,以及最容易分手的時間,通常是在5-7月。也許,Facebook應當基于此推出一項戀愛預測的服務,來幫助廣大單身青年們“脫團”,使他們的“雙十一”不再孤單。
早在2012年,Facebook就開始了用戶“大數據”的收集,主要是收集用戶在Facebook上公開的感情數據,并嘗試著讓用戶發表自己收聽習慣,并得到了有趣的結果。根據這些數據,他們制作出了“戀愛歌曲TOP10”以及“失戀歌曲TOP10”以此來慰藉那些墜入愛河以及傷心不已的用戶。可這并不是出于一時的好奇心或僅為好玩,最終的目的是將這些數據用于用戶推薦服務上,他們根據統計得到的數據,建立了“看心聽曲”服務,即根據用戶的心情,推薦不同的曲目,如此貼心的服務,不僅使用戶們感到暖心,同時也讓Facebook的用戶忠實度有了上升。
國內的騰訊在公司還在很小的時候就通過后臺記錄、分析用戶的每一個習慣,時至今日已經擁有了廣大的用戶數據,而正是這種對數據的重視,使得騰訊建立了今天的企鵝王國。
如今,騰訊云服務已經有了包括計算與網絡、存儲與CDN、監控與安全、數據分析等多項服務,并投入到清華大學微信建站,糗事百科、365日歷應用軟件運行等項目之中,為他們提供了多樣化的服務。DNSPod CEO吳洪聲說:“接入騰訊云之后,極大地減少了我們運維成本,特別是使用了云數據庫和CDN之后,我們的服務響應更快了,運營產品變得更簡單了。”其中,騰訊的數據分析平臺已經接入了100過個產品的各類數據,涵蓋數據數據管理、數據監控、數據分析、數據可視化、數據挖掘等多個方面,而推出的云分析服務,則是其“大數據”戰略的重點所在,從公布的信息中來看,從微信到微博,騰訊為云分析提供了全面的平臺支撐,達到了統計全面上報詳細的目的。
小小比如,騰訊基于“大數據”的產品“廣點通”,在騰訊大社交平臺海量用戶積累的基礎上,進行以人為核心的數據挖掘,實現精準的廣告推薦,形成用戶、物品和推薦位之間的交叉效應,其中最成功的就是同萬科聯手,使萬科投入了3萬的廣告費用,獲得了400萬元的銷售額。
然而騰訊現在需要做的除了開發“大數據”與云,還要打通自己的后臺數據,使其形成一個完整的生態圈,等待后期完全成熟的技術,加以借鑒,更深層次的挖掘自己的“大數據”。
基于社交網絡的公司統計分析“大數據”的一個特點就是側重于呈現人的行為以及社會關系的信息,從這些數據中,可以分析人們的日常生活與行為,從而從中挖掘社會、政治、商業等信息,甚至能夠預測未來。在這兩點上,騰訊與Facebook都做到了不少,也許我們如今不應將它們狹義地視為一個SNS社交軟件,而是進行重新的定義,如今它們的核心競爭力已不再是社交領域,而轉移到數據業務上,而SNS只是更好地完成其“大數據”戰略的一種應用,產生、收集、挖掘海量數據的一個工具。正如投資人Federated Media的約翰?巴特利(John Battelle)對Facebook的展望那樣,“該公司正嘗試著對自身進行重新定義,不滿足于做狹義方面的社交網站,而這恰是外界對它的理解”。
以上這些,算案例嗎?應該算吧。如果不是案例,就不是在講大數據。
一般而言,國外的公司起步早發展快,如今已經成為全球“大數據”領域的領導者,他們懂得如何將開發出的“大數據”服務快速變現,通過這種方式源源不斷的為自己的“大數據”開發及數據獲取提供資源,已經形成了一個成熟的生態體系。雖然IBM處于財務困境,但我們相信他只是到了一個繼續轉型的時期,丟掉沉重的硬件包袱,他必將重新崛起。而SAP雖然面臨眾多后起之秀的競爭的巨大壓力,可業界第一的位置仍然難以撼動。對于Oracle來說,想要和SAP一搏,僅靠不斷的收購是行不通的。
不論“大數據”這個概念是否僅是互聯網行業制造出的一個噱頭,越來越多的信息被映射到網上,數字世界正逐漸轉為虛擬世界,互聯網企業坐擁海量數據并將其應用于自身服務中已是一個不爭的事實。當然,未來沒有一家企業不是互聯網企業。
篇2
近日,一朋友剛拿到駕照,想買一輛車,打算先在網上了解一下。細心的她發現,在瀏覽了汽車頁面后,在與汽車無關的頁面上,也同樣出現了相關的汽車廣告。這并不是巧合,而是在她使用的電腦上,一個被稱為Cookies的文件記錄了她的瀏覽熱點。
大數據成為熱門趨勢,越來越多的品牌廠商和廣告營銷機構都在發力以大數據為基礎的網絡營銷模式。
大數據未來的發展是大家有目共睹,人們總是振臂高呼,“大數據時代已經到來”。是不是從線上發現客戶線索,轉至線下成交,大數據的使命就結束了?NO!
當然,收集數據只是大數據應用的第一步,如何分析并應用才是重要環節。采集到的數據并不是每一個都有用,汽車品牌主需要將多渠道、標準不一的客戶數據進行整合,建立汽車大數據庫。
篇3
【關鍵詞】大數據 數據分析 數據分析師
近年來,業界、學術界興起了大數據討論,一夜間大數據時代到來了。大數據給學術界帶來了新的思潮,大數據正在顛覆著很多傳統行業的模式,帶來變革。有人預測,大數據必將成為商業、政府、科研、教育、醫療等各行業面臨的一個挑戰。在大數據時代,數據分析、數據挖掘工作面臨著機遇與挑戰,本文從數據分析的角度,結合國內外相關研究,試圖回答大數據是什么,如何應對大數據的問題。
一、認識大數據
(一)大數據的宗旨:經過分析的數據才有價值
大數據要發揮作用必須經過分析,這是由大數據的4V特性(數據量大、數據類型多、要求處理速度快、低密度)決定的。也就是說,數據都是高維、低密度的,從單個數據中難以看出規律。因此,必須經過分析,針對高維進行降維,提煉大量低密度信息中的價值,才能發揮作用。否則,大數據背景下,反而更容易使得“活”信息混跡在大量“死”數據中被淹沒。面向大數據的分析要“簡單、迅速、規模化”。
(二)大數據的目標:實現基于數據的決策與資源配置
大數據最終要實現科學決策,基于信息對稱的有效資源配置。隨著大數據分析技術的發展,可利用數據來源從線下封閉的數據庫、數據倉庫擴展到開放性的O2O(Online To Offline)融合數據,可分析數據結構從原來以數值為主的結構化數據發展到涵蓋文本、視頻、音頻等多媒體數據。從而,大數據將逐步改變我們的決策目標和社會資源配置方式。基于數據的科學決策是一貫追求的目標。然而,信息不對稱是常態,因此傳統決策目標是建立相對滿意而非最優(決策科學家Simon提出),資源配置效率基于市場優于基于計劃。大數據背景下,迅速獲取分析更多輔助決策信息成為可能,因此決策目標可實現向最優的無限逼近,實現基于數據的“計劃”資源配置將更有效率。
(三)大數據的角度:個性化服務+中觀指數+宏觀連結
目前發展大數據,主要有基于數據為客戶提供個性化營銷服務、預測中觀行業或區域趨勢指數、基于連結的宏觀資源配置方案等角度。這不僅僅體現在阿里小微融資的個性化風控決策、高端品牌在線特賣品牌和定價動態決策(基于阿里巴巴網商活躍度指數和零售商品價格指數)、Discern group企業發展戰略咨詢報告上,還體現在阿里巴巴商務智能指數(預測經濟發展態勢)和基于公共氣象數據的各行業資源配置優化服務上。
互聯網金融是大數據發展各角度的前沿陣地。在金融領域,要實現從金融互聯網向互聯網金融的快速轉型。傳統模式下的金融企業開展網上業務,如:網上銀行、網上理財,并不是真正的互聯網金融。互聯網金融是指通過互聯網新技術為客戶實現搜索或風控等服務增值,比較有代表性的是,消除供求雙方結構不對稱的P2P貸款,提高存取效率的保值理財產品余額寶。
(四)大數據的關鍵點:保證數據質量
要發展大數據分析,首先要保證數據質量。錯誤的輸入必然導致錯誤的輸出。沒有數據質量,一切都是浮云。數據質量沒有保證,是不敢用的。數據質量是一項耗時、費力的基礎工作。
保證數據質量要求數據采集與清洗過程中秉持兩大原則:相關性和低噪聲。第一,大數據,數據并非越“大”越好,而是相關數據越“大”越好。特別是,在數據采集中,要以采集盡可能多的“相關”數據為目標,而非不加篩選越多越好。第二,大數據,首先數據獲取時要保證不存在誘導傾向的干擾因素,同時進行去噪處理。
保證數據質量要建立數據的數據。針對數據質量建立數據標簽,才有進步。有了對數據質量的數據,數據才能被決策者更為安全科學有效地使用。
(五)大數據競爭的核心:分析人才的競爭
大數據時代,作為一種資源,數據不再是稀缺資源。互聯網、門戶網站、社交網站、微博、微信等新媒體積累了大量數據,缺乏的是對這些數據的分析人員。缺乏專業的分析人才,即使守著數據的“金山”,也只能望“山”興嘆。因此,美國Turbo Financial Group采用最新的大數據分析技術聚焦被FICO遺忘的15%人群建模,阿里提出建立大數據分析的開放式平臺,希望能夠集結更多專家智慧,同時培養阿里分析人才,挖掘阿里數據“金礦”。
二、把握大數據
大數據對社會生活帶來方方面面的影響,我們如何把握大數據時代的機遇,需要慎重對待大數據帶來的挑戰。總結起來,主要有三個方面:
(一)大數據時代,數據整理和清洗工作
(1)數據整理和清洗工作是數據分析的基礎。大數據專家根據經驗,普遍認為該工作是一項基礎性工作,耗時多且簡單,占到數據分析工作量的60%以上,是數據分析前提和基礎。在此基上,數據分析工作需要對數據進行標識,進行深度分析,撰寫專題報告,確保結果可以執行,最終落實到決策和實施。
(2)大數據時代,需要充分借助IT技術管理數據質量工作。在大數據時代,人工逐筆發現、解決數據質量問題的方式成本高、效率低,不可持續。要盡量規范化、系統化、自動化管理數據質量工作,將節省下的人力資源投入到新問題的研究中。
(二)大數據時代,數據分析的特點
(1)采用倒金字塔模式分配“思考、工作、分享”的時間比重。數據分析工作包括三部分:“思考”,分析實際問題,將實際問題轉化成數學模型,提出解決方案的過程;“工作”,將解決方案程序化,得出結果的過程;“分享”,將分析的結果,轉化為決策,付諸實施的過程。在時間分配上,金字塔結構或柱形結構的分布形式不是最佳結構,倒金字塔結構比較合理。即,思考的過程花得時間長些,可以減少后期工作量,少走彎路。
(2)通過數據分析進行科學決策。很多人存在誤區,認為數據分析就是做報表、寫報告。在大數據時代,數據分析不僅僅停留在此,需要進行深度分析,建立數據化決策的流程。要尊重數據、認識數據,但不迷信數據。在尊重數據、尊重事實的前提下,減少主觀因素的干擾,快速做出數據化決策,這是一種能力。
(3)大數據時代,數據分析的要義是――簡單、迅速、規模化。數據分析的結果要簡潔、易懂;數據分析的時間要短,盡可能的自動化地出結果,要快速的滿足客戶的需求;數據分析的方法能夠實現大批量規模化。優秀的數據分析師應具有全局的預見性,一有問題可以馬上把該問題打成很碎、很多的問題,甚至把一個問題克隆出很多問題,從而與業務人員建立信任,降低工作量。
(4)從“死”信息中,分離出“活”的信息。大數據有數據量大的問題――產生大量的“死”數據。錯誤數據是指數據與實際情況不一致,異常數據是指數據正確但數據遠離群體的大多數,這類數據情況的處理手段比較成熟。而大數據時代,大量數據是不活躍主體,即“死”數據。因此,需要從高維低密度數據中,提取“活”的信息,發現規律。防止由于“死”信息的存在,導致分析結果不能正確反映“活”的群體特征。
(三)大數據時代,數據分析師的培養
(1)培養核心技術人才,確保長期競爭力。美國在建立全國醫療系統時,將系統外包給了加拿大的一家公司,系統運行的第一天就出現了崩潰。美國政府為此對該模式進行了反思,概括起來有三點:①外包公司設計時只顧滿足甲方的眼前利益,不會為甲方的長遠利益考慮;②項目外包造成美國技術骨干人員斷層,導致出現問題后自身無法解決;③采用該模式導致美國沒有了核心技術。
因此,在采用項目外包模式的同時,需要掌握其核心技術。在大數據時代,從數據分析、信息管理、IT技術三個方面保持核心競爭力。需要培養和保持業務、產品設計、數據分析、數據架構等方面的骨干隊伍。
(2)建立專業化的大數據分析團隊。大數據分析的核心是數學建模,基礎是實際業務,結果是自動化程序。在實際工作中需要正確、合理的使用數學建模的思維,構建以數學模型做為基礎的數據分析,建立量化管理風險的理念。深刻認識并正確駕馭大數據分析,大數據分析的方法是處于不斷發展過程中的,需要根據實際問題,結合實際數據,靈活構建模型。
參考文獻:
[1]朱建平,章貴軍,劉曉葳.大數據時代下數據分析理念的辨析[J].統計研究,2014,(2).
篇4
1、大數據(bigdata),IT行業術語,是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
2、在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣捷徑,而采用所有數據進行分析處理。大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。
(來源:文章屋網 )
篇5
數據革命的浪潮正潛移默化地影響著經濟社會的各個方面,包括作為基礎產業的物流業及其細分領域。
利用大數據驅動信息化建設,物流車隊的整體油耗,車船的位置信息、行程軌跡、運行周期等空間地理數據都能通過系統進行智能化處理,更好地實現精簡流程、提高效率、降低成本的目標。大數據的分析和應用,正助力物流業完成從粗放、低效、高耗的傳統業態向集約、高效、環保的現代物流轉型,幫助物流企業更加精細化地了解和研究客戶需求,從而“量身定制”個性化的產品和服務。
事實上,數據應用一直以來都存在,而在今天的大數據時代,關鍵是如何讓數據變成財富。
對于物流企業來說,盡早針對“大數據”進行產品、業務、管理等一系列的變革和創新,率先挖掘“數據商機”,是掌握未來的核心競爭力乃至生存機會的根本。當然,這一切都要以建立和提高數據的收集、挖掘、處理和應用能力為前提。
沒有人能阻擋時代的步伐,具有前瞻性眼界的企業,正在積極融入大數據時代。
馬云很早就說:“未來的世界是數據的世界。”今年5月,他主導建立的“菜鳥網”,未來也將在數據商機方面深耕細作。而阿里巴巴與十大快遞公司的核心合作點也正在“數據”方面,阿里巴巴物流事業部總經理龔濤指出,阿里巴巴可以通過數據給快遞企業提供線路容量擴容指導,通過數據回溯、監控和預測,快遞公司可預判消費者和商家的服務需求,開展主動服務。
物流業界以數據處理和應用為基礎的各類物流信息平臺在全國范圍內不斷涌現,極大地改變了物流運行業態。而許多物流企業也在積極試水大數據應用。在百世匯通,大數據正在為企業戰略規劃、運營管理和日常運作提供重要支持和指導。據百世物流科技(中國)有限公司副總裁張硯冰介紹,百世匯通嘗試運用大數據來管理、分析和判斷加盟網點的運營行為,通過網點在系統內的足跡建立數據分析模型,成功地預測了幾次網點的異動,使工作方式由被動式變為主動式、前置式,減少了大量客戶投訴,把問題消滅在萌芽階段。圓通快遞幾年前便已開始投資數億元與IBM合作開發以金剛核心業務系統為主體的信息技術平臺,以獲取處理海量數據的能力。
與大數據采集、處理、分析和應用相關的各類產品與設備也陸續在物流作業中投入使用,如能處理物流信息的智能手機、GPS系統以及在車輛或者包裹上的傳感器系統??
篇6
“我們的數據庫資源來自全世界1400多家拍賣公司,包括將近800萬個藝術作品的記錄。”在上海浦東的一家高端會所,來自美國Artnet公司國際拓展部的托馬斯侃侃而談,表露出運用藝術品大數據這枚“利器”進軍中國市場的決心。
Artnet是一個成立于1989年的藝術品數據公司,它積極在世界范圍內開展合作,除拍賣行之外,歐洲藝術品博覽會、來自柏林和布魯塞爾的相關機構也加入了合作者的行列。
而這一次,Artne將目光瞄準了中國。“中國的藝術品和古董拍賣市場是全世界最具上升動力的市場。”托馬斯認為,中國的藝術品市場有著強大的后勁,在大數據的應用上將大有可為。
當天,齊聚此次藝術延伸產業“頭腦風暴”的還有喜馬拉雅美術館創始館長沈其斌、上海文化藝術品研究院執行院長孔達達和當代藝術家、批評人及策展人徐子林等中國藝術品領域的大佬。
“通過藝術品數據,可以在數據挖掘的基礎上,為投資人提供藝術品市場發展的動向,幫助他們找到準確的投資方向。”孔達達稱,藝術品大數據在國際上發揮的作用已經越來越重要。
市場繁榮促進“大數據”到來
中國藝術品市場在近幾年的火爆,驚動了世界。“中國已超越美國成為世界最大的藝術品和古董市場。”一份來自TEFAF歐洲藝術基金會的最新數據顯示,中國在全球藝術品市場所占的份額由2010年的23%上升到2012年的30%,美國所占市場份額為29%,比2011年下降了5%。
不僅如此,歐盟的27個國家所占總份額為為34%,下降了三個百分點。伴隨著歐美國家藝術品交易市場份額的下降,中國的藝術品市場開始發揮威力。僅就2011年來說,中國藝術品交易額就達到了461億歐元,相對于2009年上升了63%。無疑,中國藝術品市場潛藏著巨大的商機。
“在過去十年里,中國藝術品市場資金量有很大的增長,讓業內不得不用諸多金融市場方法去進入藝術市場。”托馬斯介紹,良好的數據是保證藝術品市場的基礎,藝術品大數據在市場里的作用非常關鍵。
“中國需要藝術品數據作為觀察市場的工具,藝術品大數據可以把藝術家作為金融市場的‘個股’來進行分析,從這個角度觀察藝術品和藝術家成長的軌跡,也可以借助這些數據去分析藝術品的走向,為這個市場提供研究方法,使藝術品市場成為更透明、更有效的藝術市場。”
“大數據”的大能量
雖然中國藝術品交易規模逐漸攀升,但藝術品數據化的程度與歐美地區相差甚遠。
“運用藝術品大數據可以為藝術品市場做不少事情。”托馬斯介紹,通過Artnet搜集的藝術品交易記錄,可以分析出藝術品市場的變化。“比如可以把一些藝術家放在一起,很容易綜合出一個流派的指數,從中觀察到他們交易數量的變化等,這些為藝術品研究報告的撰寫提供了準確的數據。”
以過去十年藝術品交易市場為例,通過大數據挖掘,發現占市場交易最大份額的是現代派和印象派畫作,其中,現代派占比34%,印象派則為24%。二者合力搶占了全球藝術品市場大半江山。
對此,孔達達分析稱:“目前藝術品大數據在國際上已經有了較好的口碑。以Artnet為例,他們對于數據的整理較為謹慎,全線的1300多萬個數據在歐美的各種銀行、藝術品機構都得到了廣泛的應用,帶動了藝術品市場的數據化。”
他還明確表示,上海文化藝術品研究院將很快與Artnet建立合作關系,將在中國建立服務器,并由上海文化藝術品研究院搜集中國的藝術品市場的數據,充實到Artnet的數據庫里,豐富中國藝術品交易市場的數據。
不過,國際上藝術品市場數據提供多以收費的方式進行。以Artnet來說,一條數據需要支付10~25美元,“如果要做一份報告,那將需要支付一筆昂貴的費用。”這種模式在中國國內是否可行,還值得商榷。
如果雅昌網也開始收費
國內藝術品市場近年來的活躍,也催生了不少提供藝術品交易數據搜索的平臺。但孔達達認為,目前國內投資者對于藝術品金融大數據的概念還不太清晰,現階段發展還很不成熟。
以雅昌網為例,它是國內較大的藝術品交易數據中心,可從中搜索全國的藝術品交易數據,同時數據還是免費提供。但由于其基礎數據未經處理,讀者無法從這些數據本身直接得知真實的交易情況,只能自己進行甄別。
“藝術品的數據有干凈的數據、可疑數據以及垃圾數據。干凈的數據是已經及時清理過的準確的數據,而可疑數據和垃圾數據分別是那些有疑問的和沒有用的數據。”孔達達介紹,目前國內搜集到的基本都是二級市場的數據。
“這些數據主要源于十幾個拍賣公司提供,僅僅是初始數據,里面有不少疑問數據和垃圾數據,對于那些競拍后未付款或贗品等數據,國內還未及時清理,有時也會因為信息不對稱而搜集不到。”
不僅如此,目前國內畫廊、古玩店、私家交易等數據的獲取幾乎為零,這些數據屬于一級市場的范疇,但尚未有專門機構對一級市場進行數據整理,在我國藝術品界還處于空白階段。
篇7
1.1 大數據及其影響
大數據(Big Data)是目前最重要的科學、技術和社會話題。借用IDC數據公司的定義:“大數據是一種新一代的技術和架構,具備高效率的捕捉、發現和分析能力,能夠經濟地從類型繁雜、數量龐大的數據中挖掘出色價值。”
大數據定義有著如下的基本前提和含義。
① 大量的數據:大數據概念源于數據的爆炸性增長。用世界著名的咨詢公司高德納(Gartner)研究報告的描述:“同一類型的數據量快速增長;數據增長速度的加快;數據多樣性、新數據來源和新數據種類的不斷增加。”
② 多種類型數據積累:新的數據存儲和數據采集的技術發展使巨量數據的采集、收集、存儲成為可能。網絡技術、移動設備、數字傳感器、數碼攝影/攝像、監控影像、衛星定位系統、遙感技術、氣候和環境監測技術等等,每時每刻都在各種形式、各種類型的大量數據。
③ 計算技術的進步與發展:現代計算技術、網絡技術、多媒體技術和數據庫處理技術等可以處理各種形式的海量數據,產生出大量的高附加值的數據、結果、狀態和知識。
④ 數據處理能力成為戰略能力:數據量的激增、數據類型的多樣、技術平臺對數據的綜合處理,造成了知識邊界擴展、知識價值提升、知識衍生能力加快,它極大地影響到了企業、個人、社會和政府的決策,極大地促進了社會生產力的發展,使掌握大數據技術者獲得了競爭優勢和難于模仿的核心競爭力。因此,大數據技術也成為了國家的核心戰略資源。
大數據的含義廣博、技術領域廣泛、技術平臺多樣、作用效果巨大、影響意義深遠。理解大數據的理論、方法和架構,適應大數據的變革與發展,分享大數據所帶來的種種便利和收益,便能夠在大數據時代占領先機。
1.2 大數據對數據庫技術的影響
大數據的宗旨是處理數據,數據庫技術自然占據核心地位。而大數據環境下的數據庫技術也具有明顯的特殊性。
1.2.1 大數據環境下數據處理技術面臨的新特點
數據量宏大。對數據庫技術影響最大、最直接的方面莫過于數據的爆炸性增長。即使先不考慮數據類型的變化,需要處理的數據從MB擴展到GB,現在再擴展到TB,不遠的將來數據庫將經常面對PB量級的數據,這必然對數據庫的硬件架構、數據庫系統結構和數據庫應用產生重大的影響。
數據形式多樣。另外一個對數據庫技術產生重要影響的因子是數據的多樣化,傳統數字、圖像、照片、影像、聲音等多種數據資源需要進行處理,并且和傳統關系式數據不同的,許多數據格式中的有價值數據并不多,例如多張圖片定對象的變化,連續視頻影像中對特殊對象的跟蹤等等,其數據抽取方式、過濾方法和存儲、計算方式均有別于傳統數據庫。
單機或小型局域網的數據庫處理無法滿足。當前,數據量爆炸式增長,數據類型日趨多樣,傳統關系數據庫的處理能力已難于滿足,需要新的數據庫處理技術。
傳統的并行數據庫的靈活性具有局限性。并行數據庫系統取得了輝煌的成績,但是它的靈活性不佳,彈性受限,系統規模的收縮或擴展成本非常高。這樣的系統適合于“相對固定結構”的計算結構,例如機銀行業務管理系統或城市交通管理系統等。
結構化、半結構化與非結構化形式并存。讓數據庫有能力處理這些半結構化和非結構化(有時不作區分)數據變成了新型數據庫技術的一項迫切要求。
對結果要求的模糊化。在大數據的時代,計算技術不僅限于回答“是/非”問題,而是需要更多的模糊化結果。例如,流感有很可能在一周后流行、近期可能發生5級左右地震、近一周國際往返機票將上漲……這些答案并不精確,但足以指導人們的活動。非結構化數據的處理結果常常是給出模糊化的答案。
新數據庫技術的出現與挑戰。新需求的出現,促使了新技術的產生,為處理非結構化數據,Apache、Google、Amazon等公司分別開發了適應各自需要的新型數據庫系統,相關的專家經過分析和總結提出了NoSQL的設計理念,并創建了許多成功的產品。
1.2.2 新型數據庫技術的特點
與傳統數據庫技術相比較,新型數據庫技術具有一些明顯的特點,具體如下:
可處理的數據總量和數據類型增加。不再為數據結構化或數據代表性而人為地選取部分數據或進行數據抽樣;不再靠樣本規模的大小來控制結果的置信區間和置信度。新的數據庫處理技術試圖利用“全部數據”,完成對結果的計算和推斷。
使用更多的非結構化數據,而不是片面地強調全部使用結構化數據。在非結構化的高復雜度、高數據量、多種數據類型的情況下,允許結論和結果的“不精確”,允許追求“次優解”。體現大數據技術“以概率說話”的特點。
不再試圖避免或降低數據的混雜性,而是把“使用全部數據”作為追求“次優解”的途徑。即在復雜、混亂、無結構化與確定、規整、結構化數據之間做出平衡。
在遇到“使用全部數據,得出模糊化結果”與“實用部分數據,得出準確結論”的選擇時,新型數據庫技術一般會選擇前者,從一個更全面的角度利用更多的數據資源去尋找答案。
科學地在因果關系與相關關系中做出抉擇。如果數據總體支持因果關系的判別和斷言,則像傳統數據庫那樣提供因果關系斷語;如果數據計算量宏大、成本高昂或條件不具備,則把關注點由“因果關系”調整為“相關關系”——將追求“最優解”變為追求“次優解”或“模糊解”。自然地,這種相關關系的選擇不能是隨機的,而是預先設計和規劃好的。
不同的數據庫開發理念,不同的應用目標,不同的技術方案,早就了新型數據庫豐富多彩、特點各異的局面。
1.3 從傳統關系數據庫到非關系數據
在計算機系統結構剛剛趨于穩定的1970年,IBM公司的Edgar Codd(科德)首先提出了關系數據庫的概念和規則,這是數據庫技術的一個重要的里程碑。科德定義的關系數據庫具有結構化程度高、數據冗余量低、數據關系明確、一致性好的優點。關系數據庫模型把數據庫操作抽象成選擇、映射、連接、集合的并差交除操作、數據的增刪改查操作等。而1976年Boyce和Chamberlin提出的SQL結構化查詢語言則把關系數據庫及其操作模式完整地固定下來,其理論和做法延續至今,被作為數據庫技術的重要基石。關系數據庫中定義的關系模型的實質是二維表格模型,關系數據庫就是通過關系連接的多個二維表格之間的數據集合。當前流行的數據庫軟件Oracal、DB2、SQL Server、MySQL和Access等均屬于關系數據庫。
到二十世紀八十年代后期,IBM的研究員提出了數據倉庫(Data Warehouse)的概念,4年后Bill Inmon給出了被大家廣泛接受的數據倉庫定義:“數據倉庫是一個面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,用于支持管理中的決策制定。”數據倉庫的進步在于,它把決策支持定為數據庫中數據組織和管理的目標,從而把智能性和決策能力融入到數據庫中。Inmon之后,Ralph Kimball建立了更加方便、實用的“自底向上”數據倉庫架構并稱之為“數據集市”(Data Mart),這種技術受到企業及廠家的歡迎并采納實施。雖然數據集市被歸并為數據倉庫,但是它的出現誘發了商務智能和聯機分析技術的流行。
隨著數據庫在企業中的廣泛應用,企業收集了大量的數據,如何從已有數據中提取對企業運營和決策具有重要價值的信息,成為了數據庫使用者和開發者關系的話題。“關系數據庫之父”科德再次走在了前面,提出多維數據庫和多維分析的概念,這便是“聯機分析處理”(OLAP),使得數據庫已經顯現了“智能性”特點。從數據倉庫中產生的OLAP又反過來促進和推動數據倉庫技術的更深層的發展。
篇8
2000年,在互聯網處于最低谷的時候,網易公司為了給自己打氣,播出一個廣告,我的印象非常深刻。廣告詞“網聚人的力量”,特別貼切地說明了互聯網的本質,即把很多單個的節點連接起來,節點越多,效應和價值越大。網絡的效應、價值和節點并不是線性關系,也不是平方關系,而是指數關系,它指的就是全互聯的網絡。通俗地講,指數級效能的變化,使互聯網產生了顛覆傳統行業的能量,這就是“連接”。
互聯網的連接功能顛覆了商業模式和業界形態。過去的互聯網形式,僅僅變革信息表現方式,加快信息流速度。但是手機出現后,互聯網引起了全行業的革命。通過手機,人們不僅可以獲得信息、服務,還可以做交易。新的連接關系在出租車行業,也會引起資源利用效率的變革。我有一輛車,去萬達廣場時,王健林過來搭車,節省了我的油錢,也方便了他,提高了資源的利用率。類似的,其他改革正在繼續,比如,有些政府職能正在被取代;報社通過廣告盈利或傳播信息的方式正在改變;未來的電視臺將不復存在,節目制作組直接把片子放到網上,通過網絡盈利。
無線互聯網、手機互聯網等全互聯出現后,帶來的最大變化是,它改變了企業、產品和消費者之間的關系。今天的企業面臨互聯網,之所以感到不適應,是因為過去我們與消費者之間有太多渠道、層級。而現在每個企業的產品可以直接面對消費者,很多傳統的行銷方法不再起作用。物流、服務流、金錢的交易改變了原來的關系網絡,減少或消滅了很多中間狀態。沒有中間環節,消費者可以和供應者建立直接的連接關系。
中國的互聯網沒有硅谷本源技術的創新來源,卻依然發展得這么大。歸根結底,這源于商業模式的創新和人口紅利。視頻網站革了傳統電視臺的命,騰訊微信改變了運營商掙錢的形式,阿里巴巴聚合了傳統零售業的力量,小米改變了手機通信設備制造商的運營模式。
互聯網把原來行業賺的錢,回饋給消費者,并贏得消費者的歡迎,所以互聯網才能快速地成長,這也是中國互聯網的特色。參與感、社區營銷等手段,促使你把客戶變成用戶,再把用戶變成粉絲。未來,沒有粉絲的品牌將不會是真正的品牌。
有人問我,你為什么做手表?原因很簡單。人機互聯是2.0,物聯網是3.0。物聯網時代,是一個重新發明輪子的時代。過去的輪子是圓的,怎么發明都走不出這個框,而現在通過ROT技術,芯片可以放進輪子中。再用互聯網技術,把產品體驗變成互聯網體驗,最后改變商業模式,讓最傳統的生產制造業都有可能變成互聯網企業,這是非常好的機會。
篇9
如今大數據已應用于社會和生活的多個方面,交易數據、社交數據等的融合與處理給企業帶來了更多福利。在殼牌中國,大數據成為了指導企業業務及運營管理的重要應用。
理解數據之“大”
“所謂大數據其實更多強調的是數據的重要性,本質上不是絕對地說有多少數據就可以稱之為大數據,有多少數據就是小數據。”殼牌石油中國區首席信息官徐斌表示,“殼牌石油過去十年甚至更長的時間,基于商業智能、數據倉庫一直在使用數據。而當時IT架構基于單機方式運行,數據處理效率受限,數據源也大多來自企業內部。”
“互聯網所積累的數據量越來越大,同時對數據處理的要求也相應提高。這就產生了現在新的分布式平臺來做數據分析。”徐斌解釋道,“所謂‘大’,現在看來可能更多出于廣告目的。我個人認為,數據‘大’的概念更多是強調其商業價值,而不用去關注到底是多少數量級,或者是多少維度,這不是大數據的核心。”
“大數據的價值應該是通過數據去發現規律,通過信息整合去發現知識,并對知識進行濃縮形成智慧。”徐斌總結說,“這也是殼牌中國應用數據的最終目的。”
目前,大數據應用已滲入殼牌中國業務體系。在殼牌上游業務中,殼牌通過對地理等數據的實時采集、分析,從而提高油井開采成功率;在油罐管理上,殼牌使用SIR實時數據分析,減少潛在事故啟動數量、及早發現問題,大幅降低泄露事故;同時,可減少誤報導致的損失。大數據的應用可為每個油站每年節約約4000美元成本。
在下游燃油、油銷售上,殼牌整合移動設備、車聯網上的客戶數據并進行分析,向客戶推送定制服務消息。同時,殼牌與阿里巴巴合作,通過對網上交易及社交數據的分析,精確定位潛在客戶,實現高達70%的客戶轉化率。另一方面,殼牌與銀聯的合作,可通過對相關銀行卡交易數據進行分析,從而明晰殼牌的市場份額。
夯實大數據技術能力
目前,大數據發展行動已成為國家戰略。2015年兩會提出的發展“互聯網+”,其中核心技術就是大數據。云、物、移、大、智,大數據是核心,通過數據才能產生資產價值。
“從目前大數據發展國內外情況來看,英國是第1名,中國排位靠后。”徐斌表示,“這一位置也表明中國大數據使用狀態、數據開放都比較落后,需要有所提升。但中國大數據應用領域也很多,應用最多的就是金融業、醫療業和政府公共事業,這是目前用的比較多的三個領域。”
對于目前業界存在的一些大數據認識誤區,徐斌認為要從兩個方面厘清。“首先,大數據不是單純的技術,其最重要的目的是解決業務問題,幫助業務創造新的機會,需要團隊協作實現其價值;同時,大數據實現需要比較好的數據源,如果數據質量不高,再好的系統也沒有意義。總的來說,大數據不是工具,是一整套體系。其次,大數據不能解決所有問題。一方面,大數據不是全部數據,因此不能夠完全展現事情本質,只能預測可能性概率比較高的事情;另一方面,如果企業自身數據應用不好或存在很多信息鼓搗,也很難實現數據指導決策的有效應用。”
“目前,大數據在各個行業都有一些典型應用。例如汽車企業,可以利用互聯網收集數據進行快速決策,調整汽車行駛過程;例如新浪曾經推出南方-新浪大數據100指數,通過大家討論股票的熱度、財務指標考量等維度,精選出得票最高的股票對其進行投資;另外,金融行業可以通過銀行交易數據來分析跟蹤整個國家經濟運行情況。”徐斌介紹說。
那么,對單個企業而言,如何提升大數據應用能力建設?徐斌認為應從四方面著手。一是建立企業大數據體系,包括數據基礎平臺、數據報表與可視化、產品與運營分析、精細化運營平臺、數據產品、戰略分析與決策等;二是實現企業數據資產管理,包括數據資產治理、數據資產應用、數據資產運營;三是發展大數據應用應與云計算相輔相成;四是認識到大數據是文化與技術的結合。首先要有數據驅動決策的文化,其次要思考如何通過大數據分析和預測。
六個維度認識大數據價值
徐斌指出,大數據的應用主要有四種。“一是描述性數據應用,相當于給企業管理者一個顯微鏡和望遠鏡,了解企業發生了什么。二是診斷性數據應用,但企業發聲問題時通過數據分析找出原因,如不良貸款為何一直上升?客戶為何流失?哪些客戶流程?三是預測性數據應用,比如通過數據測評,提前了解零部件情況,及時調配。殼牌也有這樣的配件,比如鉆頭,如何讓它更健康的運作?殼牌通過傳感器了解鉆頭的熱度、疲勞度等,及時發現問題。通過數據及時跟蹤就可以提前預防,這樣就為企業帶來大量的價值。四是指導性數據應用,通過多維數據的收集和分析,可以給企業合理的建議方案。比如開發用戶,是做線下營銷還是線上接觸?是找這個群體還是找那個群體?這些都需要大數據分析。這是大數據最核心的應用。”
具體到大數據在企業內部的價值實現。徐斌表示大數據對企業有六個維度價值。
決策支持
假如企業要開一個加油站,在哪個點開?這直接影響到投資有沒有回報。通過大數據分析,通過手機信號定位來判斷移動速度,判斷是車還是人流,看看每天通過車的速度,這樣的數據很準確,如果通過它來做決策,顯然它的效率會高、回報率更可靠。
運營優化
比如加油站地下油罐的設計,通過大數據分析可以幫助我們決策。比如把這個區域的相應數據進行對比判斷,地下油罐是不是有泄露的可能?對殼牌來說,全球評估下來,一個站一年可以省好幾萬元錢,一年就是十幾億,這是成本的巨大節約。
營銷突破
通過大數據找到潛在的客戶,可是企業的潛在客戶在哪里?以前都是做線下促銷活動,精準力很差、轉換率很低。但是通過淘寶交易應用,通過新浪微博也可以找到相關的車主,這些人就是我們的客戶,我們就對他做精準營銷,這個轉換率是50%,非常高。
安全保護
比如,人的安全駕駛行為可通過數據分析出來,而化工廠也能通過數據分析及時發現危險,采取措施。
業務創新
用數據做業務創新,比如某服裝公司,七天內給一個客戶提供定制化的西服。靠的是什么?沉淀十年的西服板型的大數據,優化裁減、安裝匹配,這就是創新。
篇10
數字技術的迅猛發展,如云計算、互聯網等,掀起了網絡信息技術發展浪潮,推動了世界范圍內大數據時代的到來,尤其是大數據技術研發投入的加大,更是雙重沖擊了知識經濟和網絡化數字化[1]。大數據不僅使人們獲得新認知、創造新價值,還在一定程度上改變了市場、組織機構,而且為圖書館自動化發展提供了技術支持。在大數據時代背景下,圖書館管理和服務升級不斷得到推動,其服務方式、資源存儲等也發生了巨大變化,同時也受到了一定的影響和挑戰,需不斷創新服務模式,提高服務質量,才能促進圖書館持續健康發展。
1. 大數據知識服務概析
1.1大數據知識服務特征
大數據知識服務是一種面向大量數據的知識服務模式,也是一種新知識服務理念,產生于獲取、存儲、分析大量數據過程中[2]。由于大數據由大量交易數據、交互數據和數據處理技術趨勢匯聚而成,且具有一定復雜性,因此,現有數據中心技術無法滿足大數據知識服務需求,需不斷進行創新。可見,大數據知識服務的特征主要有:(1)整體性把握知識需求不確定性。(2)跨越共性技術體系和細分特征。(3)支持按需使用或付費。(4)強調用戶參與和群體協同。
1.2大數據知識服務主要表現
大數據知識服務是一種提供智慧服務以及面向數子圖書館發展的知識服務模式,智慧圖書館是未來圖書館新模式,以數字化、網絡化、智能化等信息技術為基礎,主要特征是互聯、高效、便利,其智慧服務是一種支持用戶應用和創新知識的特殊服務,建立于搜尋、分析、重組知識的服務基礎上。可見,在提供智慧服務模式上,大數據知識服務的主要表現有:(1)互聯、融合和共享圖書館基礎設施。(2)提供智慧服務。(3)智能管理體系構建高效化。
近年來,大數據技術不斷發展,數字圖書館逐漸向語義出版、移動閱讀等趨勢發展,且日益具有“全媒體”資源、完整業務流程等管理能力,而且云計算、互聯網等也為數字圖書館的發展提供了技術支持。可見,在面向數字圖書館發展知識服務模式上,大數據知識服務的主要表現有:(1)全新的資源建設策略。(2)構建全新知識服務平臺。(3)提供“融入環境、嵌入過程”的預見。
2. 大數據時代對圖書館的影響和挑戰
大數據是創新、競爭和生產力的下一個前沿領域,在大數據時代,信息行業深層次分析了數據,并挖掘了其價值,而且數據形態呈現多樣性,也具有極高的利用價值,因此處理數據成為了新興產業[3]。目前,圖書館數據對象、應用技術、價值流向等都和大數據具有一定共性,可見,大數據時代會對圖書館產生影響和挑戰,并促使圖書館服務模式發生變化。大數據時代對圖書館的影響和挑戰主要包括:(1)大數據為圖書館服務質量的提高提供支持。如今,圖書館間的競爭不僅僅是館藏資源、空間建筑、服務質量等,還包括大數據擁有量、數據價值挖掘等,同時圖書館日后發展策略也需通過分析和預測大數據而制定。(2)圖書館未來核心資產是綜合掌握大數據。大數據價值逐漸為人們認知,其分析技術也日益成熟,這使得讀者借閱習慣、服務消費記載等大數據價值被挖掘得更多,這些大數據為圖書館未來發展、服務模式建立等提供了有效依據,并構成了圖書館未來核心資產。(3)大數據時代為圖書館提供了發展機遇和挑戰。在大數據時代,圖書館不僅需通過對結構化數據的了解,有效掌握現代客戶可接受的服務種類,也需通過對大量半結構化和非結構化數據的了解,挖掘圖書館和客戶間可能發生的事,并預測和分析未來,以利于找到適宜的圖書館服務模式,積極應對日后挑戰。
3. 大數據時代圖書館服務模式創新策略
3.1建立健全圖書館制度
圖書館既是社會機構,也是國家及政府的制度安排,體現了社會對知識或信息的調節與分配,以利于保障人們知識權利和實現社會知識或信息[4]。在目前大數據時代中,需建立健全一定制定保障知識服務,即圖書館制度,所以為維護和發展圖書館制度,需做好以下幾方面工作:充分發揮圖書館保護隱私權和數據安全的作用,并促進數字隱私權基礎設施的建立;推動政府或相關組織積極履行制度供給、積極回應、適度規制等治理圖書館的責任,并通過建立健全圖書館制度,對政府、讀者等行為進行有效約束與合理調節;構建圖書館公益信息制度,充分發揮其協同作用,保障中低階層人民基本信息權益;在大數據時代,切實平衡公共權力、公民社會和公民權利,以免信息權力分配不平等。
3.2大數據應用理性化
在信息革命中,積極應用新技術不斷創新圖書館制度、文化,可促進圖書館的高效、優質改革,所以經過多次歷史經驗,我們可以理性的堅信大數據時代可實現圖書館知識服務智能化、智慧化、人性化。大數據時代的到來,給圖書館帶來了機遇和挑戰,只有正視這些機遇和挑戰,積極轉變思路,熟練掌握各種技術有效分析大數據,才能在一定程度上跨越式的實現大數據時代圖書館知識服務,進而推進大數據應用理性化,并切實強化信息環境下圖書館人文關懷,維護大數據時代信息公平,保護隱私權和數據安全。
3.3構建圖書館知識服務平臺
大數據圖書館知識服務平臺是一個智慧平臺,集獲取、存儲、組織大數據以及共享、交易服務資源等為一體,該平臺的構建以建設智慧圖書館為基本要求,具有數據源層、基礎支撐層、數據流轉層、知識服務平臺層等體系架構,構建時涉及諸多技術,如傳感技術、適配技術、虛擬化接入技術、大數據知識服務終端交互技術等。
3.4培養高素質的智慧圖書館員
一般情況下,智慧圖書館員具有以下特征:見多識廣、資質水準高、靈活性、創造力、終身學習等,這是每個智慧圖書館均需配備的人員,尤其是大數據時代背景下,智慧圖書館員更是要高素質,這不僅是人力資源的創新方向,也是培養智慧圖書館員的標準[5]。高素質的智慧圖書館員通常能準確把握對大數據范疇、價值、狀態等的分析與預測;能熟練應用多個學科技術,如人工智能、信息技術等;能科學合理的規劃圖書館發展方向;能建立綜合解決大數據的方案,如對數據進行獲取、存儲、分析等。