大數(shù)據(jù)時(shí)代的定義與特點(diǎn)范文

時(shí)間:2023-12-28 17:49:16

導(dǎo)語(yǔ):如何才能寫好一篇大數(shù)據(jù)時(shí)代的定義與特點(diǎn),這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

大數(shù)據(jù)時(shí)代的定義與特點(diǎn)

篇1

[關(guān)鍵詞]交通管理;智能交通;云計(jì)算;物聯(lián)網(wǎng);大數(shù)據(jù)

中圖分類號(hào):U12-39 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-914X(2017)08-0383-03

一、引言

隨著科學(xué)技術(shù)的飛速發(fā)展,傳統(tǒng)的交通管理模式和系統(tǒng)已無(wú)法滿足經(jīng)濟(jì)社會(huì)的快速增長(zhǎng)和物流需求,交通擁堵已經(jīng)成為國(guó)內(nèi)外所共同面臨的難題。解決城市交通問(wèn)題的一個(gè)重要途徑――智能交通,也是未來(lái)城市交通的發(fā)展方向。當(dāng)我們?cè)谥鸩秸J(rèn)識(shí)、運(yùn)用云計(jì)算、物聯(lián)網(wǎng)等技術(shù)解決該問(wèn)題時(shí),“大數(shù)據(jù)”時(shí)代已悄然來(lái)臨,既宣告了一個(gè)新時(shí)代的來(lái)臨,又成為了一個(gè)時(shí)代的標(biāo)志。不容置疑,隨著大數(shù)據(jù)時(shí)代的到來(lái),城市智能交通也必然會(huì)產(chǎn)生重大變化,也將面臨重要的發(fā)展機(jī)遇,智能交通產(chǎn)業(yè)發(fā)展也將迎來(lái)新的機(jī)遇。

二、大數(shù)據(jù)簡(jiǎn)介(圖1)

隨著世界各國(guó)對(duì)“大數(shù)據(jù)”關(guān)注度的提高,大數(shù)據(jù)的應(yīng)用范圍已不斷擴(kuò)大,其所蘊(yùn)含的內(nèi)容價(jià)值也得到進(jìn)一步的開發(fā)和利用。隨著互聯(lián)網(wǎng)技術(shù)的普及和發(fā)展,信息時(shí)代的發(fā)展進(jìn)步導(dǎo)致信息量的加速擴(kuò)大,海量的、多樣的信息使我們逐漸地步入了“大數(shù)據(jù)”的時(shí)代。想要在大數(shù)據(jù)中快速獲得有價(jià)值的信息并對(duì)其進(jìn)行有效的分析處理,就需要應(yīng)用到大數(shù)據(jù)技術(shù)。

1.大數(shù)據(jù)定義(圖2)

大數(shù)據(jù)時(shí)代的來(lái)臨,是互聯(lián)網(wǎng)發(fā)展到一定階段的必然產(chǎn)物。隨著互聯(lián)網(wǎng)的高速發(fā)展,互聯(lián)網(wǎng)中的信息量急劇增加,這些信息有用的部分被稱為數(shù)據(jù)。當(dāng)數(shù)據(jù)規(guī)模越來(lái)越大時(shí),量變就會(huì)引起質(zhì)變,大數(shù)據(jù)應(yīng)運(yùn)而生。如何定義大數(shù)據(jù),可以說(shuō)仁者見仁、智者見智。

IBMo出的定義:大數(shù)據(jù),或稱巨量資料,指所涉及的資料規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。大數(shù)據(jù)的4V特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)。

大數(shù)據(jù)概念給出的定義:大數(shù)據(jù)是一個(gè)體量特別大、類別特別大的數(shù)據(jù)集,并且無(wú)法用傳統(tǒng)數(shù)據(jù)庫(kù)工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理。首先,數(shù)據(jù)體量(Volumes)大,在實(shí)際應(yīng)用中已形成了PB級(jí)的數(shù)據(jù)量;其次,數(shù)據(jù)類別(Variety)大,囊括了半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。接著,數(shù)據(jù)處理速度(Velocity)快,在數(shù)據(jù)量非常龐大的情況下能夠做到數(shù)據(jù)的實(shí)時(shí)處理。最后,數(shù)據(jù)真實(shí)性(Veracity)高,企業(yè)愈發(fā)需要有效的信息以確保其真實(shí)性及安全性。

研究機(jī)構(gòu)給出的定義:大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。從數(shù)據(jù)的類別上看,大數(shù)據(jù)指的是無(wú)法使用傳統(tǒng)流程或工具處理或分析的信息。它定義了那些超出正常處理范圍和大小、迫使用戶采用非傳統(tǒng)處理方法的數(shù)據(jù)集。

2.大數(shù)據(jù)特點(diǎn)

從上述定義,我們可以將大數(shù)據(jù)特點(diǎn)歸納為4個(gè)V(量Volume,多樣Variety,價(jià)值Value,速Velocity):如圖3所示:

第一,Volume數(shù)據(jù)體量巨大,從TB級(jí)別躍升到PB級(jí)別。

第二,Variety數(shù)據(jù)類型繁多,包括視頻、圖片、地理位置信息、傳感器數(shù)據(jù)等等。

第三,Value價(jià)值密度低,應(yīng)用價(jià)值高,以視頻為例,連續(xù)不間斷監(jiān)控過(guò)程中可能有用的數(shù)據(jù)僅僅有一兩秒。

第四,Velocity處理速度快,1秒定律。最后這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。在交通領(lǐng)域,海量的數(shù)據(jù)主要包括四個(gè)類型的數(shù)據(jù):傳感器數(shù)據(jù)(位置、溫度、壓力、圖像、速度、RFID等信息);系統(tǒng)數(shù)據(jù)(日志、設(shè)備記錄、MIBs管理信息庫(kù)等);服務(wù)數(shù)據(jù)(收費(fèi)信息、上網(wǎng)服務(wù)及其他信息);應(yīng)用數(shù)據(jù)(生成廠家、能源、交通、性能、兼容性等信息)。交通數(shù)據(jù)的類型繁多,而且體積巨大。

在以上的四個(gè)特點(diǎn)中,量Volume和多樣Variety是因,數(shù)據(jù)類型的復(fù)雜和數(shù)據(jù)量的急劇增加決定了原有簡(jiǎn)單因果關(guān)系的應(yīng)用模式對(duì)數(shù)據(jù)使用率極低,完全無(wú)法發(fā)揮數(shù)據(jù)的作用;速Velocity是過(guò)程,巨大的運(yùn)算量決定了速度必須快;價(jià)值Value是最終的果。

三、大數(shù)據(jù)在城市交通管理的價(jià)值(圖4)

近年來(lái),包括互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等信息技術(shù)在內(nèi)的IT通信業(yè)迅速發(fā)展,現(xiàn)代信息社會(huì)已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代。大數(shù)據(jù)改變的不只是人們的日常生活和工作模式、企業(yè)運(yùn)作和經(jīng)營(yíng)模式,甚至還引起科學(xué)研究模式的根本性改變。

大數(shù)據(jù)中蘊(yùn)含著大價(jià)值,大數(shù)據(jù)價(jià)值的合理共享和利用將創(chuàng)造巨大的財(cái)富。大數(shù)據(jù)智能分析能夠給智慧城市的管理和服務(wù)系統(tǒng)提供新的洞察力,是提升智慧城市“智商”的關(guān)鍵。以大數(shù)據(jù)技術(shù)為支撐的綜合智能化分析和決策系統(tǒng),使智慧城市的管理系統(tǒng)和服務(wù)系統(tǒng)充分、有效、合理地發(fā)揮各自的作用,解決目前困擾各地的“信息孤島”現(xiàn)象,做到信息資源的共享、智能決策的集成,實(shí)現(xiàn)智慧城市讓城市生活更美好、更幸福的目標(biāo)。

第一,大數(shù)據(jù)的虛擬性可以解決跨越行政區(qū)域的限制。

交通大數(shù)據(jù)的虛擬性,有利于其信息跨越區(qū)域管理,只要多方共同遵照相關(guān)的信息共享原則,就能在已有的行政區(qū)域下解決跨域管理問(wèn)題。

篇2

關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);數(shù)據(jù)分析;抽樣理論;理論

重構(gòu)隨著信息科學(xué)技術(shù)的高速度發(fā)展,當(dāng)代獲取和儲(chǔ)存數(shù)據(jù)信息的能力不斷增強(qiáng)而成本不斷下降,這為大數(shù)據(jù)的應(yīng)用提供了必要的技術(shù)環(huán)境和可能.應(yīng)用大數(shù)據(jù)技術(shù)的優(yōu)勢(shì)愈來(lái)愈明顯,它的應(yīng)用能夠幫助人類獲取真正有價(jià)值的數(shù)據(jù)信息.近年來(lái),專家學(xué)者有關(guān)大數(shù)據(jù)技術(shù)問(wèn)題進(jìn)行了大量的研究工作[1],很多領(lǐng)域也都受到了大數(shù)據(jù)分析的影響.這個(gè)時(shí)代將大數(shù)據(jù)稱為未來(lái)的石油,它必將對(duì)這個(gè)時(shí)代和未來(lái)的社會(huì)經(jīng)濟(jì)以及科學(xué)技術(shù)的發(fā)展產(chǎn)生深遠(yuǎn)的意義和影響.目前對(duì)于大數(shù)據(jù)概念,主要是從數(shù)據(jù)來(lái)源和數(shù)據(jù)的處理工具與處理難度方面考慮,但國(guó)內(nèi)外專家學(xué)者各有各的觀點(diǎn),并沒有給出一致的精確定義.麥肯錫全球數(shù)據(jù)分析研究所指出大數(shù)據(jù)是數(shù)據(jù)集的大小超越了典型數(shù)據(jù)庫(kù)工具集合、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集,大數(shù)據(jù)被Gartner定義為極端信息管理和處理一個(gè)或多個(gè)維度的傳統(tǒng)信息技術(shù)問(wèn)題[23].目前得到專家們認(rèn)可的一種觀點(diǎn),即:“超大規(guī)模”是GB級(jí)數(shù)據(jù),“海量”是TB級(jí)數(shù)據(jù),而“大數(shù)據(jù)”是PB及其以上級(jí)別數(shù)據(jù)[2].

一些研究學(xué)者把大數(shù)據(jù)特征進(jìn)行概括,稱其具有數(shù)據(jù)規(guī)模巨大、類型多樣、可利用價(jià)值密度低和處理速度快等特征,同時(shí)特別強(qiáng)調(diào)大數(shù)據(jù)區(qū)別于其他概念的最重要特征是快速動(dòng)態(tài)變化的數(shù)據(jù)和形成流式數(shù)據(jù).大數(shù)據(jù)技術(shù)發(fā)展所面臨的問(wèn)題是數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理和數(shù)據(jù)分析、數(shù)據(jù)顯示和數(shù)據(jù)安全等.大數(shù)據(jù)的數(shù)據(jù)量大、多樣性、復(fù)雜性及實(shí)時(shí)性等特點(diǎn),使得數(shù)據(jù)存儲(chǔ)環(huán)境有了很大變化[45],而大部分傳統(tǒng)的統(tǒng)計(jì)方法只適合分析單個(gè)計(jì)算機(jī)存儲(chǔ)的數(shù)據(jù),這些問(wèn)題無(wú)疑增加了數(shù)據(jù)處理和整合的困難.數(shù)據(jù)分析是大數(shù)據(jù)處理的核心過(guò)程,同時(shí)它也給傳統(tǒng)統(tǒng)計(jì)學(xué)帶來(lái)了巨大的挑戰(zhàn)[6].產(chǎn)生大數(shù)據(jù)的數(shù)據(jù)源通常情況下具有高速度性和實(shí)時(shí)性,所以要求數(shù)據(jù)處理和分析系統(tǒng)也要有快速度和實(shí)時(shí)性特點(diǎn),而傳統(tǒng)統(tǒng)計(jì)分析方法通常不具備快速和實(shí)時(shí)等特點(diǎn).基于大數(shù)據(jù)的特點(diǎn),傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)理論已經(jīng)不能適應(yīng)大數(shù)據(jù)分析與研究的范疇,傳統(tǒng)統(tǒng)計(jì)學(xué)面臨著巨大的機(jī)遇與挑戰(zhàn),然而為了適應(yīng)大數(shù)據(jù)這一新的研究對(duì)象,傳統(tǒng)統(tǒng)計(jì)學(xué)必須進(jìn)行改進(jìn),以繼續(xù)和更好的服務(wù)于人類.目前國(guó)內(nèi)外將大數(shù)據(jù)和統(tǒng)計(jì)學(xué)相結(jié)合的研究文獻(xiàn)并不多.本文對(duì)大數(shù)據(jù)時(shí)代這一特定環(huán)境背景,統(tǒng)計(jì)學(xué)的抽樣理論和總體理論的存在價(jià)值、統(tǒng)計(jì)方法的重構(gòu)及統(tǒng)計(jì)結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn)的重建等問(wèn)題進(jìn)行分析與研究.

1傳統(tǒng)意義下的統(tǒng)計(jì)學(xué)

廣泛的統(tǒng)計(jì)學(xué)包括三個(gè)類型的統(tǒng)計(jì)方法:①處理大量隨機(jī)現(xiàn)象的統(tǒng)計(jì)方法,比如概率論與數(shù)理統(tǒng)計(jì)方法.②處理非隨機(jī)非概率的描述統(tǒng)計(jì)方法,如指數(shù)編制、社會(huì)調(diào)查等方法.③處理和特定學(xué)科相關(guān)聯(lián)的特殊方法,如經(jīng)濟(jì)統(tǒng)計(jì)方法、環(huán)境科學(xué)統(tǒng)計(jì)方法等[7].受收集、處理數(shù)據(jù)的工具和能力的限制,人們幾乎不可能收集到全部的數(shù)據(jù)信息,因此傳統(tǒng)的統(tǒng)計(jì)學(xué)理論和方法基本上都是在樣本上進(jìn)行的.或者即使能夠得到所有數(shù)據(jù),但從實(shí)際角度出發(fā),因所需成本過(guò)大,也會(huì)放棄搜集全部數(shù)據(jù).然而,選擇最佳的抽樣方法和統(tǒng)計(jì)分析方法,也只能最大程度還原總體一個(gè)特定方面或某些方面的特征.事實(shí)上我們所察覺到的數(shù)據(jù)特征也只是總體大量特征中的一小部分,更多的其他特征尚待發(fā)掘.總之,傳統(tǒng)統(tǒng)計(jì)學(xué)是建立在抽樣理論基礎(chǔ)上,以點(diǎn)帶面的統(tǒng)計(jì)分析方法,強(qiáng)調(diào)因果關(guān)系的統(tǒng)計(jì)分析結(jié)果,推斷所測(cè)對(duì)象的總體本質(zhì)的一門科學(xué),是通過(guò)搜集、整理和分析研究數(shù)據(jù)從而探索數(shù)據(jù)內(nèi)部存在規(guī)律的一門科學(xué).

2統(tǒng)計(jì)學(xué)是大數(shù)據(jù)分析的核心

數(shù)的產(chǎn)生基于三個(gè)要素,分別是數(shù)、量和計(jì)量單位.在用數(shù)來(lái)表示事物的特征并采用了科學(xué)的計(jì)量單位后,就產(chǎn)生了真正意義上的數(shù)據(jù),即有根據(jù)的數(shù).科學(xué)數(shù)據(jù)是基于科學(xué)設(shè)計(jì),通過(guò)使用觀察和測(cè)量獲得的數(shù)據(jù),認(rèn)知自然現(xiàn)象和社會(huì)現(xiàn)象的變化規(guī)律,或者用來(lái)檢驗(yàn)已經(jīng)存在的理論假設(shè),由此得到了具有實(shí)際意義和理論意義的數(shù)據(jù).從數(shù)據(jù)中獲得科學(xué)數(shù)據(jù)的理論,即統(tǒng)計(jì)學(xué)理論.科學(xué)數(shù)據(jù)是通過(guò)統(tǒng)計(jì)學(xué)理論獲得的,而統(tǒng)計(jì)學(xué)理論是為獲得科學(xué)數(shù)據(jù)而產(chǎn)生的一門科學(xué).若說(shuō)數(shù)據(jù)是傳達(dá)事物特征的精確語(yǔ)言,進(jìn)行科學(xué)研究的必備條件,認(rèn)知世界的重要工具,那么大數(shù)據(jù)分析就是讓數(shù)據(jù)最大限度地發(fā)揮功能,充分表達(dá)并有效滿足不同需求的基本要求.基于統(tǒng)計(jì)學(xué)的發(fā)展史及在數(shù)據(jù)分析中的作用,完成將數(shù)據(jù)轉(zhuǎn)化為知識(shí)、挖掘數(shù)據(jù)內(nèi)在規(guī)律、通過(guò)數(shù)據(jù)發(fā)現(xiàn)并解決實(shí)際問(wèn)題、預(yù)測(cè)可能發(fā)生的結(jié)果等是研究大數(shù)據(jù)的任務(wù),而這必然離不開統(tǒng)計(jì)學(xué).以大數(shù)據(jù)為研究對(duì)象,通過(guò)數(shù)據(jù)挖掘、提取、分析等手段探索現(xiàn)象內(nèi)在本質(zhì)的數(shù)據(jù)科學(xué)必須在繼承或改進(jìn)統(tǒng)計(jì)學(xué)理論的基礎(chǔ)上產(chǎn)生.

統(tǒng)計(jì)數(shù)據(jù)的發(fā)展變化經(jīng)歷了一系列過(guò)程,從只能收集到少量的數(shù)據(jù)到盡量多地收集數(shù)據(jù),到科學(xué)利用樣本數(shù)據(jù),再到綜合利用各類數(shù)據(jù),以至于發(fā)展到今天的選擇使用大數(shù)據(jù)的過(guò)程.而統(tǒng)計(jì)分析為了適應(yīng)數(shù)據(jù)可觀察集的不斷增大,也經(jīng)歷了相應(yīng)的各個(gè)不同階段,產(chǎn)生了統(tǒng)計(jì)分組法、大量觀察法、歸納推斷法、綜合指標(biāo)法、模型方程法和數(shù)據(jù)挖掘法等分析方法,并且借助計(jì)算機(jī)以及其他軟件的程度也越來(lái)越深.300多年來(lái),隨著數(shù)據(jù)量以指數(shù)速度的不斷增長(zhǎng),統(tǒng)計(jì)學(xué)圍繞如何搜集、整理和分析數(shù)據(jù)而展開,合理構(gòu)建了應(yīng)用方法體系,幫助各個(gè)學(xué)科解決了許多復(fù)雜問(wèn)題.現(xiàn)在進(jìn)入了大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)學(xué)依舊是數(shù)據(jù)分析的靈魂,大數(shù)據(jù)分析是數(shù)據(jù)科學(xué)賦予統(tǒng)計(jì)學(xué)的新任務(wù).對(duì)于統(tǒng)計(jì)學(xué)而言,來(lái)自新時(shí)代的數(shù)據(jù)科學(xué)挑戰(zhàn)有可能促使新思想、新方法和新技術(shù)產(chǎn)生,這一挑戰(zhàn)也意味著對(duì)于統(tǒng)計(jì)學(xué)理論將面臨巨大的機(jī)遇.

3統(tǒng)計(jì)學(xué)在大數(shù)據(jù)時(shí)代下必須改革

傳統(tǒng)統(tǒng)計(jì)學(xué)是通過(guò)對(duì)總體進(jìn)行抽樣來(lái)搜索數(shù)據(jù),對(duì)樣本數(shù)據(jù)進(jìn)行整理、分析、描述等,從而推斷所測(cè)對(duì)象的總體本質(zhì),甚至預(yù)測(cè)總體未來(lái)的一門綜合性學(xué)科.從研究對(duì)象到統(tǒng)計(jì)結(jié)果的評(píng)判標(biāo)準(zhǔn)都是離不開樣本的抽取,完全不能適應(yīng)大數(shù)據(jù)的4V特點(diǎn),所以統(tǒng)計(jì)學(xué)為適應(yīng)大數(shù)據(jù)技術(shù)的發(fā)展,必須進(jìn)行改革.從學(xué)科發(fā)展角度出發(fā),大數(shù)據(jù)對(duì)海量數(shù)據(jù)進(jìn)行存儲(chǔ)、整合、處理和分析,可以看成是一種新的數(shù)據(jù)分析方法.數(shù)據(jù)關(guān)系的內(nèi)在本質(zhì)決定了大數(shù)據(jù)和統(tǒng)計(jì)學(xué)之間必然存在聯(lián)系,大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的發(fā)展提出了挑戰(zhàn),體現(xiàn)在大樣本標(biāo)準(zhǔn)的調(diào)整、樣本選取標(biāo)準(zhǔn)和形式的重新確定、統(tǒng)計(jì)軟件有待升級(jí)和開發(fā)及實(shí)質(zhì)性統(tǒng)計(jì)方法的大數(shù)據(jù)化.但是也提供了一個(gè)機(jī)遇,體現(xiàn)在統(tǒng)計(jì)質(zhì)量的提高、統(tǒng)計(jì)成本的下降、統(tǒng)計(jì)學(xué)作用領(lǐng)域的擴(kuò)大、統(tǒng)計(jì)學(xué)科體系的延伸以及統(tǒng)計(jì)學(xué)家地位的提升[7].

3.1大數(shù)據(jù)時(shí)代抽樣和總體理論存在價(jià)值

傳統(tǒng)統(tǒng)計(jì)學(xué)中的樣本數(shù)據(jù)來(lái)自總體,而總體是客觀存在的全體,可以通過(guò)觀測(cè)到的或經(jīng)過(guò)抽樣而得到的數(shù)據(jù)來(lái)認(rèn)知總體.但是在大數(shù)據(jù)時(shí)代,不再是隨機(jī)樣本,而是全部的數(shù)據(jù),還需要假定一個(gè)看不見摸不著的總體嗎?如果將大數(shù)據(jù)看成一個(gè)高維度的大樣本集合,針對(duì)樣本大的問(wèn)題,按照傳統(tǒng)統(tǒng)計(jì)學(xué)的方法,可以采用抽樣的方法來(lái)減少樣本容量,并且可以達(dá)到需要的精度;對(duì)于維度高的問(wèn)題,可以采取對(duì)變量進(jìn)行選擇、降維、壓縮、分解等方法來(lái)降低數(shù)據(jù)的復(fù)雜程度.但實(shí)際上很難做得到,大數(shù)據(jù)涵蓋多學(xué)科領(lǐng)域、多源、混合的數(shù)據(jù),各學(xué)科之間的數(shù)據(jù)融合,學(xué)科邊界模糊,各范疇的數(shù)據(jù)集互相重疊,合成一體,而且大數(shù)據(jù)涉及到各種數(shù)據(jù)類型.因此想要通過(guò)抽樣而使數(shù)據(jù)量達(dá)到傳統(tǒng)統(tǒng)計(jì)學(xué)的統(tǒng)計(jì)分析能力范圍是一件相當(dāng)困難或是一件不可能的事.大量的結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)交織在一起,系統(tǒng)首先要認(rèn)清哪個(gè)是有價(jià)值的信息,哪個(gè)是噪聲,以及哪些不同類型的數(shù)據(jù)信息來(lái)自于同一個(gè)地址的數(shù)據(jù)源,等等,傳統(tǒng)的統(tǒng)計(jì)學(xué)是無(wú)法做到的.在大數(shù)據(jù)時(shí)代下,是否需要打破傳統(tǒng)意義的抽樣理論、總體及樣本等概念和關(guān)系,是假設(shè)“樣本=總體”,還是“樣本趨近于總體”,還是不再使用總體和樣本這兩個(gè)概念,而重新定義一個(gè)更合適的概念,等等.人們?cè)撛鯓印鞍才拧背闃印⒖傮w及樣本等理論,或人們?cè)撛鯓有拚闃印⒖傮w、樣本的“公理化”定義,這個(gè)問(wèn)題是大數(shù)據(jù)時(shí)代下,傳統(tǒng)統(tǒng)計(jì)學(xué)面臨改進(jìn)的首要問(wèn)題.

3.2統(tǒng)計(jì)方法在大數(shù)據(jù)時(shí)代下的重構(gòu)問(wèn)題

在大數(shù)據(jù)時(shí)代下,傳統(tǒng)的高維度表達(dá)、結(jié)構(gòu)描述和群體行為分析方法已經(jīng)不能精確表達(dá)大數(shù)據(jù)在異構(gòu)性、交互性、時(shí)效性、突發(fā)性等方面的特點(diǎn),傳統(tǒng)的“假設(shè)-模型-檢驗(yàn)”的統(tǒng)計(jì)方法受到了質(zhì)疑,而且從“數(shù)據(jù)”到“數(shù)據(jù)”的統(tǒng)計(jì)模式還沒有真正建立,急切需要一個(gè)新的理論體系來(lái)指引,從而建立新的分析模型.去除數(shù)據(jù)噪聲、篩選有價(jià)值的數(shù)據(jù)、整合不同類型的數(shù)據(jù)、快速對(duì)數(shù)據(jù)做出分析并得出分析結(jié)果等一系列問(wèn)題都有待于研究.大數(shù)據(jù)分析涉及到三個(gè)維度,即時(shí)間維度、空間維度和數(shù)據(jù)本身的維度,怎樣才能全面、深入地分析大數(shù)據(jù)的復(fù)雜性與特性,掌握大數(shù)據(jù)的不確定性,構(gòu)建高效的大數(shù)據(jù)計(jì)算模型,變成了大數(shù)據(jù)分析的突破口.科學(xué)數(shù)據(jù)的演變是一個(gè)從簡(jiǎn)單到復(fù)雜的各種形式不斷豐富、相互包容的過(guò)程,是一個(gè)循序漸進(jìn)的過(guò)程,而不是簡(jiǎn)單的由一種形式取代另一種形式.研究科學(xué)數(shù)據(jù)的統(tǒng)計(jì)學(xué)理論也是一樣,也是由簡(jiǎn)單到復(fù)雜的各種形式相互包容、不斷豐富的發(fā)展過(guò)程,而絕不是完全否定一種理論、由另一種理論形式所代替.大數(shù)據(jù)時(shí)代的到來(lái)統(tǒng)計(jì)學(xué)理論必須要進(jìn)行不斷的完善和發(fā)展,以適應(yīng)呈指數(shù)增長(zhǎng)的數(shù)據(jù)量的大數(shù)據(jù)分析的需要.

3.3如何構(gòu)建大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn)框架

大數(shù)據(jù)時(shí)代下,統(tǒng)計(jì)分析評(píng)價(jià)的標(biāo)準(zhǔn)又該如何變化?傳統(tǒng)統(tǒng)計(jì)分析的評(píng)價(jià)標(biāo)準(zhǔn)有兩個(gè)方面,一是可靠性評(píng)價(jià),二是有效性評(píng)價(jià),然而這兩種評(píng)價(jià)標(biāo)準(zhǔn)都因抽樣而生.可靠性評(píng)價(jià)是指用樣本去推斷總體有多大的把握程度,一般用概率來(lái)衡量.可靠性評(píng)價(jià)有時(shí)表現(xiàn)為置信水平,有時(shí)表現(xiàn)為顯著性水平[8].怎么確定顯著性水平一直是個(gè)存在爭(zhēng)議的問(wèn)題,特別是在模型擬合度評(píng)價(jià)和假設(shè)檢驗(yàn)中,因?yàn)楦髯詤⒄盏姆植碱愋筒灰粯?其統(tǒng)計(jì)量就不一樣,顯著性評(píng)價(jià)的臨界值也就不一樣,可是臨界值又與顯著性水平的高低直接相關(guān).而大數(shù)據(jù)在一定程度上是全體數(shù)據(jù),因此不存在以樣本推斷總體的問(wèn)題,那么在這種情況下,置信水平、可靠性問(wèn)題怎么確定?依據(jù)是什么?有效性評(píng)價(jià)指的是真實(shí)性,即為誤差的大小,它與準(zhǔn)確性、精確性有關(guān).通常準(zhǔn)確性是指觀察值與真實(shí)值的吻合程度,一般是無(wú)法衡量的,而精確性用抽樣分布的標(biāo)準(zhǔn)差來(lái)衡量.顯然,精確性是針對(duì)樣本數(shù)據(jù)而言的,也就是說(shuō)樣本數(shù)據(jù)有精確性問(wèn)題,同時(shí)也有準(zhǔn)確性問(wèn)題.抽樣誤差和非抽樣誤差都可能存在于樣本數(shù)據(jù)中,抽樣誤差可以計(jì)算和控制,但是非抽樣誤差只能通過(guò)各種方式加以識(shí)別或判斷[910].大多數(shù)情況下,對(duì)于樣本量不是太大的樣本,非抽樣誤差可以得到較好的防范,然而對(duì)于大數(shù)據(jù)的全體數(shù)據(jù)而言,沒有抽樣誤差問(wèn)題,只有非抽樣誤差問(wèn)題,也就是說(shuō)大數(shù)據(jù)的真實(shí)性只表現(xiàn)為準(zhǔn)確性.但是由于大數(shù)據(jù)特有的種種特性,使得大數(shù)據(jù)的非抽樣誤差很難進(jìn)行防范、控制,也很難對(duì)其進(jìn)行準(zhǔn)確性評(píng)價(jià).總之,對(duì)于大數(shù)據(jù)分析來(lái)說(shuō),有些統(tǒng)計(jì)分析理論是否還有意義,確切說(shuō)有哪些統(tǒng)計(jì)學(xué)中的理論可以適用于大數(shù)據(jù)分析,而哪些統(tǒng)計(jì)學(xué)中的理論需要改進(jìn),哪些統(tǒng)計(jì)學(xué)中的理論已不再適用于大數(shù)據(jù)統(tǒng)計(jì)研究,等等,都有待于研究.所以大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)學(xué)必是在繼承中求改進(jìn),改進(jìn)中求發(fā)展,重構(gòu)適應(yīng)大數(shù)據(jù)時(shí)代的新統(tǒng)計(jì)學(xué)理論.

4結(jié)論

來(lái)自于社會(huì)各種數(shù)據(jù)源的數(shù)據(jù)量呈指數(shù)增長(zhǎng),大數(shù)據(jù)對(duì)社會(huì)發(fā)展的推動(dòng)力呈指數(shù)效應(yīng),大數(shù)據(jù)已是生命活動(dòng)的主要承載者.一個(gè)新事物的出現(xiàn),必然導(dǎo)致傳統(tǒng)觀念和傳統(tǒng)技術(shù)的變革.對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)來(lái)說(shuō),大數(shù)據(jù)時(shí)代的到來(lái)無(wú)疑是一個(gè)挑戰(zhàn),雖然傳統(tǒng)統(tǒng)計(jì)學(xué)必須做出改變,但是占據(jù)主導(dǎo)地位的依然會(huì)是統(tǒng)計(jì)學(xué),它會(huì)引領(lǐng)人類合理分析利用大數(shù)據(jù)資源.大數(shù)據(jù)給統(tǒng)計(jì)學(xué)帶來(lái)了機(jī)遇和挑戰(zhàn),統(tǒng)計(jì)學(xué)家們應(yīng)該積極學(xué)習(xí)新事物,適應(yīng)新環(huán)境,努力為大數(shù)據(jù)時(shí)代創(chuàng)造出新的統(tǒng)計(jì)方法,擴(kuò)大統(tǒng)計(jì)學(xué)的應(yīng)用范圍.

參考文獻(xiàn):

[1]陳冬玲,曾文.頻繁模式挖掘中基于CFP的應(yīng)用模型[J]沈陽(yáng)大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,27(4):296300.

[3]卞友江.“大數(shù)據(jù)”概念考辨[J].新聞研究導(dǎo)刊,2013,35(5):2528.

[5]靳小龍,王元卓,程學(xué)旗.大數(shù)據(jù)的研究體系與現(xiàn)狀[J].信息通信技術(shù),2013(6):3543.

[6]覃雄派,王會(huì)舉,杜小勇,等.大數(shù)據(jù)分析:Rdbms與Mapreduce的競(jìng)爭(zhēng)與共生[J].軟件學(xué)報(bào),2012,23(1):32-45.

[7]游士兵,張佩,姚雪梅.大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)和機(jī)遇[J].珞珈管理評(píng)論,2013(2):165171.

[8]李金昌.大數(shù)據(jù)與統(tǒng)計(jì)新思維[J].統(tǒng)計(jì)研究,2014,31(1):1017.

篇3

【關(guān)鍵詞】大數(shù)據(jù)分析;市場(chǎng)營(yíng)銷;影響

現(xiàn)階段信息技術(shù)已經(jīng)和我們的生活生產(chǎn)密切相關(guān),能夠進(jìn)一步改善我們的生活質(zhì)量,還能夠滿足我們對(duì)于物質(zhì)的實(shí)際需求。在互聯(lián)網(wǎng)不斷發(fā)展過(guò)程中,大數(shù)據(jù)已經(jīng)成為信息主要載體,在大數(shù)據(jù)分析時(shí)代,過(guò)去的市場(chǎng)營(yíng)銷模式受到了不小挑戰(zhàn),企業(yè)發(fā)展面臨重重阻礙,如何通過(guò)良好的營(yíng)銷活動(dòng)讓企業(yè)具備更高的綜合實(shí)力,這也是相關(guān)工作人員需要解決的問(wèn)題。

1大數(shù)據(jù)與市場(chǎng)營(yíng)銷的定義與特點(diǎn)

1.1大數(shù)據(jù)的定義與特點(diǎn)

大數(shù)據(jù)指的就是海量數(shù)據(jù)的集合,不能通過(guò)一般數(shù)據(jù)處理軟件在特定的時(shí)間和空間范圍內(nèi)對(duì)數(shù)據(jù)進(jìn)行處理、存儲(chǔ)和管理,只有通過(guò)更為先進(jìn)的處理方式才可以應(yīng)用大數(shù)據(jù)。現(xiàn)階段在應(yīng)用和理解大數(shù)據(jù)時(shí)往往徘徊于概念層面,并沒有提出更能滿足實(shí)際需求的應(yīng)用方案。大數(shù)據(jù)的特點(diǎn)包括快速增長(zhǎng),數(shù)據(jù)多且繁雜,而且需要靠特殊手段去甄別信息,在海量的信息中還包括大量垃圾信息,在對(duì)大數(shù)據(jù)進(jìn)行分析時(shí),一般是通過(guò)這些手段去篩選海量信息中的有用信息,剔除垃圾信息,這樣才能使數(shù)據(jù)全部結(jié)合,并通過(guò)數(shù)據(jù)信息表象得到定論,才能為之后的工作制定重要戰(zhàn)略基礎(chǔ)。

1.2市場(chǎng)營(yíng)銷的定義與特點(diǎn)

市場(chǎng)營(yíng)銷指的就是企業(yè)在進(jìn)行與生產(chǎn)、銷售相關(guān)的經(jīng)營(yíng)活動(dòng),而且分析數(shù)據(jù)、市場(chǎng)調(diào)查以及設(shè)計(jì)產(chǎn)品等也包括在市場(chǎng)營(yíng)銷范圍內(nèi),前期工作和后期工作都是幫市場(chǎng)做事,目的就是讓企業(yè)生產(chǎn)的產(chǎn)品能夠滿足市場(chǎng)需求,讓企業(yè)營(yíng)銷戰(zhàn)略能夠與時(shí)展相適應(yīng),為消費(fèi)者帶來(lái)更加滿意的產(chǎn)品。市場(chǎng)營(yíng)銷特點(diǎn)包括可調(diào)性、指導(dǎo)性、全局性、整體性等,需要考慮微觀層面和宏觀層面,還要按照時(shí)間的推移讓企業(yè)能夠適當(dāng)調(diào)整營(yíng)銷策略,滿足市場(chǎng)發(fā)展需求,通過(guò)市場(chǎng)營(yíng)銷能夠讓企業(yè)在內(nèi)部實(shí)現(xiàn)明確分工,并幫助企業(yè)和市場(chǎng)以及社會(huì)接軌。

2大數(shù)據(jù)分析時(shí)代下市場(chǎng)營(yíng)銷方式的轉(zhuǎn)變

2.1精準(zhǔn)化營(yíng)銷

在大數(shù)據(jù)分析,時(shí)代企業(yè)營(yíng)銷管理人員能夠借助瀏覽消費(fèi)者的網(wǎng)頁(yè)記錄,以及對(duì)于不同種類產(chǎn)品搜索以及購(gòu)買頻率能夠?qū)οM(fèi)者實(shí)際消費(fèi)水平進(jìn)行科學(xué)分析,這樣能夠真正明確消費(fèi)者的實(shí)際消費(fèi)習(xí)慣,可以充分掌握他們的消費(fèi)喜好,并在此基礎(chǔ)上對(duì)現(xiàn)有的營(yíng)銷方案進(jìn)行完善,能夠制定更有針對(duì)性的營(yíng)銷計(jì)劃。不僅如此數(shù)據(jù)分析人員能夠在精準(zhǔn)化營(yíng)銷中采集到更多商機(jī),并且為消費(fèi)者制定更有針對(duì)性的服務(wù),可以滿足消費(fèi)者多方面需求,使顧客對(duì)企業(yè)產(chǎn)品服務(wù)更加滿意,讓企業(yè)在社會(huì)上樹立良好形象。

2.2預(yù)測(cè)消費(fèi)行為

在應(yīng)用大數(shù)據(jù)分析技術(shù)的過(guò)程中,能夠讓企業(yè)營(yíng)銷管理人員對(duì)消費(fèi)者可能做出的消費(fèi)行為進(jìn)行分析,并且在內(nèi)部系統(tǒng)與外部系統(tǒng)中可以對(duì)消費(fèi)者可能轉(zhuǎn)變的消費(fèi)方向進(jìn)行預(yù)測(cè)。在內(nèi)部系統(tǒng)中記錄著消費(fèi)者的交易信息,而外部系統(tǒng)則是網(wǎng)頁(yè)搜索平臺(tái),要想讓市場(chǎng)營(yíng)銷活動(dòng)開展的更加順利,就離不開內(nèi)部、外部系統(tǒng)的支持。

2.3產(chǎn)品交叉銷售

現(xiàn)階段數(shù)據(jù)挖掘技術(shù)得到了大范圍應(yīng)用,能夠?qū)A繑?shù)據(jù)進(jìn)行有機(jī)整合,并且可以找到消費(fèi)者最經(jīng)常購(gòu)買的商品,按照消費(fèi)者特點(diǎn)為他們制定有針對(duì)性的營(yíng)銷策略,可以對(duì)現(xiàn)有的商品營(yíng)銷進(jìn)行調(diào)整,與促銷方式進(jìn)行結(jié)合,通過(guò)交叉銷售能夠讓企業(yè)在市場(chǎng)中獲得更多收益。

2.4處理客戶關(guān)系

通過(guò)大數(shù)據(jù)技術(shù)能夠在多種客戶關(guān)系中找到核心客戶,并且對(duì)客戶消費(fèi)數(shù)據(jù)進(jìn)行深度挖掘,這樣能夠?yàn)槟切┚哂袃r(jià)值的客戶帶來(lái)更為滿意的營(yíng)銷服務(wù),可以讓客戶對(duì)營(yíng)銷方式更加認(rèn)可,能夠幫助企業(yè)在市場(chǎng)中拓寬商品營(yíng)銷范圍,讓顧客對(duì)商品以及企業(yè)有更高的忠誠(chéng)度和信任度。

3大數(shù)據(jù)分析時(shí)代對(duì)市場(chǎng)營(yíng)銷的影響研究

3.1產(chǎn)品營(yíng)銷策略

不同的消費(fèi)者對(duì)于消費(fèi)需求也有所區(qū)別,因此企業(yè)在營(yíng)銷方式方面也要做出一定調(diào)整。在大數(shù)據(jù)分析時(shí)代,消費(fèi)者會(huì)通過(guò)網(wǎng)絡(luò)平臺(tái)瀏覽產(chǎn)品信息來(lái)實(shí)現(xiàn)購(gòu)買行為,對(duì)于那些更加青睞的信息會(huì)以數(shù)據(jù)形式展示給企業(yè)營(yíng)銷管理人員,這些工作人員可以對(duì)消費(fèi)者的瀏覽信息進(jìn)行深入研究,并且按照消費(fèi)者日常消費(fèi)傾向可以為他們提供更能滿足實(shí)際需求的產(chǎn)品,這種產(chǎn)品營(yíng)銷方式才是最精準(zhǔn)的營(yíng)銷,能夠真正實(shí)現(xiàn)個(gè)性化銷售。

3.2價(jià)格調(diào)整策略

在不同階段、不同時(shí)期,企業(yè)在進(jìn)行產(chǎn)品定價(jià)時(shí)也會(huì)有所差異,而且成本會(huì)對(duì)產(chǎn)品定價(jià)產(chǎn)生直接影響,更與市場(chǎng)營(yíng)銷方向息息相關(guān)。通過(guò)大數(shù)據(jù)分析技術(shù),可以讓消費(fèi)者對(duì)企業(yè)產(chǎn)品有更為全面、深入的了解,可以將消費(fèi)者對(duì)于產(chǎn)品購(gòu)買信息進(jìn)行收集,并且通過(guò)調(diào)整價(jià)格來(lái)讓消費(fèi)者對(duì)現(xiàn)有的價(jià)格更加滿意,能夠?qū)οM(fèi)者理想價(jià)格進(jìn)行預(yù)估,并制定最佳定價(jià)方案,不但能夠讓企業(yè)在產(chǎn)品投資回報(bào)率上有所提高,還能夠防止由于不合理定價(jià)導(dǎo)致客戶流失。

3.3模式更新策略

隨著互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,給市場(chǎng)營(yíng)銷模式帶來(lái)更多可能。之前的B2B、C2C模式已經(jīng)不能滿足企業(yè)對(duì)于未來(lái)發(fā)展的全部需求,因此在這樣的的背景下急需020消費(fèi)模式來(lái)取代之前的內(nèi)容,這樣能夠使企業(yè)實(shí)現(xiàn)雙線營(yíng)銷活動(dòng)。在大數(shù)據(jù)分析時(shí)代中,根據(jù)雙線營(yíng)銷模式來(lái)明確企業(yè)需要實(shí)現(xiàn)扇平化發(fā)展,對(duì)顧客進(jìn)行精準(zhǔn)營(yíng)銷,這樣才能規(guī)避營(yíng)銷風(fēng)險(xiǎn)。

篇4

關(guān)鍵詞:大數(shù)據(jù)時(shí)代;企業(yè)專利管理;問(wèn)題;應(yīng)對(duì)策略

大數(shù)據(jù)的出現(xiàn)改變了世界以及改變了人們生活當(dāng)中的方方面面,并且為生活創(chuàng)造更多維度,大數(shù)據(jù)技術(shù)對(duì)于企業(yè)的專利管理也具有一定積極的意義,將和專利有關(guān)的數(shù)據(jù)進(jìn)行搜集分析以及處理,可以促使企業(yè)專利管理更加完善以及企業(yè)決策更加科學(xué),實(shí)現(xiàn)企業(yè)專利保護(hù)以及產(chǎn)品開發(fā)相互促進(jìn),為企業(yè)開發(fā)、創(chuàng)新產(chǎn)品提供重要的保障以及支持。

1 大數(shù)據(jù)的概念

關(guān)于大數(shù)據(jù),當(dāng)前并沒有公認(rèn)定義,很多定義基本根據(jù)大數(shù)據(jù)特點(diǎn)進(jìn)行分析,通過(guò)對(duì)大數(shù)據(jù)特征闡述以及總結(jié),歸納出大數(shù)據(jù)的概念。大數(shù)據(jù)概念包括狹義概念以及廣義概念,其中,廣義大數(shù)據(jù)不但包含大數(shù)據(jù)的技術(shù)以及應(yīng)用,而且包含大數(shù)據(jù)科學(xué)以及大數(shù)據(jù)工程學(xué)等,并且可以進(jìn)一步劃分,分為大數(shù)據(jù)工程、大數(shù)據(jù)應(yīng)用、大數(shù)據(jù)科學(xué)以及大數(shù)據(jù)技術(shù)等多個(gè)領(lǐng)域。狹義大數(shù)據(jù)概念,主要指大數(shù)據(jù)技術(shù),就是從各種數(shù)據(jù)當(dāng)中獲取有效數(shù)據(jù)以及有信息,可以將大數(shù)據(jù)的特點(diǎn)總結(jié)為四點(diǎn):首先,規(guī)模性,主要是指大數(shù)據(jù)的數(shù)量特別大,可以達(dá)到TB的級(jí)別,有的甚至可以到達(dá)PB的數(shù)據(jù)級(jí)別。其次,多樣性,大數(shù)據(jù)種類以及形式多種多樣,并且來(lái)源于各種不同領(lǐng)域以及獲取途徑更不相同。再次,高速性,大數(shù)據(jù)需要高速及時(shí)性分析,有價(jià)值數(shù)據(jù)可能很快減少甚至完全消失。最后,真實(shí)性,大數(shù)據(jù)所反映的是真實(shí)的世界,并且這些數(shù)據(jù)都是真實(shí)的記錄,通過(guò)對(duì)大數(shù)據(jù)的研究以及分析,可以對(duì)未來(lái)事件進(jìn)行預(yù)測(cè),比如未來(lái)人們消費(fèi)習(xí)慣以及未來(lái)經(jīng)濟(jì)發(fā)展趨勢(shì)等。

2 大數(shù)據(jù)時(shí)代的企業(yè)專利管理特點(diǎn)

傳統(tǒng)思維之下,專利管理從屬于現(xiàn)代企業(yè)管理,并且是現(xiàn)代企業(yè)管理十分重要的一個(gè)部分,貫穿在產(chǎn)品開發(fā)、產(chǎn)品銷售以及科學(xué)創(chuàng)新等多個(gè)領(lǐng)域。在大數(shù)據(jù)的時(shí)代,專利管理主要是指將和專利相關(guān)的數(shù)據(jù)進(jìn)行搜集分析,并且融合專業(yè)管理的內(nèi)容。在企業(yè)管理人才、流程以及制度的依托之下,促使產(chǎn)品研發(fā)、研發(fā)創(chuàng)新、專利保護(hù)以及相關(guān)認(rèn)資訊等形成有機(jī)的互動(dòng),并且構(gòu)建出屬于企業(yè)的專利管理系統(tǒng),從而促使專利管理和數(shù)據(jù)管理相互結(jié)合。大數(shù)據(jù),本質(zhì)上屬于一種工具以及資源,也可以成為一種思維的方式,將其和企業(yè)的專利管理融合,從而有效激發(fā)有價(jià)值的服務(wù)以及管理方面的創(chuàng)新。不但可以提升企業(yè)中專利的地位,而且可以改善企業(yè)管理困境,在大數(shù)據(jù)的支持下,企業(yè)專利管理促使企業(yè)更好服務(wù)企業(yè)管理。

3 大數(shù)據(jù)時(shí)代的企業(yè)專利管理面臨的問(wèn)題與應(yīng)對(duì)策略

3.1 專利大數(shù)據(jù)搜集的問(wèn)題以及應(yīng)對(duì)策略

大數(shù)據(jù)搜集過(guò)程是對(duì)數(shù)據(jù)進(jìn)行保障以及提取。專利數(shù)據(jù)的量相對(duì)比較大,不但包括專利的文件數(shù)據(jù)等,而且包含其他的文獻(xiàn)資料,比如,市場(chǎng)資源資料、法律法規(guī)數(shù)據(jù)、人力資源資料等多種數(shù)據(jù),這些數(shù)據(jù)總量基本上都達(dá)到了TB的級(jí)別,部分體量可以達(dá)到PB的級(jí)別。專利數(shù)據(jù)來(lái)源比較廣泛,并且數(shù)據(jù)格式以及種類特別繁冗以及復(fù)雜,其中具有半結(jié)構(gòu)化、結(jié)構(gòu)化以及非結(jié)構(gòu)化的各種數(shù)據(jù)間形式,比如網(wǎng)絡(luò)博客、廣告、視頻、圖片、新聞、報(bào)告等多種類別。換句話說(shuō),和專利相關(guān)的數(shù)據(jù)種類多種多樣,部分?jǐn)?shù)據(jù)還比較難以獲取以及存在獲取的障礙等,大數(shù)據(jù)搜集的過(guò)程中需要克服以下的困難,第一,數(shù)據(jù)體量過(guò)大,難以搜集。第二,數(shù)據(jù)形式以及種類多種多樣。第三,數(shù)據(jù)多元化。只有克服以上三種困難,才能保障數(shù)據(jù)搜集的完整性、及時(shí)性以及準(zhǔn)確性。其中,企業(yè)的專利管理,可以根據(jù)專利檢索以及定制智能搜集的軟件實(shí)現(xiàn)數(shù)據(jù)搜集。此外,可以借助商業(yè)數(shù)據(jù)的提供商,將軟件搜集和人工搜集相互結(jié)合,從而有效應(yīng)用大數(shù)據(jù)搜集的困難。

3.2 專利大數(shù)據(jù)處理的問(wèn)題以及應(yīng)對(duì)的策略

專利數(shù)據(jù)存在數(shù)據(jù)來(lái)源廣、數(shù)據(jù)量大、數(shù)據(jù)分布廣泛、數(shù)據(jù)結(jié)構(gòu)復(fù)雜以及持續(xù)增長(zhǎng)等多種特點(diǎn),相比傳統(tǒng)的專利數(shù)據(jù),大數(shù)據(jù)這些特征導(dǎo)致數(shù)據(jù)處理存在一定的問(wèn)題。首先,數(shù)據(jù)異構(gòu)性,就是專利管理所依靠的數(shù)據(jù)不是分布在同一數(shù)據(jù)系統(tǒng)當(dāng)中,而且分布在多個(gè)不同數(shù)據(jù)系統(tǒng)之中,并且通常是以半結(jié)構(gòu)以及非結(jié)構(gòu)化的形式存在,難以通過(guò)簡(jiǎn)單的數(shù)據(jù)結(jié)構(gòu)加以標(biāo)識(shí),此外,傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)難以處理復(fù)雜數(shù)據(jù)結(jié)構(gòu)相關(guān)數(shù)據(jù)。其次,數(shù)據(jù)存在非完備性問(wèn)題,換句話說(shuō),在大數(shù)據(jù)的條件下的得到的數(shù)據(jù)包含很多錯(cuò)誤信息以及非完整性的信息,處理大數(shù)據(jù)以及分析大數(shù)據(jù)之前,應(yīng)當(dāng)對(duì)非完備性加以處理,之后才能對(duì)后續(xù)的數(shù)據(jù)加以分析處理,輸出具有價(jià)值性的數(shù)據(jù)。再次,有效性的問(wèn)題,數(shù)據(jù)量一般越大,進(jìn)行處理數(shù)據(jù)的過(guò)程就更長(zhǎng),數(shù)據(jù)的價(jià)值一般是隨著實(shí)踐推遲快速降低直到消失。因此,關(guān)于數(shù)據(jù)的處理應(yīng)當(dāng)是高效率、穩(wěn)定、智能化以及響應(yīng)性更快。最后,數(shù)據(jù)處理存在很多風(fēng)險(xiǎn)因素,應(yīng)當(dāng)保障安全性,企業(yè)通過(guò)分析處理模型以及處理之后的信息進(jìn)行專利管理決策,對(duì)于企業(yè)發(fā)展具有重要意義,在專利大數(shù)據(jù)分析處理過(guò)程應(yīng)當(dāng)切實(shí)保障數(shù)據(jù)的安全性,才能保障企業(yè)決策的準(zhǔn)確性以及可靠性。

4 結(jié)束語(yǔ)

大數(shù)據(jù)在企業(yè)專利管理當(dāng)中具有重要的作用,一方面大數(shù)據(jù)給企業(yè)專利管理帶來(lái)重大的機(jī)遇,另一方面大數(shù)據(jù)專利管理也存在一定的問(wèn)題,比如數(shù)據(jù)體量大、數(shù)據(jù)多樣化以及數(shù)據(jù)來(lái)源多元化等,給數(shù)據(jù)搜集處理工作帶來(lái)一定的麻煩,因此,應(yīng)當(dāng)優(yōu)化企業(yè)專利數(shù)據(jù)搜集、處理方面的問(wèn)題,并且保障數(shù)據(jù)搜集處理安全性。

參考文獻(xiàn)

[1]顧毓波.大數(shù)據(jù)時(shí)代企業(yè)專利管理面臨的問(wèn)題與應(yīng)對(duì)策略[J].知識(shí)產(chǎn)權(quán),2015,10:120-124.

[2]孫雪凌.大數(shù)據(jù)時(shí)代下高校論文信息化管理面臨的問(wèn)題及應(yīng)對(duì)策略[J].科技風(fēng),2015,24:236-238.

篇5

關(guān)鍵詞:大數(shù)據(jù);應(yīng)用;軌道交通

中圖分類號(hào):TP3;U23 文獻(xiàn)識(shí)別碼:A 文章編號(hào):1001-828X(2017)013-0-01

進(jìn)入新世紀(jì)以來(lái),隨著博客、微信、移動(dòng)設(shè)備以基于位置服務(wù)的LBS服務(wù)的新型信息方式的發(fā)展,數(shù)據(jù)的種類和數(shù)量正在以幾何級(jí)的速度增長(zhǎng)和積累,人們的生活已經(jīng)被各種各樣的數(shù)據(jù)包圍,大數(shù)據(jù)時(shí)代的到來(lái)給人們帶來(lái)了更多生活上的便利和行為習(xí)慣的改變。學(xué)術(shù)界、工業(yè)界、政府機(jī)構(gòu)早已對(duì)大數(shù)據(jù)開始了各種研究。然而大數(shù)據(jù)的火熱并不意味著對(duì)大數(shù)據(jù)的深刻理解,反而可能影響了大數(shù)據(jù)的真正含義的理解。

一、大數(shù)據(jù)的基本概念

大數(shù)據(jù)本身的概念比較抽象,但有一點(diǎn)是確定的,即他表示數(shù)據(jù)的規(guī)模龐大,但是僅從數(shù)量上難以區(qū)分與海量數(shù)據(jù)(massive data)、超大規(guī)模數(shù)據(jù)(very large data)的差別,大數(shù)據(jù)目前的定義并沒有一個(gè)公認(rèn)的說(shuō)法,但從不同的定義中可以歸納試圖給出定義,而最有代表性的要數(shù)3V定義。即認(rèn)為大數(shù)據(jù)需滿足三個(gè)特點(diǎn):規(guī)模性(volume)、多樣性(variety)、和高速性(velocity).對(duì)于提出4V定義的有國(guó)際數(shù)據(jù)公司的價(jià)值性(value)和IBM認(rèn)為的實(shí)用性(veracity)。維基百科對(duì)大數(shù)據(jù)的定義則更簡(jiǎn)單明了:Big data is a term for data sets that are so large or complex that traditional data processing application software is inadequate to deal with them. 大數(shù)據(jù)時(shí)指利用常用軟件應(yīng)用工具已經(jīng)不能夠處理的龐大且復(fù)雜的數(shù)據(jù)集。

作者認(rèn)為,大數(shù)據(jù)的概念不必拘泥于某一個(gè),在面對(duì)實(shí)際問(wèn)題時(shí),把握4V(規(guī)模性、多樣性、高速性、價(jià)值性)特點(diǎn)的基礎(chǔ)上適當(dāng)?shù)目紤]數(shù)據(jù)處理的可容忍時(shí)間即可。

二、軌道交通企業(yè)大數(shù)據(jù)特點(diǎn)

軌道交通領(lǐng)域涉及專業(yè)多而廣,其中土木、車輛、機(jī)電、供電、維保、通信、信號(hào)、環(huán)控、AFC等,這些專業(yè)通過(guò)人工或自動(dòng)傳輸?shù)确绞讲杉a(chǎn)生的數(shù)據(jù)數(shù)以百萬(wàn)計(jì),應(yīng)用大數(shù)據(jù)處理技術(shù),深入探索軌道交通系統(tǒng)的運(yùn)行規(guī)律,對(duì)于提升軌道交通的運(yùn)營(yíng)服務(wù)質(zhì)量和水平有著重要的理論指導(dǎo)意義和實(shí)踐管理作用。

1.數(shù)據(jù)種類

根據(jù)軌道交通企業(yè)數(shù)據(jù)產(chǎn)生的來(lái)源,將大數(shù)據(jù)分為內(nèi)部大數(shù)據(jù)和外部大數(shù)據(jù)。內(nèi)部數(shù)據(jù)包括客流數(shù)據(jù)、各類型設(shè)備反饋的數(shù)據(jù)、物資材料消耗數(shù)據(jù)、內(nèi)部管理數(shù)據(jù)(財(cái)務(wù)、人力、效率數(shù)據(jù));外部數(shù)據(jù)包括天氣數(shù)據(jù)、大型活動(dòng)數(shù)據(jù)、其他相關(guān)公共數(shù)據(jù)等。按照數(shù)據(jù)的產(chǎn)生的過(guò)程分為直接數(shù)據(jù)和間接數(shù)據(jù)。大數(shù)據(jù)研究的基本都是直接數(shù)據(jù),對(duì)直接數(shù)據(jù)加工處理產(chǎn)生的間接數(shù)據(jù),根據(jù)其家公的程度來(lái)確定該數(shù)據(jù)是否還需再處理。亦或是用來(lái)指導(dǎo)管理決策。

2.數(shù)據(jù)特點(diǎn)

(1)數(shù)據(jù)動(dòng)態(tài)性強(qiáng)

以重慶軌道交通開收班時(shí)間計(jì)算,軌道交通系統(tǒng)每天運(yùn)轉(zhuǎn)將近17個(gè)小時(shí),在運(yùn)行的這段時(shí)間各種數(shù)據(jù)時(shí)刻變化,且各數(shù)據(jù)動(dòng)態(tài)性強(qiáng)、隨機(jī)性強(qiáng)、個(gè)體間差異明顯,變化粒度多樣,各數(shù)據(jù)間相互聯(lián)系,每一個(gè)數(shù)據(jù)的變化都可能帶來(lái)其他方面的影響或變化。

(2)數(shù)據(jù)關(guān)聯(lián)性強(qiáng)

在列車晚間進(jìn)站到早班發(fā)車的間隔時(shí)間內(nèi),相關(guān)的其他工作維保、公務(wù)、供電、道岔、橋隧等檢修工作也差生這各種不同的數(shù)據(jù),而這些數(shù)據(jù)將直接影響著第二天軌道交通系統(tǒng)的運(yùn)轉(zhuǎn)情況。

(3)數(shù)據(jù)分布呈現(xiàn)廣泛的異構(gòu)性

首先數(shù)據(jù)來(lái)源廣泛,軌道交通系統(tǒng)涉獵專業(yè)繁多,業(yè)務(wù)復(fù)雜,每個(gè)部門都產(chǎn)生這各種各樣的數(shù)據(jù);其次,數(shù)據(jù)種類繁多,非結(jié)構(gòu)化數(shù)據(jù)占比較大;再次,數(shù)據(jù)產(chǎn)生方式多樣,隨著移動(dòng)終端的快速發(fā)展,數(shù)據(jù)的產(chǎn)生模式也由被動(dòng)提取轉(zhuǎn)變?yōu)橹鲃?dòng)產(chǎn)生進(jìn)而發(fā)展為自動(dòng)發(fā)送、上傳的模式。

(4)數(shù)據(jù)規(guī)律性強(qiáng)

軌道交通系統(tǒng)每天能夠正常運(yùn)轉(zhuǎn)主要依賴于完善的工作計(jì)劃,如列車運(yùn)行計(jì)劃、人員排班計(jì)劃、列車檢修計(jì)劃、客流組織計(jì)劃、設(shè)備設(shè)施巡檢、檢修計(jì)劃等,而完美的計(jì)劃需要依賴于對(duì)數(shù)據(jù)規(guī)律的掌握。

(5)數(shù)據(jù)的安全保密性要求高

作為支撐企業(yè)長(zhǎng)久發(fā)展的核心信息,如新技術(shù)的研發(fā)、外來(lái)技術(shù)的國(guó)產(chǎn)化、核心技術(shù)、核心指標(biāo)、管理方法的創(chuàng)新、安全技術(shù)的應(yīng)用、盈利模式的創(chuàng)新、關(guān)鍵的財(cái)務(wù)數(shù)據(jù)等都需要較高的保密性。

三、軌道交通企業(yè)的大數(shù)據(jù)應(yīng)用挑戰(zhàn)

1.數(shù)據(jù)集成挑戰(zhàn)

軌道交通數(shù)據(jù)的采集方式的多樣性和數(shù)據(jù)類型的多樣性使得數(shù)據(jù)集成成為大數(shù)據(jù)應(yīng)用面臨的巨大挑戰(zhàn)。首先數(shù)據(jù)得廣泛異構(gòu)性表現(xiàn)在數(shù)據(jù)類型從結(jié)構(gòu)化數(shù)據(jù)為主轉(zhuǎn)向結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化,其次數(shù)據(jù)采集方式的多樣性體現(xiàn)在傳統(tǒng)固定設(shè)備的數(shù)據(jù)轉(zhuǎn)向移動(dòng)設(shè)備的快速變動(dòng)數(shù)據(jù),且產(chǎn)生的數(shù)據(jù)呈爆炸式增長(zhǎng),并有著明顯的時(shí)空特性。不同類型、不同方式、不同緯度的各種數(shù)據(jù)形成的大數(shù)據(jù)需要新的集成方法才能發(fā)揮其大數(shù)據(jù)的作用。

2.數(shù)據(jù)清洗挑戰(zhàn)

數(shù)據(jù)量巨大并不代表數(shù)據(jù)的價(jià)值大,數(shù)據(jù)量的增加導(dǎo)致數(shù)據(jù)質(zhì)量低劣,噪聲增多,反而會(huì)影響有用數(shù)據(jù)的篩選和使用。一方面很難由單個(gè)幾系統(tǒng)容納下不同數(shù)據(jù)源集成的海量數(shù)據(jù),另一方面數(shù)據(jù)集成并不是簡(jiǎn)單的將數(shù)據(jù)聚集在一起而不作任何清洗,這樣有用數(shù)據(jù)就會(huì)被大量的干擾數(shù)據(jù)淹沒。大數(shù)據(jù)時(shí)代的數(shù)據(jù)清洗需要更加謹(jǐn)慎,因?yàn)橛邢薜摹⒓?xì)微的有用信息需要從巨量的數(shù)據(jù)中清洗出來(lái),如果清洗粒度選擇不合適,或大或小,都將無(wú)法達(dá)到真正的清洗效果。

3.數(shù)據(jù)解釋挑戰(zhàn)

數(shù)據(jù)解釋旨在更好的呈現(xiàn)大數(shù)據(jù)的分析結(jié)果,不恰當(dāng)?shù)慕忉尫椒赡軐?dǎo)致解釋結(jié)果晦澀,難以理解。然而傳統(tǒng)的數(shù)據(jù)解釋方式并不能應(yīng)對(duì)大數(shù)據(jù)的分析結(jié)果,尤其是在面對(duì)類型復(fù)雜、數(shù)量巨大的軌道交通企業(yè)大數(shù)據(jù)時(shí)更為如此,外部的大數(shù)據(jù)與內(nèi)部的管理數(shù)據(jù)以何種技術(shù)呈現(xiàn)解釋結(jié)果,需要提出全新的大數(shù)據(jù)解釋方式。云計(jì)算的發(fā)展為大數(shù)據(jù)的應(yīng)用奠定了基礎(chǔ),但是對(duì)于大數(shù)據(jù)去粗取精、內(nèi)外數(shù)據(jù)互聯(lián)融通的過(guò)程,云計(jì)算猶如大海撈針,仍顯得無(wú)力。

四、軌道交通企業(yè)大數(shù)據(jù)應(yīng)用現(xiàn)狀

目前軌道交通系統(tǒng)對(duì)大數(shù)據(jù)的應(yīng)用都尚處于起步階段,查詢知網(wǎng)數(shù)據(jù)庫(kù),也發(fā)現(xiàn)目前的研究應(yīng)用較少,在少有的應(yīng)用中主要提及的是地鐵耗能仿真和節(jié)能操縱研究、地鐵乘務(wù)技術(shù)管理、車在信號(hào)設(shè)備主動(dòng)維護(hù)研究、地鐵票制創(chuàng)新、地鐵車輛牽引系統(tǒng)故障診斷等,從以上文獻(xiàn)不難發(fā)現(xiàn),行業(yè)內(nèi)真正的大數(shù)據(jù)研究應(yīng)用還很缺乏,這些數(shù)據(jù)仍處于專項(xiàng)數(shù)據(jù)的集成處理研究,數(shù)據(jù)尚不夠“大”,對(duì)于管理決策的支撐研究也很少。

五、結(jié)語(yǔ)

本文通過(guò)大數(shù)據(jù)概念,結(jié)合軌道交通行業(yè)目前的數(shù)據(jù)特點(diǎn)、應(yīng)用挑戰(zhàn)及應(yīng)用現(xiàn)狀提出簡(jiǎn)單的分析,希望助力于大數(shù)據(jù)在軌道交通行業(yè)的深入、廣泛、恰當(dāng)?shù)膽?yīng)用,促進(jìn)大數(shù)據(jù)的良性發(fā)展。

⒖嘉南祝

[1]維基百科:大數(shù)據(jù).(2017-5-22)https:///wiki/Big_data

篇6

關(guān)鍵詞:大數(shù)據(jù);科技查新;多元化發(fā)展;服務(wù)模式

中圖分類號(hào):G354 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2017)09-0211-02

進(jìn)入2l世紀(jì)以來(lái),隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,數(shù)據(jù)存儲(chǔ)的方式發(fā)生了很大的改變,我們可以從世界各個(gè)角落的計(jì)算機(jī)上獲得越來(lái)越多的數(shù)據(jù),數(shù)據(jù)信息量從逐步從TB走向PB、EB,人類進(jìn)入了真正的大數(shù)據(jù)時(shí)代。在大數(shù)據(jù)的環(huán)境下,科技查新工作服務(wù)模式也需要做出相應(yīng)的改變,需從以往單一的服務(wù)模式向多元化發(fā)展,通過(guò)完善、合理的科技查新工作服務(wù)模式,更加高效、準(zhǔn)確地對(duì)信息進(jìn)行獲取和加工整理,為政府、企業(yè)及相關(guān)單位提供更加多元化的服務(wù)。該文以天津市科技信息研究所科技查新工作現(xiàn)狀為例,探討大數(shù)據(jù)環(huán)境下科技查新服務(wù)的多元化發(fā)展。

1 大數(shù)據(jù)的定義及特點(diǎn)

現(xiàn)在的社會(huì)處于科技高速發(fā)展時(shí)期,信息流通迅速,人們之間的交流越來(lái)越密切,生活也越來(lái)越方便,大數(shù)據(jù)就是這個(gè)高科技時(shí)代應(yīng)運(yùn)而生的產(chǎn)物。

什么是大數(shù)據(jù)?對(duì)于“大數(shù)據(jù)”(Big data)的概念,研究機(jī)構(gòu)Gartner給出了這樣的定義:“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)[1]。所謂大數(shù)據(jù)就是巨量資料、巨量信息,它最顯著的特點(diǎn)是:數(shù)據(jù)體量巨大,類型繁多,非結(jié)構(gòu)化數(shù)據(jù)越來(lái)越多;數(shù)據(jù)價(jià)值密度越來(lái)越低,價(jià)值提純難度加大;動(dòng)態(tài)數(shù)據(jù)越來(lái)越多,數(shù)據(jù)處理速度難度加大。所謂大數(shù)據(jù)技術(shù),可從大數(shù)據(jù)抽取與集成、大數(shù)據(jù)存儲(chǔ)、大數(shù)據(jù)挖掘與分析、大數(shù)據(jù)解釋與展示四個(gè)方面來(lái)表征。其中,大數(shù)據(jù)挖掘與分析是整個(gè)大數(shù)據(jù)處理流程的核心,也就是將先進(jìn)分析技術(shù)應(yīng)用于大數(shù)據(jù),如:高級(jí)分析技術(shù)、可視化發(fā)現(xiàn)技術(shù)等都將是大數(shù)據(jù)分析領(lǐng)域的關(guān)鍵技術(shù)[2]。

目前在商業(yè)智能、政府決策、公共服務(wù)等領(lǐng)域大數(shù)據(jù)得到高度重視和應(yīng)用。科技情報(bào)和信息服務(wù)作為公共服務(wù)的組成部分,充分利用大數(shù)據(jù)將會(huì)極大促進(jìn)信息服務(wù)工作的發(fā)展,為經(jīng)濟(jì)發(fā)展提供有力支撐。

2 科技查新服務(wù)的定義和作用

科技查新是指具有查新業(yè)務(wù)資質(zhì)的查新機(jī)構(gòu)對(duì)查新委托人提供的需要查證其新穎性的科學(xué)技術(shù)內(nèi)容,按照《科技查新規(guī)范》,對(duì)科技文獻(xiàn)資源進(jìn)行科學(xué)、系統(tǒng)地檢索,運(yùn)用對(duì)比、綜合分析等方法做出客觀的結(jié)論[3]。它是隨著我國(guó)科技體制改革應(yīng)運(yùn)而生的具有中國(guó)特色的新型科技信息服務(wù),為科學(xué)研究課題立項(xiàng)及科研成果的鑒定、評(píng)估、驗(yàn)收、轉(zhuǎn)化、獎(jiǎng)勵(lì)等提供客觀依據(jù),提高科技管理與決策的科學(xué)化和規(guī)范化,保證科技項(xiàng)目的立項(xiàng)、科技成果的鑒定、評(píng)獎(jiǎng)等工作的新穎性、科學(xué)性、客觀公正性和準(zhǔn)確性。

雖然查新服務(wù)查新為企業(yè)的科研立項(xiàng)、成果鑒定等方面提供了一定的依據(jù),其作用也得到科技管理部門和專家評(píng)審的肯定,但從信息角度來(lái)說(shuō),目前的科技查新工作還主要是以專業(yè)數(shù)據(jù)庫(kù)為基礎(chǔ),以手工檢索和計(jì)算機(jī)檢索為手段,以檢出的文獻(xiàn)結(jié)果為依據(jù),通過(guò)信息查詢對(duì)文進(jìn)行整理和對(duì)比,對(duì)數(shù)據(jù)的加工和使用還處于初級(jí)階段。而在當(dāng)今“信息大爆炸”的時(shí)代,大數(shù)據(jù)環(huán)境下的科技查新服務(wù)需要向多元化發(fā)展,提升服務(wù)內(nèi)容,建立多元化的服務(wù)模式,需要從最基礎(chǔ)的科技查新服務(wù)不斷擴(kuò)展向競(jìng)爭(zhēng)情報(bào)服務(wù)、知R產(chǎn)權(quán)服務(wù)、企業(yè)創(chuàng)新戰(zhàn)略服務(wù)轉(zhuǎn)型,要通過(guò)信息資源建設(shè)、查新復(fù)合型人才培養(yǎng)、管理制度創(chuàng)新等方面,建立知識(shí)型服務(wù)促進(jìn)發(fā)展創(chuàng)新的工作機(jī)制。

3 大數(shù)據(jù)環(huán)境下科技查新服務(wù)面臨的問(wèn)題與挑戰(zhàn)

大數(shù)據(jù)時(shí)代下科技查新服務(wù)的特點(diǎn)也悄然發(fā)生了變化,具體表現(xiàn)為:數(shù)據(jù)資源更加豐富、寬泛,科技查新更顯必要;數(shù)據(jù)呈現(xiàn)出動(dòng)態(tài)化、類型多、價(jià)值低的特點(diǎn),增加了科技查新難度,因此對(duì)查新員的綜合素質(zhì)、對(duì)信息技術(shù)的掌握提出了要求更高;對(duì)數(shù)據(jù)資源的有效利用和開發(fā)是提高查新質(zhì)量和效率的關(guān)鍵。相對(duì)于豐富的大數(shù)據(jù),科技查新服務(wù)面臨著諸多的問(wèn)題:(1)數(shù)據(jù)資源重復(fù)建設(shè),開發(fā)與共享不足,各部門、單位系統(tǒng)兼容性較差,瀏覽器和數(shù)據(jù)格式不統(tǒng)一等均嚴(yán)重制約著資源共享;(2)針對(duì)查新項(xiàng)目數(shù)據(jù)和信息的提純加工、快速處理,查新工作人員的專業(yè)和職業(yè)素質(zhì)還有待提升;(3)信息的海量化,使科技查新的工作難度加大,規(guī)范有待嚴(yán)格,激勵(lì)機(jī)制有待完善;(4)借助大數(shù)據(jù)優(yōu)勢(shì),科技查新服務(wù)模式有待進(jìn)一步創(chuàng)新發(fā)展;(5)在信息爆炸的時(shí)代,還需加強(qiáng)科技查新機(jī)構(gòu)與科研創(chuàng)新人員的溝通,精準(zhǔn)地把握有用資源,減少無(wú)用功。

天津市科學(xué)技術(shù)信息研究所查新檢索中心成立于上世紀(jì)80年代,是全國(guó)首批十三家獲得國(guó)家級(jí)科技查新資質(zhì)的服務(wù)機(jī)構(gòu)之一,自科技查新工作開展以來(lái)發(fā)展至今已有30多年,以往的業(yè)務(wù)主要包括科技查新服務(wù)、定題檢索和文獻(xiàn)服務(wù)、科技翻譯服務(wù)等,現(xiàn)在順應(yīng)時(shí)代的發(fā)展逐漸開展了知識(shí)產(chǎn)權(quán)服務(wù)、競(jìng)爭(zhēng)情報(bào)服務(wù)等。天津市科學(xué)技術(shù)信息研究所查新檢索中心近5年的科技查新數(shù)量年均3000余項(xiàng),涵蓋項(xiàng)目立項(xiàng)查新、成果鑒定查新、專利查新、新產(chǎn)品查新、申報(bào)獎(jiǎng)勵(lì)、文獻(xiàn)查證等,獲得了用戶的好評(píng),在業(yè)內(nèi)具有良好的信譽(yù)和口碑。但不得不承認(rèn),我們目前的工作大多仍然停留在被動(dòng)的服務(wù)模式階段,主要還是等待用戶上門和行政干預(yù),缺乏主動(dòng)宣傳和推送服務(wù);定題或動(dòng)態(tài)跟蹤服務(wù)模式也缺乏創(chuàng)新性和吸引力,沒有充分發(fā)揮科技查新的人員和資源優(yōu)勢(shì),為廣大用戶提供多元化、個(gè)性化的服務(wù);沒有把查新機(jī)構(gòu)與用戶有機(jī)地結(jié)合起來(lái)并主動(dòng)參與到競(jìng)爭(zhēng)信息情報(bào)的發(fā)展中去,沒有深挖新時(shí)代下科技查新服務(wù)的潛能,這是對(duì)自身優(yōu)勢(shì)和大數(shù)據(jù)的資源浪費(fèi)。

雖然目前我們也在原來(lái)業(yè)務(wù)的基礎(chǔ)上,開展了知識(shí)產(chǎn)權(quán)服務(wù)、競(jìng)爭(zhēng)情報(bào)服務(wù)等業(yè)務(wù),不斷地摸索服務(wù)的形式,但就效果來(lái)看沒有達(dá)到預(yù)期的目標(biāo)。科技查新機(jī)構(gòu)必須與時(shí)俱進(jìn),不斷嘗試基于大數(shù)據(jù)、云服務(wù)理念,規(guī)劃未來(lái)架構(gòu),利用大數(shù)據(jù),管理、挖掘海量龐雜信息,加大為企業(yè)尤其是信息相對(duì)匱乏的中小企業(yè)服務(wù)的深度和廣度。應(yīng)充分利用大數(shù)據(jù)資源優(yōu)勢(shì),抓住機(jī)會(huì)拓展創(chuàng)新,提升知識(shí)挖掘潛能,調(diào)整信息服務(wù)策略,在科技查新基礎(chǔ)上,完善整合服務(wù)技能,實(shí)現(xiàn)主動(dòng)式多元化服務(wù)方式。

4 大數(shù)據(jù)環(huán)境下科技查新服務(wù)的多元化服務(wù)模式

4.1 競(jìng)爭(zhēng)情報(bào)服務(wù)

針對(duì)大數(shù)據(jù)所具有的創(chuàng)新特征,科技查新應(yīng)逐步向競(jìng)爭(zhēng)情報(bào)服務(wù)過(guò)渡、融合,并實(shí)施創(chuàng)新戰(zhàn)略服務(wù)。如何高效、準(zhǔn)確地從互聯(lián)網(wǎng)的海量信息中獲取和跟蹤特定信息,是開展競(jìng)爭(zhēng)情報(bào)服務(wù)工作首先需要解決的問(wèn)題。通過(guò)引進(jìn)智能競(jìng)爭(zhēng)情報(bào)系統(tǒng)(CIS),采用自動(dòng)信息采集工具對(duì)相關(guān)信息進(jìn)行定期采集、監(jiān)測(cè)和跟蹤,自動(dòng)按不同主題進(jìn)行分類,形成專業(yè)信息庫(kù),可以有效解決上述問(wèn)題。同時(shí)科技查新服務(wù)機(jī)構(gòu)還可根據(jù)自身信息源豐富的優(yōu)勢(shì),收集、整理各類紙質(zhì)載體信息、電子信息,利用相應(yīng)的數(shù)據(jù)分析方法及工具進(jìn)行深入信息挖掘與加工整理,形成專題研究集和專題信息資源庫(kù),為競(jìng)爭(zhēng)情報(bào)服務(wù)提供更多信息基礎(chǔ),并與用戶的情報(bào)需求進(jìn)行有效對(duì)接。在開展競(jìng)爭(zhēng)情報(bào)服務(wù)時(shí),科技查新機(jī)構(gòu)亦可針對(duì)中小企業(yè)技術(shù)創(chuàng)新能力不足、技術(shù)資源匱乏等問(wèn)題,創(chuàng)新服務(wù)方式,收集企業(yè)研發(fā)領(lǐng)域的先進(jìn)技術(shù)、知識(shí)產(chǎn)權(quán)、競(jìng)爭(zhēng)對(duì)手情況、市場(chǎng)情報(bào),并追蹤最新技術(shù)發(fā)展動(dòng)向,為企業(yè)開展戰(zhàn)略研究服務(wù),幫助中小企業(yè)開拓研發(fā)思路,提高研究水平,降低研發(fā)風(fēng)險(xiǎn)。

4.2 知識(shí)產(chǎn)權(quán)服務(wù)

拓展專利權(quán)、商標(biāo)權(quán)、著作權(quán)的知識(shí)產(chǎn)權(quán)檢索服務(wù),幫助企業(yè)規(guī)避產(chǎn)品技術(shù)的侵權(quán)風(fēng)險(xiǎn)。現(xiàn)在國(guó)人越來(lái)越能意識(shí)到知識(shí)產(chǎn)權(quán)的價(jià)值,我國(guó)的專利受理量也在逐年上升。由于實(shí)用新型專利與外觀設(shè)計(jì)專利授權(quán)均不進(jìn)行實(shí)質(zhì)性審查,而發(fā)明專利授予中的實(shí)質(zhì)審查由于檢索數(shù)據(jù)資料和審查員自身的業(yè)務(wù)水平也難免會(huì)產(chǎn)生疏漏和偏差,因此,企業(yè)在生產(chǎn)經(jīng)營(yíng)中實(shí)施新技術(shù)、新產(chǎn)品創(chuàng)新活動(dòng)可能會(huì)遭遇到專利侵權(quán)糾紛。針對(duì)這種情況,查新機(jī)構(gòu)應(yīng)盡快開展企業(yè)專利侵權(quán)訴訟檢索服務(wù),對(duì)其相關(guān)專利的有效性進(jìn)行分析評(píng)價(jià),維護(hù)其合法權(quán)益,為企業(yè)減輕侵權(quán)損失或避免侵權(quán)風(fēng)險(xiǎn)。將知識(shí)產(chǎn)權(quán)侵權(quán)查新作為風(fēng)險(xiǎn)監(jiān)控、預(yù)警和規(guī)避的有效手段,成為企業(yè)知識(shí)產(chǎn)權(quán)戰(zhàn)略發(fā)展中必要且重要的環(huán)節(jié)。

4.3 企業(yè)創(chuàng)新戰(zhàn)略服務(wù)

提供基于大數(shù)據(jù)的科技創(chuàng)新知識(shí)服務(wù),可為企業(yè)量身定制專業(yè)數(shù)據(jù)庫(kù)。在大數(shù)據(jù)時(shí)代,企業(yè)為了能快捷地獲取創(chuàng)新技術(shù)或產(chǎn)品等相關(guān)信息,對(duì)其R盜煊虻奈南仔畔⒓燜鰲⑶楸ǘ態(tài)跟蹤有很大的需求。查新機(jī)構(gòu)可根據(jù)企業(yè)用戶的實(shí)際需求,利用分布式數(shù)據(jù)庫(kù)、云存儲(chǔ)等大數(shù)據(jù)技術(shù),對(duì)大數(shù)據(jù)中的核心數(shù)據(jù)資源進(jìn)行集成整合和挖掘,形成適用于科技文獻(xiàn)資源的元數(shù)據(jù)倉(cāng)儲(chǔ),將企業(yè)用戶、管理、資源、技術(shù)、知識(shí)、能力和過(guò)程各大元素進(jìn)行有機(jī)結(jié)合和優(yōu)化,提供基于大數(shù)據(jù)的科技創(chuàng)新知識(shí),服務(wù)于企業(yè)科技創(chuàng)新全生命周期活動(dòng)。利用查新機(jī)構(gòu)擁有的抓取系統(tǒng)和文本挖掘系統(tǒng),主動(dòng)、有針對(duì)性地向企業(yè)推送相關(guān)知識(shí)和最新技術(shù)經(jīng)濟(jì)訊息,使其及時(shí)了解行業(yè)的最新發(fā)展動(dòng)向、研發(fā)態(tài)勢(shì)及相關(guān)產(chǎn)業(yè)政策,有效縮短企業(yè)的創(chuàng)新過(guò)程。

4.4 信息推送服務(wù)

信息的加工和整理是科技查新機(jī)構(gòu)的主體工作,信息的方式也逐漸從被動(dòng)的索取到主動(dòng)的推送過(guò)度。未來(lái)服務(wù)模式的重點(diǎn)是怎樣更好地將信息服務(wù)推送出去,以滿足不同客戶的需求。當(dāng)客戶提出某一服務(wù)需求后,在后臺(tái)進(jìn)行整理加工后,可以將客戶所需的情報(bào)信息內(nèi)容推送到客戶端。大數(shù)據(jù)環(huán)境下,可以通過(guò)模糊查詢實(shí)現(xiàn)客戶的信息需求預(yù)測(cè),例如當(dāng)客戶進(jìn)行某些資料或文獻(xiàn)的檢索查詢時(shí),可將客戶搜索的范圍和輸入的關(guān)鍵詞、主題詞進(jìn)行智能整合和分析,從而辨別、預(yù)測(cè)出客戶可能感興趣和需要的數(shù)據(jù)信息,為查新機(jī)構(gòu)進(jìn)行數(shù)據(jù)采集、資源更新提供可靠依據(jù),主動(dòng)向用戶推送信息資源,最終達(dá)到超前服務(wù)客戶、滿足客戶需求的效果,提高科技情報(bào)機(jī)構(gòu)的服務(wù)能力和社會(huì)效益。大數(shù)據(jù)環(huán)境下的數(shù)據(jù)無(wú)限擴(kuò)展,會(huì)讓很多客戶對(duì)海量信息的搜索無(wú)從下手,花費(fèi)了很大的力量可能獲取的都是無(wú)用的網(wǎng)絡(luò)信息,通過(guò)查新機(jī)構(gòu)的專業(yè)服務(wù)可以幫助客戶迅速便捷地找尋到所需的有價(jià)值信息,可大大降低人工成本和時(shí)間成本,并為后續(xù)繼續(xù)開展各項(xiàng)深度服務(wù)提供了可能,真正實(shí)現(xiàn)“以用戶為中心的服務(wù)理念”的服務(wù)模式。

在大數(shù)據(jù)時(shí)代下,科學(xué)技術(shù)飛速發(fā)展對(duì)科技查新工作提出了更高的要求,查新機(jī)構(gòu)和查新員不能局限與以往的工作模式,我們必須正確面對(duì)諸多挑戰(zhàn),積極推進(jìn)查新資源的開發(fā)與共享,強(qiáng)化隊(duì)伍建設(shè),規(guī)范查新制度,完善激勵(lì)機(jī)制,創(chuàng)新服務(wù)模式,加強(qiáng)與客戶的溝通與交流,保證查新質(zhì)量,提高業(yè)務(wù)水平,增強(qiáng)科技創(chuàng)新能力,為創(chuàng)新型國(guó)家的建設(shè)做出貢獻(xiàn)。

參考文獻(xiàn)

[1]劉高勇,汪會(huì)玲,吳金紅.大數(shù)據(jù)時(shí)代的競(jìng)爭(zhēng)情報(bào)發(fā)展動(dòng)向探析[J].圖書情報(bào)知識(shí),2013(2):105-111.

[2]RUSSOM P.Big data analytics[R]. [s.1]:TDWI Best Practices Report,2011.

[3]謝新洲,滕躍.科技查新手冊(cè)[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2004.

[4]梅杰,楊劍,康磊,楊輝.大數(shù)據(jù)環(huán)境下科技查新工作服務(wù)模式探究[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2015,25(18):132-134.

篇7

信息化大體上分成三個(gè)階段。20世紀(jì)90年代中期以前為信息化1.0階段,這個(gè)階段最顯著的特征是以單機(jī)應(yīng)用為特征的數(shù)字化階段。此后一直到現(xiàn)在為信息化2.0階段,它的主要特征是以聯(lián)網(wǎng)應(yīng)用為特征的一個(gè)網(wǎng)絡(luò)階段。而信息化3.0階段開始于我們這個(gè)時(shí)代,它的特征是以數(shù)據(jù)的深度挖掘和融合應(yīng)用為特征的一個(gè)智慧化階段。未來(lái)還有沒有新的階段?我認(rèn)為,信息化3.0這個(gè)階段持續(xù)20年也是有可能的。

定義大數(shù)據(jù)

大數(shù)據(jù)是什么?大數(shù)據(jù)本身的產(chǎn)生是互聯(lián)網(wǎng)及其延伸所導(dǎo)致的一個(gè)自然現(xiàn)象。一是廣泛應(yīng)用,二是成本急劇下降。體現(xiàn)在幾個(gè)方面:摩爾定律驅(qū)動(dòng)的指數(shù)增長(zhǎng)模式、技術(shù)低成本化的萬(wàn)物數(shù)字化、寬帶移動(dòng)泛在互聯(lián)驅(qū)動(dòng)的人機(jī)物廣泛連接、云計(jì)算模式驅(qū)動(dòng)的數(shù)據(jù)大規(guī)模匯聚。這就是我們講的摩爾定律指數(shù)增長(zhǎng)。按照IDC的統(tǒng)計(jì),2003年、2009年到2012年,大數(shù)據(jù)從5百萬(wàn)TB到8億TB到27億TB,增長(zhǎng)速度非常之快。這是大數(shù)據(jù)的幾個(gè)主要特征。大數(shù)據(jù)不僅是量大,重要的是多元。另外它和過(guò)去的信息化是不一樣的,大數(shù)據(jù)的很多東西不是靠過(guò)去那種主動(dòng)采集產(chǎn)生的,而是有目標(biāo)的按照結(jié)構(gòu)化的方式采集的,很多是信息系統(tǒng)通過(guò)各種各樣的交互自然產(chǎn)生的。

大數(shù)據(jù)的意義和價(jià)值何在?第一,它提供了我們?nèi)祟愓J(rèn)識(shí)一個(gè)復(fù)雜系統(tǒng)的新思維、新手段。實(shí)際上如果說(shuō)我們做到一個(gè)無(wú)盡大或者不斷逼近現(xiàn)實(shí)世界里的一個(gè)數(shù)字化的話,實(shí)際上我們用大數(shù)據(jù)構(gòu)建了一個(gè)數(shù)據(jù)空間,現(xiàn)實(shí)世界的數(shù)據(jù)空間,也就是這個(gè)數(shù)據(jù)在逼近我們的現(xiàn)實(shí)世界,這就可以按照科學(xué)研究的第四范式,基于大數(shù)據(jù)觸摸、理解或者逼近復(fù)雜系統(tǒng)。隨著問(wèn)題空間的數(shù)字化,能不能得到一個(gè)數(shù)據(jù)空間,這個(gè)空間里就有很多規(guī)律可循,可以挖掘。所以從傳統(tǒng)思維到今天的大數(shù)據(jù)思維,這也是大家經(jīng)常談到的幾個(gè)很重要的變化,從樣本到全體、從精確到近似、從因果到關(guān)聯(lián)度,這是一系列的變化。

第二,大數(shù)據(jù)也會(huì)成為促進(jìn)經(jīng)濟(jì)轉(zhuǎn)型的一種新的引擎。大數(shù)據(jù)這個(gè)產(chǎn)業(yè)本身一方面促進(jìn)產(chǎn)業(yè)升級(jí),激發(fā)商業(yè)模式創(chuàng)新、促生新業(yè)態(tài),不斷改善民生服務(wù)。大數(shù)據(jù)時(shí)代有一句話,信息技術(shù)的定位。信息技術(shù)不僅是一個(gè)獨(dú)立存在的行業(yè),同時(shí)也廣泛滲透到別的行業(yè),成為該行業(yè)的倍增器或者催化劑,而現(xiàn)在這個(gè)時(shí)代,倍增和催化大概已經(jīng)不夠了,它甚至?xí)蔀橐粋€(gè)行業(yè)的顛覆者。第三,大數(shù)據(jù)成為提高政府治理能力的新途徑。第四,大數(shù)據(jù)成為提升國(guó)家綜合能力和保障國(guó)家安全的新利器。

大數(shù)據(jù)應(yīng)用尚處于發(fā)展初期

大數(shù)據(jù)產(chǎn)業(yè)生態(tài)系統(tǒng)已經(jīng)初步形成。一個(gè)方面是基礎(chǔ)設(shè)施,各個(gè)計(jì)算設(shè)備、軟硬件、數(shù)據(jù)處理的不同方法以及各個(gè)領(lǐng)域的特定大數(shù)據(jù)應(yīng)用形成了大數(shù)據(jù)產(chǎn)業(yè)生態(tài)鏈。那么技術(shù)平臺(tái)是什么?技術(shù)平臺(tái)就是云計(jì)算。云計(jì)算為數(shù)據(jù)存儲(chǔ)、融合和分析提供了高伸縮性的平臺(tái)。這個(gè)平臺(tái)向上是支撐各種應(yīng)用(以服務(wù)化的方式),向下管理各類資源。而這個(gè)平臺(tái)一個(gè)很重要的特點(diǎn)就是全面走向“軟件定義”。就是硬件資源虛擬化、管理功能可編程,對(duì)網(wǎng)絡(luò)化、規(guī)模化的各種資源進(jìn)行靈活高效的調(diào)用。

從應(yīng)用來(lái)講,大數(shù)據(jù)的應(yīng)用還處于發(fā)展初期,全世界都是如此。中國(guó)的大數(shù)據(jù)應(yīng)用也才剛剛起步。目前,互聯(lián)網(wǎng)行業(yè)是大數(shù)據(jù)應(yīng)用的領(lǐng)跑者,同時(shí)也在向別的行業(yè)大量拓展。現(xiàn)在 “大數(shù)據(jù)”這個(gè)詞用得過(guò)熱。很多應(yīng)用也就是過(guò)去數(shù)據(jù)量的增加,有的應(yīng)用甚至是換了一個(gè)“大數(shù)據(jù)”的馬甲而已。從深度挖掘和融合應(yīng)用角度來(lái)看,實(shí)際上多元數(shù)據(jù)的融合才是大數(shù)據(jù)一個(gè)非常重要的特征。雖然大數(shù)據(jù)應(yīng)用呈現(xiàn)發(fā)展初級(jí)階段特征,還處于“盲人摸象”的嘗試階段,但其巨大潛力已被廣泛認(rèn)知,同時(shí)引發(fā)新一輪信息化建設(shè)熱潮,這將成為信息化3.0階段的重要建設(shè)內(nèi)容。

新時(shí)代下的計(jì)算和網(wǎng)絡(luò)能力足夠強(qiáng),設(shè)備和技術(shù)的成本迅速降低,云計(jì)算公用事業(yè)化,萬(wàn)物互聯(lián)達(dá)到人機(jī)物融合,滲透率跨過(guò)了臨界值,大數(shù)據(jù)分析挖掘手段以及利用大數(shù)據(jù)的方式影響了我們的方方面面。國(guó)家也制定了“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃,推動(dòng)移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等方面的發(fā)展。

我理解的“互聯(lián)網(wǎng)+”首先是加法,其次為升級(jí)、延伸。這個(gè)“+”會(huì)帶來(lái)顛覆性的影響。除了成為行業(yè)的倍增器也會(huì)成為行業(yè)的顛覆者。所有的行業(yè)都離不開它,離不開三個(gè)關(guān)鍵詞:跨界、融合、創(chuàng)新。

“互聯(lián)網(wǎng)+”

是信息化3.0的指南

“互聯(lián)網(wǎng)+”本質(zhì)上是傳統(tǒng)行業(yè)/產(chǎn)業(yè)信息化的深化和泛在化,同時(shí)它也是孕育新興形態(tài)的一個(gè)平臺(tái),是互聯(lián)網(wǎng)技術(shù)、模式、思想與傳統(tǒng)行業(yè)的深度融合,它需要我們促進(jìn)信息基礎(chǔ)設(shè)施的完善、數(shù)據(jù)資源的積累、新型業(yè)態(tài)的誕生和成長(zhǎng)。“互聯(lián)網(wǎng)+”,毫無(wú)疑問(wèn),就是現(xiàn)在信息化3.0這個(gè)時(shí)代的基礎(chǔ)設(shè)施、思維模式和實(shí)施指南。也就是說(shuō),數(shù)據(jù)的深度挖掘和融合應(yīng)用會(huì)成為新一代信息化應(yīng)用的主要特征。

十八屆五中全會(huì)公報(bào)指出“實(shí)施網(wǎng)絡(luò)強(qiáng)國(guó)戰(zhàn)略,實(shí)施‘互聯(lián)網(wǎng)+’行動(dòng)計(jì)劃,發(fā)展分享經(jīng)濟(jì),實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略”。從這些方面都體現(xiàn)了我們?cè)谛畔⒒?.0時(shí)代,隨著互聯(lián)網(wǎng)的不斷延伸和擴(kuò)展,網(wǎng)絡(luò)強(qiáng)國(guó)戰(zhàn)略恰逢其時(shí)。信息化3.0時(shí)代在應(yīng)用上有很多創(chuàng)新,能不能在基礎(chǔ)設(shè)施、技術(shù)上自主可控甚至引領(lǐng),是值得我們探究的事情。

互聯(lián)網(wǎng)催生了一個(gè)創(chuàng)新的時(shí)代。過(guò)去有那么多新的概念層出不窮,這是IT業(yè)一個(gè)非常典型的特征。2000年以后,從計(jì)算機(jī)角度來(lái)看,就是一個(gè)概念創(chuàng)新的時(shí)代。而且以前這個(gè)行業(yè)的術(shù)語(yǔ)幾乎是技術(shù)導(dǎo)向,而后來(lái)全是應(yīng)用導(dǎo)向。怎么讓用戶聽的明白,不再考慮技術(shù)本身的定義和含義是什么。但是在這里面有中國(guó)元素嗎?或者說(shuō)有中國(guó)概念嗎?實(shí)際上是一個(gè)很嚴(yán)重的缺失。長(zhǎng)期的跟隨者思維形成了定勢(shì),真正實(shí)現(xiàn)創(chuàng)新發(fā)展需要技術(shù)創(chuàng)新、基礎(chǔ)設(shè)施創(chuàng)新、應(yīng)用創(chuàng)新。但在一定程度上,思想和概念的引領(lǐng)可能會(huì)產(chǎn)生更大的影響。

篇8

關(guān)鍵詞:大數(shù)據(jù);圖書館;知識(shí)服務(wù)

“大數(shù)據(jù)(Big Data)”是繼Web2.0之后和云計(jì)算一起被媒體最關(guān)注的詞匯組合,并正在引起信息科技領(lǐng)域越來(lái)越多的關(guān)注熱潮。IBM、EMC、Oracle、Microsoft等IT巨頭幾乎都已投身到了大數(shù)據(jù)的軟硬件技術(shù)整合、大數(shù)據(jù)信息處理的技術(shù)供應(yīng)研究開發(fā)之中,力求在新一輪的信息競(jìng)爭(zhēng)環(huán)境中占據(jù)主動(dòng),并搶得戰(zhàn)略先機(jī)與技術(shù)制高點(diǎn)。圖書館作為社會(huì)的知識(shí)信息服務(wù)中心,使得社會(huì)對(duì)圖書館所提供的服務(wù)要求更為苛刻,潛在的知識(shí)挖掘、知識(shí)評(píng)價(jià)、數(shù)據(jù)分析等增值服務(wù)需求已經(jīng)開始顯現(xiàn)。利用大數(shù)據(jù)技術(shù)去挖掘、識(shí)別、組織與分析隱含在讀者行為中的結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)信息,尋找他們的隱形訴求進(jìn)而改進(jìn)圖書館的服務(wù),達(dá)到圖書館資源、服務(wù)與讀者需求的雙向理想控制已成為大數(shù)據(jù)時(shí)代圖書館提高服務(wù)體系的組織水平、推動(dòng)行業(yè)發(fā)展與制度建設(shè)的捷徑之一。

一、大數(shù)據(jù)概念

(一)大數(shù)據(jù)的定義

維基百科的定義是:“大數(shù)據(jù)(Big Data),或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法通過(guò)人工,在合理時(shí)間內(nèi)達(dá)到截取、管理、處理、并整理成為人類所能解讀的信息。”[1]也就是說(shuō),由于所涉及的數(shù)據(jù)規(guī)模巨大,以至于利用目前的主要軟件工具,在可允許的時(shí)間范圍內(nèi),達(dá)到查詢檢索、下載獲取、加工處理、數(shù)據(jù)管理,并有效的整理成為對(duì)用戶有用的數(shù)據(jù)資源已經(jīng)變的非常困難。美國(guó)互聯(lián)網(wǎng)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長(zhǎng)50%,每?jī)赡瓯銓⒎环壳笆澜缟?0%以上的數(shù)據(jù)都是近幾年產(chǎn)生的。大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是人們放棄對(duì)事物因果關(guān)系的渴求,取而代之的是更加關(guān)注相關(guān)關(guān)系,對(duì)人類的認(rèn)知方式和與世界交流的方式都提出了全新的挑戰(zhàn)。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)就是資產(chǎn)已經(jīng)成為人們的共識(shí)。

(二)大數(shù)據(jù)的特點(diǎn)

分析員道格.萊尼(Doug Laney)曾在麥塔集團(tuán)(META Group,現(xiàn)為高德納)的一份研究報(bào)告中指出大數(shù)據(jù)的三個(gè)特點(diǎn):量(Volume,數(shù)據(jù)大小)、速(Velocity,數(shù)據(jù)輸入輸出的速度)與多變(Variety,多樣性),合稱“3V”。另外,以IDC為代表的業(yè)界認(rèn)為滿足“4V”(Volume、Velocity、Variety、Value,即種類多、流量大、容量大、價(jià)值高)指標(biāo)的數(shù)據(jù)才可稱為大數(shù)據(jù)。但無(wú)論是“3V”還是“4V”,其本質(zhì)都是對(duì)大數(shù)據(jù)中的“大”的理解與闡釋。

大數(shù)據(jù)的單條數(shù)據(jù)并無(wú)太多價(jià)值,但匯集龐大的單條數(shù)據(jù)集則蘊(yùn)含著巨大的財(cái)富,將已有Y構(gòu)化(如關(guān)系型數(shù)據(jù)庫(kù)、面向?qū)ο髷?shù)據(jù)庫(kù)中的數(shù)據(jù)),半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)(如文檔、文本、圖片、XML、HTML、各類報(bào)表、圖像和音頻/視頻信息等)進(jìn)行融合和分析后,會(huì)挖掘出很多新的業(yè)務(wù)信息。

二、圖書館大數(shù)據(jù)

(一)圖書館的大數(shù)據(jù)類型

進(jìn)行大數(shù)據(jù)分析首先要擁有大數(shù)據(jù),圖書館本身?yè)碛械拇髷?shù)據(jù)主要包括:

1.圖書館的數(shù)字化資源。經(jīng)過(guò)數(shù)字圖書館的多年建設(shè),圖書館擁有大量的數(shù)據(jù)庫(kù)資源、電子書資源紙質(zhì)圖書電子化的數(shù)字資源,以及各種音頻、視頻資源,這些資源在總量上很大而且增長(zhǎng)速度也比較快,它們是圖書館大數(shù)據(jù)的重要組成部分。[2]

2.社交網(wǎng)絡(luò)時(shí)代出現(xiàn)的大量非結(jié)構(gòu)化數(shù)據(jù)。在門戶網(wǎng)站、搜索引擎時(shí)代之后,社交網(wǎng)絡(luò)時(shí)代已經(jīng)到來(lái)。隨之而來(lái)產(chǎn)生了大量的非結(jié)構(gòu)化數(shù)據(jù),通過(guò)大數(shù)據(jù)分析技術(shù)可以將這些數(shù)據(jù)進(jìn)行收集分析,得出讀者的興趣偏好。伴隨著社交網(wǎng)絡(luò)、移動(dòng)圖書館、物聯(lián)網(wǎng)等概念的興起,今后來(lái)自讀者的各種信息將越來(lái)越多,我們將在讀者使用圖書館服務(wù)的過(guò)程中收集讀者的地理位置、搜索歷史、搜索時(shí)間等信息,這些很多是非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),挖掘讀者偏好,為其提供最有用的信息。

3.讀者使用歷史所形成的非結(jié)構(gòu)化數(shù)據(jù)。在圖書館里不管是各種數(shù)據(jù)庫(kù)資源,還是紙質(zhì)資源,以及各種學(xué)生的信息都是我們的大數(shù)據(jù)。但是這些并不是大數(shù)據(jù)的全部,只是其中的一部分。比如他們對(duì)于數(shù)據(jù)庫(kù)的檢索歷史、瀏覽歷史、數(shù)據(jù)使用方向及使用方法等信息。伴隨著移動(dòng)互聯(lián)時(shí)代的到來(lái),將從手機(jī)、平板電腦、筆記本等諸多移動(dòng)終端中收集到讀者的個(gè)人信息、方位信息、瀏覽信息等各種不同的數(shù)據(jù),這才真正構(gòu)成了圖書館完整的大數(shù)據(jù)采集。

(二)圖書館大數(shù)據(jù)的幾個(gè)主要來(lái)源

1.RFID射頻數(shù)據(jù):RFID嵌入到圖書館相關(guān)資源中,實(shí)現(xiàn)資源的跟蹤及分析。比如圖書芯片和借閱卡芯片的相關(guān)數(shù)據(jù),來(lái)優(yōu)化圖書布局和館藏結(jié)構(gòu)。什么資源使用的多,哪個(gè)時(shí)段流通更頻繁,資源的處理效率如何等,都對(duì)圖書館資源的利用率和采購(gòu)渠道至關(guān)重要。

2.傳感器數(shù)據(jù):通過(guò)分布在圖書館不同位置或環(huán)境中的傳感器對(duì)所處環(huán)境和資源進(jìn)行的感知,不斷生成的數(shù)據(jù),由于長(zhǎng)時(shí)間積累所產(chǎn)生的數(shù)據(jù)量也非常巨大。結(jié)合物聯(lián)網(wǎng)技術(shù),可以提升自動(dòng)化設(shè)備的智能化處理能力。

3.社交網(wǎng)絡(luò)交互數(shù)據(jù):隨著社交網(wǎng)絡(luò)應(yīng)用的逐步推廣,社交網(wǎng)絡(luò)所產(chǎn)生的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)超過(guò)以往任何一個(gè)信息傳播媒介,毫無(wú)疑問(wèn),它將會(huì)成為未來(lái)很長(zhǎng)一段時(shí)間內(nèi),大數(shù)據(jù)最為主要的來(lái)源之一。該渠道可以更多地結(jié)合第三方商業(yè)數(shù)據(jù)接口,來(lái)完成數(shù)據(jù)匯集。

4.移動(dòng)互聯(lián)數(shù)據(jù):移動(dòng)互聯(lián)網(wǎng)及移動(dòng)互聯(lián)技術(shù)的不斷完善,使得圖書館可以通過(guò)WIFI定位、流量監(jiān)控等方式,靈活獲取移動(dòng)電子設(shè)備、人員、資源、用戶行為和需求等信息,并對(duì)這些信息進(jìn)行實(shí)時(shí)分析,從而幫助我們開展有效的智能輔助決策。[3]

三、大數(shù)據(jù)應(yīng)用

(一)實(shí)現(xiàn)針對(duì)不同讀者的個(gè)性化服務(wù)

圖書館讀者具有人數(shù)眾多、年齡不同、專業(yè)方向不同等特點(diǎn)給圖書館提出了不同的個(gè)性化要求。而大數(shù)據(jù)的應(yīng)用就在于加強(qiáng)用戶研究與交互數(shù)據(jù)的利用,并基于對(duì)用戶數(shù)據(jù)的分析,從中提取有價(jià)值的信息,建立用戶模型,針對(duì)不同用戶提供針對(duì)。[4]圖書館里大量的用戶行為產(chǎn)生的數(shù)據(jù),如用戶查詢書目產(chǎn)生的OPAC日志,用戶流通日志,電子資源檢索瀏覽下載產(chǎn)生的日志及流量數(shù)據(jù),這些數(shù)據(jù)中除了用于記錄讀者的個(gè)人信息外,還隱藏著許多重要的信息,因此可通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行挖掘分析、知識(shí)發(fā)現(xiàn)、只能等技術(shù),描述用戶的行為,準(zhǔn)確定位讀者需求,向讀者提供主動(dòng)式推送服務(wù),滿足其個(gè)性化的智能服務(wù)。

(二)提供研究動(dòng)向以及研究熱點(diǎn)的變化

圖書館可以通過(guò)對(duì)讀者數(shù)據(jù)的收集匯總,進(jìn)行大數(shù)據(jù)分析,可以在宏觀上分析相關(guān)領(lǐng)域科研熱點(diǎn)的動(dòng)向,為科研人員、科研部門的決策者服務(wù),讓他們更快的洞察最新的科研走向,以及相關(guān)研究領(lǐng)域其他科研人員的研究進(jìn)展。通過(guò)大數(shù)據(jù)的分析,提升圖書館在科研領(lǐng)域中的作用,與此同時(shí)為科研人員提供更多有價(jià)值的研究策略信息。

(三)為采編部門和數(shù)據(jù)庫(kù)采購(gòu)部門提供資源評(píng)價(jià)意見

文獻(xiàn)資源是圖書館的重要組成部分,如何合理采購(gòu)紙質(zhì)資源和電子資源,如何能夠讓購(gòu)買的資源更好地滿足讀者的需要,讓圖書館更有效率地服務(wù)讀者一直是圖書館面臨的問(wèn)題。通過(guò)檢索條目信息中對(duì)搜索關(guān)鍵詞的搜集與統(tǒng)計(jì)等大數(shù)據(jù)分析,可以有效評(píng)估讀者對(duì)各種資源的使用情況,并且通過(guò)讀者平日訪問(wèn)歷史的收集,可以預(yù)測(cè)出讀者關(guān)注的熱點(diǎn),這為有效評(píng)估圖書館已有文獻(xiàn)的質(zhì)量以及讀者對(duì)未購(gòu)買文獻(xiàn)的需求提供了支持。

(四)用戶流失分析及價(jià)值分析

在當(dāng)今信息技術(shù)發(fā)展的洪流中,價(jià)值質(zhì)疑、技術(shù)障礙、管理僵化、人員隊(duì)伍適應(yīng)變化敏感性低等重大問(wèn)題已經(jīng)嚴(yán)重困制約著圖書館的發(fā)展,圖書館的社會(huì)地位與存在價(jià)值正在不斷的弱化,用戶正在向其他文化信息機(jī)構(gòu)流失。我們通過(guò)大數(shù)據(jù)分析能夠讓圖書館清晰把握用戶的信息需求及意愿,分析出用戶的信息行為及其知識(shí)應(yīng)用能力,有利于圖書館對(duì)用戶的信息需求以及信息行為偏好進(jìn)行預(yù)測(cè),架構(gòu)以讀者個(gè)性化服務(wù)為核心的信息服務(wù)體系。[5]大數(shù)據(jù)技術(shù)加強(qiáng)了圖書館對(duì)于讀者研究與交互數(shù)據(jù)分析、利用的能力,從海量數(shù)據(jù)中挖掘有用信息,建立用戶檔案與模型,在精確劃分讀者類別的基礎(chǔ)上,進(jìn)行跟蹤服務(wù)、知識(shí)關(guān)聯(lián)服務(wù)、先覺,提高用戶體驗(yàn),增加圖書館信息服務(wù)的競(jìng)爭(zhēng)力,從而留住用戶。

(五)建立新型知識(shí)服務(wù)引擎

技術(shù)引擎是圖書館信息服務(wù)的技術(shù)核心,如何利用大數(shù)據(jù)技術(shù)構(gòu)建圖書館的新型知識(shí)服務(wù)引擎,將會(huì)是未來(lái)幾年內(nèi)圖書館情報(bào)領(lǐng)域信息技術(shù)研究的主要內(nèi)容。[6]新型知識(shí)服務(wù)引擎包括資源及學(xué)術(shù)搜索引擎、資源及服務(wù)推薦引擎、知識(shí)服務(wù)社區(qū)實(shí)體(包括用戶及資源)行為智能分析引擎、用戶知識(shí)需求預(yù)測(cè)引擎、及多維度信息資源獲取、組織、分析及決策引擎等。例如美國(guó)Hiptype公司將大數(shù)據(jù)分析技術(shù)來(lái)分析電子書讀者閱讀習(xí)慣和喜好,這也是國(guó)內(nèi)外圖書情報(bào)領(lǐng)域首例利用大數(shù)據(jù)技術(shù)構(gòu)建知識(shí)服務(wù)社區(qū)實(shí)體(包括用戶及資源)行為智能分析引擎。

(六)建立知識(shí)服務(wù)及業(yè)務(wù)建設(shè)的風(fēng)險(xiǎn)模型

通過(guò)分析資源,包括知識(shí)資源、網(wǎng)絡(luò)資源、信息資源、軟件資源及服務(wù)資源等的實(shí)時(shí)狀態(tài)來(lái)預(yù)測(cè)未來(lái)可能出現(xiàn)的故障及稻葑試純贍艸魷值耐槐溆氬ǘ,幫助圖書館預(yù)先制訂好應(yīng)對(duì)措施、策略以及圖書館的各類風(fēng)險(xiǎn)評(píng)估模型。同時(shí),如前所述,傳感器數(shù)據(jù)也是未來(lái)大數(shù)據(jù)的主要來(lái)源之一,此類數(shù)據(jù)將為圖書館獲取大量的圖書館人文環(huán)境、自然環(huán)境以及技術(shù)環(huán)境的多維度數(shù)據(jù),借助大數(shù)據(jù)技術(shù)分析、預(yù)測(cè)建立有針對(duì)性的各類圖書館風(fēng)險(xiǎn)評(píng)估模型,實(shí)現(xiàn)圖書館管理的優(yōu)化升級(jí),保持圖書館穩(wěn)定的運(yùn)行狀態(tài)。

四、概念轉(zhuǎn)變

數(shù)字信息的爆炸式增長(zhǎng)催生出“大數(shù)據(jù)”概念,正席卷整個(gè)IT及其相關(guān)行業(yè),大數(shù)據(jù)已經(jīng)深深嵌入到了圖書館情報(bào)工作當(dāng)中。然而目前圖書館相關(guān)大數(shù)據(jù)的理論研究與方案應(yīng)用仍處于一個(gè)初級(jí)階段,有大量基礎(chǔ)性的構(gòu)架問(wèn)題有待解決。圖書館作為信息資源收集整理及為社會(huì)提供信息服務(wù)的資源中心,擁有豐富的資源優(yōu)勢(shì),然而在今后大數(shù)據(jù)的云服務(wù)競(jìng)爭(zhēng)中,圖書館只有突破現(xiàn)有技術(shù)屏障,才有可能避免被新型信息模型邊緣化。

【參考文獻(xiàn)】

[1]大數(shù)據(jù).維基百科.2014-07-25.http:///wiki/大數(shù)據(jù).

[2]楊海燕.大數(shù)據(jù)時(shí)代的圖書館服務(wù)淺析.圖書與情報(bào),2012(4).

[3]樊偉紅等.圖書館需要怎樣的“大數(shù)據(jù)”.圖書館雜志,2012(11).

[4]韓翠峰.大數(shù)據(jù)時(shí)代圖書館服務(wù)創(chuàng)新與發(fā)展.圖書館,2013(1).

[5]王捷.大數(shù)據(jù)時(shí)代下圖書館開展信息服務(wù)的對(duì)策.現(xiàn)代情報(bào),2013(3).

篇9

大數(shù)據(jù)(BigData)本身是一個(gè)比較抽象的概念,至今尚未有一個(gè)公認(rèn)的定義。Wiki定義“大數(shù)據(jù)”是利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗的時(shí)間超過(guò)可容忍時(shí)間的數(shù)據(jù)集[1]。Gartner這樣定義“:大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)[2]。也有研究者形象化地描述“大數(shù)據(jù)”是未來(lái)的新石油。不同的定義基本都是根據(jù)大數(shù)據(jù)的特征歸納闡述給出。比較具有代表性的是4V定義,認(rèn)為大數(shù)據(jù)具有4個(gè)特點(diǎn):規(guī)模性(volume)、多樣性(variety)、高速性(velocity)和價(jià)值性(value)。即數(shù)據(jù)規(guī)模巨大,從TB級(jí)躍升到PB級(jí);數(shù)據(jù)類型多樣,包含結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的多種數(shù)據(jù)類型;高效的數(shù)據(jù)處理能力及蘊(yùn)含著極高的價(jià)值。

2大數(shù)據(jù)時(shí)代圖書館信息安全面臨的威脅

大數(shù)據(jù)時(shí)代,數(shù)據(jù)資源將逐漸成為圖書館最重要的資產(chǎn)之一,決策行為將在數(shù)據(jù)分析的基礎(chǔ)上做出。作為以數(shù)據(jù)分析利用和信息服務(wù)為己任的圖書館,它的信息安全將面臨著大數(shù)據(jù)帶來(lái)的挑戰(zhàn)。

2.1存儲(chǔ)安全問(wèn)題

圖書館關(guān)注的數(shù)據(jù)已不僅限于書目信息、讀者信息、電子期刊等業(yè)務(wù)數(shù)據(jù),還延伸到微信、微博、移動(dòng)網(wǎng)絡(luò)等讀者活動(dòng)中產(chǎn)生的很難估量的社會(huì)化數(shù)據(jù)。如此龐大的數(shù)據(jù)集對(duì)圖書館的存儲(chǔ)、軟硬件設(shè)施是個(gè)考驗(yàn)。如何防止這些數(shù)據(jù)丟失、損毀、被非法盜取及利用是圖書館安全存儲(chǔ)面臨的一項(xiàng)挑戰(zhàn)。另外,大數(shù)據(jù)環(huán)境下的圖書館為了降低成本,通常會(huì)將數(shù)據(jù)存儲(chǔ)在云端,云的開放性,海量用戶共存性等都帶來(lái)了潛在的威脅。

2.2網(wǎng)絡(luò)安全問(wèn)題

圖書館是以網(wǎng)絡(luò)為基礎(chǔ)來(lái)傳遞信息和數(shù)字資源,為讀者提供服務(wù)。在網(wǎng)絡(luò)上,大數(shù)據(jù)成為更易被攻擊的顯著目標(biāo)。圖書館的“大數(shù)據(jù)”不僅包含了海量數(shù)據(jù)資源,還包含了讀者行為、敏感數(shù)據(jù)等,這些海量的信息資源將吸引更多的攻擊者,也使大數(shù)據(jù)成為更有吸引力的目標(biāo)。另外,黑客利用大數(shù)據(jù)發(fā)起的僵尸網(wǎng)絡(luò)攻擊,能夠同時(shí)控制百萬(wàn)臺(tái)機(jī)器,這是傳統(tǒng)單點(diǎn)攻擊做不到的。利用大數(shù)據(jù),黑客能夠發(fā)動(dòng)APT攻擊,APT的攻擊代碼隱藏在大數(shù)據(jù)中,很難被檢測(cè)到。

2.3隱私泄露問(wèn)題

社交網(wǎng)絡(luò)、微博、移動(dòng)網(wǎng)絡(luò)等這些信息服務(wù)新形式的快速發(fā)展,互聯(lián)網(wǎng)每時(shí)每刻都在產(chǎn)生海量的數(shù)據(jù)。讀者的個(gè)人數(shù)據(jù)可能被任意搜索、獲取,這將極大地威脅隱私安全。一方面,圖書館的海量數(shù)據(jù)信息資源、讀者信息、讀者行為、科研信息等數(shù)據(jù)高度集中,即使不被盜取濫用,也增加了數(shù)據(jù)泄露的風(fēng)險(xiǎn)。另一方面,對(duì)于某些重要數(shù)據(jù)、敏感數(shù)據(jù)以及隱私數(shù)據(jù)的挖掘分析,其使用權(quán)沒有明確界定,這都將會(huì)涉及隱私泄露。

2.4知識(shí)產(chǎn)權(quán)問(wèn)題

大數(shù)據(jù)時(shí)代,圖書館雖然會(huì)把越來(lái)越多的數(shù)據(jù)資源交給“云”提供商代為托管,但是圖書館應(yīng)完全擁有這些被托管數(shù)據(jù)資源的知識(shí)產(chǎn)權(quán)。然而現(xiàn)實(shí)中“,云”提供商利用大數(shù)據(jù)技術(shù)對(duì)圖書館的數(shù)據(jù)資源進(jìn)行挖掘、發(fā)現(xiàn)、分析進(jìn)而整合成新的數(shù)據(jù)產(chǎn)品加以利用,本該由圖書館所唯一擁有的數(shù)據(jù),一旦被“云”提供商開發(fā)成產(chǎn)品,知識(shí)產(chǎn)權(quán)的界定就成為圖書館要面臨的新難題。

3大數(shù)據(jù)時(shí)代圖書館信息安全應(yīng)對(duì)策略

大數(shù)據(jù)資源將成為圖書館的核心資產(chǎn)。圖書館在利用數(shù)據(jù)處理、數(shù)據(jù)挖掘、數(shù)據(jù)分析等技術(shù)獲取大數(shù)據(jù)蘊(yùn)藏的高價(jià)值,創(chuàng)新服務(wù)模式,提高服務(wù)質(zhì)量的同時(shí),應(yīng)重點(diǎn)考慮如何確保數(shù)據(jù)資源存儲(chǔ)安全,如何降低網(wǎng)絡(luò)安全威脅,如何防止隱私泄露等。大數(shù)據(jù)時(shí)代的圖書館應(yīng)首先從技術(shù)層面保障存儲(chǔ)安全,提高網(wǎng)絡(luò)安全防范技術(shù);其次,建立數(shù)據(jù)監(jiān)管體系,對(duì)讀者和圖書館的重要數(shù)據(jù)、敏感數(shù)據(jù)、隱私數(shù)據(jù)進(jìn)行監(jiān)管;最后,加強(qiáng)圖書館信息安全制度和相關(guān)政策法規(guī)建設(shè)。

3.1保障存儲(chǔ)安全

圖書館的數(shù)據(jù)資源在無(wú)限增長(zhǎng),規(guī)模日益龐大,保障這些數(shù)據(jù)資源的安全存儲(chǔ)顯得尤為重要,同時(shí)對(duì)硬件設(shè)施也是巨大考驗(yàn)。現(xiàn)有的存儲(chǔ)系統(tǒng)無(wú)法充分有效地存儲(chǔ)、管理、分析大數(shù)據(jù),限制了數(shù)據(jù)的增長(zhǎng)。大數(shù)據(jù)時(shí)代的圖書館為了降低運(yùn)維成本,緩解硬件設(shè)施壓力,應(yīng)考慮將數(shù)據(jù)和信息存儲(chǔ)在云端,利用云存儲(chǔ)實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)、管理以及分析。云存儲(chǔ),即基于云計(jì)算的存儲(chǔ)系統(tǒng),其可擴(kuò)展性、靈活性、運(yùn)算高效性能夠解決大數(shù)據(jù)存儲(chǔ)和管理存在的問(wèn)題。但是,云存儲(chǔ)具有數(shù)據(jù)規(guī)模海量、管理高度集中、系統(tǒng)規(guī)模巨大、平臺(tái)開放復(fù)雜等特點(diǎn),這些都將對(duì)信息安全帶來(lái)威脅。因此,保障云安全是大數(shù)據(jù)時(shí)代圖書館信息安全的基礎(chǔ)。圖書館作為云存儲(chǔ)服務(wù)用戶,最關(guān)心的就是存儲(chǔ)在云端的數(shù)據(jù)是否完整安全,是否有人非法訪問(wèn),以及當(dāng)合法訪問(wèn)這些數(shù)據(jù)時(shí)是否能獲得有效且正確的數(shù)據(jù)。因此,應(yīng)重點(diǎn)研究運(yùn)用身份認(rèn)證、加密存儲(chǔ)、數(shù)據(jù)災(zāi)備這3種技術(shù)手段來(lái)保障云安全。

(1)身份認(rèn)證。

加強(qiáng)圖書館云存儲(chǔ)上數(shù)據(jù)的管理,實(shí)行身份認(rèn)證,確保管理員、讀者用戶、云存儲(chǔ)服務(wù)提供商等經(jīng)過(guò)認(rèn)證獲得訪問(wèn)權(quán)限后,才可管理、分析、訪問(wèn)“云”上的數(shù)據(jù)資源。云存儲(chǔ)具有跨平臺(tái)、異構(gòu)、分布式等特點(diǎn),為了提高管理員、用戶的訪問(wèn)效率,應(yīng)建立有效的單點(diǎn)登錄統(tǒng)一身份認(rèn)證系統(tǒng),支持各圖書館云存儲(chǔ)之間共享認(rèn)證服務(wù)和用戶身份信息,減少重復(fù)驗(yàn)證帶來(lái)的運(yùn)行開銷。

(2)加密存儲(chǔ)。

對(duì)文件和數(shù)據(jù)進(jìn)行加密保存,確保圖書館云存儲(chǔ)上的數(shù)據(jù)資源在存儲(chǔ)和傳輸過(guò)程中,不被意外或非意外損毀、丟失、處理及非法利用。加密存儲(chǔ)主要包含兩部分工作:一是密鑰的管理和產(chǎn)生,二是應(yīng)用密鑰對(duì)數(shù)據(jù)進(jìn)行加密存儲(chǔ)和解密讀取。云存儲(chǔ)系統(tǒng)為每位注冊(cè)用戶生成一個(gè)解密密鑰,系統(tǒng)將數(shù)據(jù)加密存儲(chǔ)在數(shù)據(jù)中心,用戶讀取加密數(shù)據(jù)后,利用自己的解密密鑰恢復(fù)數(shù)據(jù),得到原始數(shù)據(jù)。這一過(guò)程對(duì)存儲(chǔ)性能和網(wǎng)絡(luò)傳輸效率會(huì)有一定影響,因此圖書館一方面要加快對(duì)加密存儲(chǔ)技術(shù)的研究;另一方面可以考慮先只對(duì)重要數(shù)據(jù)、敏感數(shù)據(jù)、個(gè)人信息數(shù)據(jù)進(jìn)行加密存儲(chǔ)。

(3)數(shù)據(jù)災(zāi)備。

云計(jì)算技術(shù)對(duì)于數(shù)據(jù)災(zāi)備具有天生的優(yōu)勢(shì)。將虛擬化技術(shù)、分布式技術(shù)和云計(jì)算技術(shù)結(jié)合可實(shí)現(xiàn)多點(diǎn)備份、數(shù)據(jù)自動(dòng)冗余存儲(chǔ)、云節(jié)點(diǎn)無(wú)單點(diǎn)故障數(shù)據(jù)級(jí)災(zāi)備。圖書館可以利用云存儲(chǔ)在不同的地方建設(shè)兩個(gè)及以上的圖書館云存儲(chǔ)數(shù)據(jù)中心,構(gòu)成一個(gè)跨地域的統(tǒng)一存儲(chǔ)平臺(tái),各業(yè)務(wù)部門和每個(gè)用戶都可以共享共用這些數(shù)據(jù)。保證只要有一個(gè)數(shù)據(jù)中心完整,所有數(shù)據(jù)就不會(huì)丟失且能夠提供持續(xù)服務(wù)。

3.2提高網(wǎng)絡(luò)安全防護(hù)技術(shù)

隨著圖書館數(shù)據(jù)資源總量的增加和新型社交網(wǎng)絡(luò)下讀者原創(chuàng)數(shù)據(jù)爆炸性增長(zhǎng),網(wǎng)絡(luò)在線數(shù)據(jù)呈現(xiàn)急劇增長(zhǎng)的趨勢(shì),導(dǎo)致黑客的攻擊欲望比以往更為強(qiáng)烈,其手段和工具也更為復(fù)雜、更加專業(yè)。大數(shù)據(jù)對(duì)圖書館網(wǎng)絡(luò)安全策略提出更高的要求,從技術(shù)層面來(lái)說(shuō),圖書館網(wǎng)絡(luò)安全策略包括漏洞掃描、入侵檢測(cè)、訪問(wèn)控制和網(wǎng)絡(luò)安全審計(jì)4種技術(shù)手段,任何一個(gè)單一的防范手段都無(wú)法保障圖書館網(wǎng)絡(luò)的安全性。

(1)漏洞掃描。

漏洞掃描包括檢測(cè)路由器、交換機(jī)、防火墻、各應(yīng)用服務(wù)器OS、應(yīng)用系統(tǒng)以及工作人員用機(jī)的安全補(bǔ)丁、系統(tǒng)漏洞、病毒感染等問(wèn)題。漏洞掃描系統(tǒng)應(yīng)及時(shí)發(fā)現(xiàn)系統(tǒng)漏洞、木馬、病毒、蠕蟲、后門程序、網(wǎng)絡(luò)攻擊、ARP等,并提供修復(fù)、查殺、攔截、防御的有效工具,同時(shí)能夠?qū)D書館整個(gè)網(wǎng)絡(luò)系統(tǒng)進(jìn)行風(fēng)險(xiǎn)評(píng)估,以便采取相應(yīng)措施及時(shí)消除系統(tǒng)中的安全隱患。與以往的漏洞掃描不同的是,大數(shù)據(jù)時(shí)代,對(duì)于海量數(shù)據(jù)的掃描,將會(huì)花費(fèi)很長(zhǎng)的時(shí)間,因此需要研究解決如何提高網(wǎng)絡(luò)海量數(shù)據(jù)檢測(cè)掃描的精確度和速度。

(2)入侵檢測(cè)。

隨著圖書館信息資源和數(shù)據(jù)資源共建共享步伐的加快,圖書館私有云和行業(yè)云的建設(shè)加快,網(wǎng)絡(luò)應(yīng)用范圍在不斷擴(kuò)大,來(lái)自校園網(wǎng)內(nèi)部和外部的黑客攻擊、非法訪問(wèn)等安全問(wèn)題與日俱增,因此對(duì)惡意入侵的檢測(cè)與防范刻不容緩。大數(shù)據(jù)對(duì)信息安全是把雙刃劍,應(yīng)利用大數(shù)據(jù)的分析技術(shù),通過(guò)分析來(lái)源信息,能夠自動(dòng)確定網(wǎng)絡(luò)異常。進(jìn)一步研究更有效的檢測(cè)手段,完成APT高端檢測(cè),做到多點(diǎn)、長(zhǎng)時(shí)、多類型的檢測(cè)。

(3)訪問(wèn)控制。

接入圖書館網(wǎng)絡(luò)的用戶,在使用海量數(shù)據(jù)資源之前,必須進(jìn)行身份認(rèn)證和權(quán)限劃分,用戶通過(guò)認(rèn)證獲得授權(quán)之后,才可以根據(jù)自己的權(quán)限訪問(wèn)相應(yīng)的數(shù)據(jù)資源和應(yīng)用系統(tǒng),獲取相關(guān)的數(shù)據(jù)分析結(jié)果等。采用單點(diǎn)、統(tǒng)一認(rèn)證方式,并結(jié)合PMI權(quán)限控制技術(shù),加大認(rèn)證加密技術(shù)研究,有效控制不同用戶分不同級(jí)別訪問(wèn)管理數(shù)據(jù)、訪問(wèn)數(shù)據(jù)、獲取數(shù)據(jù)以及應(yīng)用大數(shù)據(jù)分析結(jié)果。

(4)網(wǎng)絡(luò)安全審計(jì)。

相比入侵檢測(cè)系統(tǒng),網(wǎng)絡(luò)安全審計(jì)沒有實(shí)時(shí)性要求,因此可以對(duì)海量的服務(wù)器運(yùn)行日志、數(shù)據(jù)庫(kù)操作記錄、系統(tǒng)活動(dòng)等歷史數(shù)據(jù)進(jìn)行分析,并且可以利用大數(shù)據(jù)進(jìn)行更加精細(xì)和復(fù)雜的分析,發(fā)現(xiàn)更多的黑客攻擊種類,其誤報(bào)率也將低于傳統(tǒng)的入侵檢測(cè)。

3.3建立數(shù)據(jù)安全監(jiān)管機(jī)制

大數(shù)據(jù)關(guān)鍵技術(shù)的快速發(fā)展,為圖書館大數(shù)據(jù)的存儲(chǔ)與分析奠定了基礎(chǔ),大數(shù)據(jù)將成為圖書館的重要資產(chǎn)。但是,海量數(shù)據(jù)和數(shù)據(jù)分析結(jié)果一旦泄露,相對(duì)于以往,對(duì)讀者個(gè)人甚至整個(gè)圖書館界將會(huì)造成巨大的經(jīng)濟(jì)損失,還可能導(dǎo)致聲譽(yù)受損,嚴(yán)重的還要承擔(dān)相關(guān)法律責(zé)任。大數(shù)據(jù)安全不僅是技術(shù)問(wèn)題,更是管理問(wèn)題。因此,大數(shù)據(jù)時(shí)代,圖書館除了要從技術(shù)上實(shí)現(xiàn)存儲(chǔ)安全、云安全、網(wǎng)絡(luò)安全等方式來(lái)抵御外來(lái)的信息安全威脅,更需要加強(qiáng)在數(shù)據(jù)安全監(jiān)管、數(shù)據(jù)資源共享機(jī)制、數(shù)據(jù)隱私保護(hù)、敏感數(shù)據(jù)審計(jì)等方面的制度建設(shè),從管理上防止圖書館核心數(shù)據(jù)、隱私數(shù)據(jù)和敏感數(shù)據(jù)的泄露。力圖建立貫穿于數(shù)據(jù)生命周期的數(shù)據(jù)監(jiān)管機(jī)制。在技術(shù)層面,運(yùn)用先進(jìn)的信息技術(shù)手段開展數(shù)據(jù)監(jiān)管工作,如利用現(xiàn)有隱理、數(shù)據(jù)預(yù)處理等技術(shù)保障數(shù)據(jù)在使用和傳輸中能夠拒絕服務(wù)攻擊、數(shù)據(jù)傳輸機(jī)密性及DNS安全等。在管理層面,提高圖書館工作人員的信息安全意識(shí),加強(qiáng)各業(yè)務(wù)部門內(nèi)部管理,明確重要數(shù)據(jù)庫(kù)的范圍,創(chuàng)新有效科學(xué)的數(shù)據(jù)監(jiān)管手段與方法,制定終端設(shè)備尤其是移動(dòng)終端的安全使用規(guī)程,制定并完善重要數(shù)據(jù)、敏感數(shù)據(jù)、隱私數(shù)據(jù)的安全操作和管理制度,規(guī)范大數(shù)據(jù)的使用方法和流程。

3.4加強(qiáng)圖書館信息安全制度建設(shè)

依據(jù)信息安全管理國(guó)際標(biāo)準(zhǔn)ISO27000,明確大數(shù)據(jù)時(shí)代圖書館的實(shí)際安全需求和安全目標(biāo),量化各類數(shù)據(jù)資源的安全指標(biāo),建立全方位、立體、深度的信息安全防御體系。以信息安全防御體系為基礎(chǔ),建立信息安全責(zé)任人負(fù)責(zé)制的組織機(jī)構(gòu);制定日常安全運(yùn)維制度,包括存儲(chǔ)、業(yè)務(wù)系統(tǒng)以及各應(yīng)用系統(tǒng)的安全運(yùn)行監(jiān)控制度、數(shù)據(jù)監(jiān)管制度、移動(dòng)終端檢測(cè)制度、網(wǎng)絡(luò)安全制度等;制定應(yīng)急響應(yīng)制度,包括數(shù)據(jù)災(zāi)備制度、數(shù)據(jù)恢復(fù)制度、故障系統(tǒng)恢復(fù)制度等。對(duì)于存儲(chǔ)在云端的數(shù)據(jù),建立數(shù)據(jù)共享制度和機(jī)密保護(hù)制度。根據(jù)保密級(jí)別、共享級(jí)別、開放級(jí)別等明確訪問(wèn)權(quán)限等級(jí)劃分,制定數(shù)據(jù)的訪問(wèn)、檢索、下載、分析等方面的規(guī)定;建立身份認(rèn)證和權(quán)限控制機(jī)制,控制非法授權(quán)訪問(wèn)數(shù)據(jù);制定數(shù)據(jù)云存儲(chǔ)的安全規(guī)定,加密關(guān)鍵數(shù)據(jù);制定數(shù)據(jù)所有權(quán)條款,防止“云”提供商第三方泄密。建立相應(yīng)的法律政策保護(hù)數(shù)據(jù)利用時(shí)涉及的知識(shí)產(chǎn)權(quán),保障數(shù)據(jù)資源的合理合法使用,維護(hù)圖書館利益,保護(hù)知識(shí)產(chǎn)權(quán)。

4結(jié)語(yǔ)

篇10

關(guān)鍵詞:大數(shù)據(jù);云計(jì)算;職業(yè)教育

中圖分類號(hào):G424 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)09-1853-01

2012年,聯(lián)合國(guó)大數(shù)據(jù)政務(wù)白皮書,提出了各國(guó)政府(包括聯(lián)合國(guó)在內(nèi))的一個(gè)歷史性機(jī)遇:利用豐富的大數(shù)據(jù)對(duì)社會(huì)經(jīng)濟(jì)做出具體的分析,幫助政府更好的運(yùn)行經(jīng)濟(jì)服務(wù)社會(huì)。同年,奧巴馬在美國(guó)白宮宣布將“大數(shù)據(jù)戰(zhàn)略”上升為國(guó)家意志,將大數(shù)據(jù)定義為“未來(lái)的新石油”并加大投資拉動(dòng)相關(guān)產(chǎn)業(yè)。2013年12月5日-5日,由中國(guó)計(jì)算機(jī)學(xué)會(huì)主辦,中國(guó)CCF大數(shù)據(jù)專家委員會(huì)承辦的主題為“應(yīng)用驅(qū)動(dòng)的架構(gòu)與技術(shù)”的中國(guó)大數(shù)據(jù)技術(shù)大會(huì),這次大會(huì)成為大數(shù)據(jù)技術(shù)與應(yīng)用深度結(jié)合的新起點(diǎn),成為產(chǎn)業(yè)界、科技界與政府部門密切合作的新平臺(tái),進(jìn)一步推動(dòng)我國(guó)大數(shù)據(jù)的產(chǎn)學(xué)研。2014年3月1日,在北京舉行的貴州?北京大數(shù)據(jù)產(chǎn)業(yè)推介會(huì)上,貴州共獲投730.2億元用于大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,這一偉大的壯舉將全面推動(dòng)貴州互聯(lián)網(wǎng),網(wǎng)絡(luò)營(yíng)銷發(fā)展進(jìn)而影響貴州經(jīng)濟(jì)發(fā)展。百年大計(jì),教育為本,在貴州“后發(fā)趕超,跨越發(fā)展”的過(guò)程中,教育的改善提升成了社會(huì)發(fā)展步伐是否穩(wěn)健的重心,隨著大數(shù)據(jù)的到來(lái),貴州的教育正張開騰飛的羽翼迎接新一輪的跨越趕超,貴州在全國(guó)率先完成中小學(xué)生學(xué)習(xí)信息管理系統(tǒng),學(xué)生學(xué)籍信息入庫(kù)。為加快推進(jìn)職業(yè)人才培養(yǎng)體系建設(shè),促進(jìn)經(jīng)濟(jì)工作穩(wěn)定快速發(fā)展,省教育廳、人社廳等多家單位攜手并進(jìn),聯(lián)合出臺(tái)了加快職業(yè)人才教育培養(yǎng)的實(shí)施方案,以貴陽(yáng)為中心,打造職業(yè)教育核心發(fā)展區(qū),規(guī)劃高職辦學(xué)規(guī)模達(dá)到25萬(wàn)人,為貴州大數(shù)據(jù)產(chǎn)業(yè)發(fā)展提供充足的人才保障,建成具有貴州特色的現(xiàn)代職業(yè)教育體系。在大數(shù)據(jù)背景的前提下,貴州的職業(yè)教育發(fā)展將踏上更加非凡和精彩的跨越之旅。

1 大數(shù)據(jù)、云計(jì)算簡(jiǎn)介

麥肯錫公司在2011年了一個(gè)前沿領(lǐng)域的研究:大數(shù)據(jù)。雖然到現(xiàn)在為止沒有一個(gè)明確的定義,但是,大數(shù)據(jù)不是海量數(shù)據(jù)的表面理解,具有數(shù)據(jù)體量巨大,數(shù)據(jù)類型繁多,價(jià)值密度低,處理速度快等特點(diǎn)。 “云計(jì)算是通過(guò)網(wǎng)絡(luò)提供可伸縮的廉價(jià)的分布式計(jì)算能力”。云計(jì)算代表了以虛擬化技術(shù)為核心、以低成本為目標(biāo)的動(dòng)態(tài)可擴(kuò)展網(wǎng)絡(luò)應(yīng)用基礎(chǔ)設(shè)施,是近幾年來(lái)最有代表性的網(wǎng)絡(luò)計(jì)算技術(shù)與模式。從技術(shù)上看,大數(shù)據(jù)與云計(jì)算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無(wú)法用單臺(tái)的計(jì)算機(jī)進(jìn)行處理,必須采用分布式計(jì)算架構(gòu)。它的特色在于對(duì)海量數(shù)據(jù)的挖掘,但它必須依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫(kù)、云存儲(chǔ)和虛擬化技術(shù)。

2 高職院校大數(shù)據(jù)條件下云計(jì)算的應(yīng)用

云計(jì)算的應(yīng)用使得高校在信息工具化的時(shí)代能夠脫離原始的“信息孤島”現(xiàn)象,集中了原本分散的國(guó)內(nèi)及世界的教育資源,讓社會(huì)與學(xué)校,學(xué)校與教師,教師與學(xué)生之間有了更深的互動(dòng)和相互帶動(dòng),把社會(huì)各行各業(yè)對(duì)教育有利的資源通過(guò)計(jì)算機(jī)與網(wǎng)絡(luò)終端帶動(dòng)教育的發(fā)展。高職教育與傳統(tǒng)的本科教育不同,重點(diǎn)是培養(yǎng)學(xué)生的實(shí)際操作能力,通過(guò)資源庫(kù)的分析和選取并優(yōu)化應(yīng)用,可以提高高職教育的目標(biāo)性。

2.1 依據(jù)社會(huì)人才需求信息,調(diào)整專業(yè)設(shè)置

目前的社會(huì)公開招聘信息都是通過(guò)互聯(lián)網(wǎng)至少在全國(guó)范圍內(nèi)進(jìn)行公開招考的,近幾年,百度等各大網(wǎng)站都可以輕易的分析出

招聘的條件和專業(yè)。各大中型企業(yè)招聘的專業(yè)類型等都可以通過(guò)數(shù)據(jù)提取,數(shù)據(jù)分析得到各專業(yè)的需求狀況,通過(guò)這些計(jì)算、分析這些大數(shù)據(jù),可以適當(dāng)迅速的調(diào)整專業(yè)設(shè)置和專業(yè)學(xué)習(xí)計(jì)劃,以適應(yīng)信息瞬息萬(wàn)變的時(shí)代需求。

2.2 利用數(shù)據(jù)庫(kù)優(yōu)秀教育資源,提高教學(xué)效果

近年來(lái),各大高校,職院都在進(jìn)行重點(diǎn)專業(yè)的課改工作,很多優(yōu)秀的課程教學(xué)視頻和配套資源等上網(wǎng),通過(guò)相關(guān)網(wǎng)站對(duì)教育資源的數(shù)據(jù)進(jìn)行搜索,在相應(yīng)的學(xué)院,教研室,進(jìn)行數(shù)據(jù)的分析和研討,經(jīng)過(guò)相應(yīng)的更改后可以直接應(yīng)用我們的教學(xué)和管理中,可以充分吸取網(wǎng)絡(luò)教育資源的精華,變成自己教學(xué)工作進(jìn)步的工具。

2.3 充分利用電子圖書館,擴(kuò)展“校企合作”的形式

貴州是教育相對(duì)落后的地區(qū),首先,經(jīng)濟(jì)基礎(chǔ)決定上層建筑,資金配套的硬件措施是制

約學(xué)校教學(xué)工作前進(jìn)的橋梁,近幾年,國(guó)家的西部發(fā)展計(jì)劃和貴州省對(duì)教育尤其是職業(yè)教育的大力支持,使得,學(xué)校的教學(xué)環(huán)境有了很大的改善,很多學(xué)校都配套修建了電子圖書館和電子信息實(shí)訓(xùn)室。“校企合作”首先在發(fā)達(dá)地區(qū)開展,在貴州,合作項(xiàng)目近三年才開始試行,以貴州職業(yè)技術(shù)學(xué)院為例,2012年,由政府搭臺(tái)的“中興網(wǎng)絡(luò)學(xué)院”項(xiàng)目達(dá)成協(xié)議,中興在貴州職院第一次投入一千萬(wàn)元建立實(shí)訓(xùn)室并開始招生,除了學(xué)校教學(xué)計(jì)劃必須完成的課程外,中興選派有實(shí)戰(zhàn)經(jīng)驗(yàn)的一線老師加強(qiáng)學(xué)生實(shí)訓(xùn)的教學(xué)和指導(dǎo),讓學(xué)生更深入的練習(xí)自己的職業(yè)技能,除了學(xué)習(xí)學(xué)校扎實(shí)的基礎(chǔ)理論,更吸收了中興企業(yè)信息化的優(yōu)勢(shì)。

3 高職教改的新方向

面向大數(shù)據(jù)的云計(jì)算主要是為學(xué)院提供基于云架構(gòu)的知識(shí)、信息的存貯,但對(duì)于這些數(shù)據(jù)的科學(xué)性分析和研究并不完備,尤其是職業(yè)院校需要的不僅僅是可以相對(duì)容易驗(yàn)證真理的理論知識(shí),主要是一線的先進(jìn)生產(chǎn)力和技術(shù)的學(xué)習(xí)和研究資料,所以認(rèn)真學(xué)習(xí)和研究大數(shù)據(jù)的處理方式,將是未來(lái)高職在大數(shù)據(jù)方面的發(fā)展新方向,當(dāng)然事物兩面性的原則,大數(shù)據(jù)的網(wǎng)絡(luò)環(huán)境也為學(xué)院的發(fā)展帶來(lái)負(fù)面的影響,比如,隨處可見的傳感器和攝像頭等,都可能會(huì)泄露學(xué)校和學(xué)生的私人隱私信息,暴露學(xué)校的科研痕跡和學(xué)生的行蹤軌跡,從而對(duì)學(xué)生的個(gè)人安全等起到威脅作用,所以,隱私信息保護(hù)系統(tǒng)也是當(dāng)下研究的熱點(diǎn)問(wèn)題。