計(jì)算機(jī)專業(yè)數(shù)據(jù)倉庫見習(xí)報(bào)告
時(shí)間:2022-07-23 02:24:00
導(dǎo)語:計(jì)算機(jī)專業(yè)數(shù)據(jù)倉庫見習(xí)報(bào)告一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
一、導(dǎo)讀部分:
可見二者差別之大,這只是數(shù)據(jù)庫與數(shù)據(jù)倉庫的一個(gè)概念性的大致區(qū)別。另外它編程人員最關(guān)心的建立與操作各方面也差別很大,因此如果你沒有這方面的知識(shí)想只憑借數(shù)據(jù)庫發(fā)面的知識(shí)來開發(fā)數(shù)據(jù)倉庫的產(chǎn)品是很不可能的這就要求你要從數(shù)據(jù)倉庫最基礎(chǔ)的知識(shí)學(xué)起。
可能很多同學(xué)首先就會(huì)想到數(shù)據(jù)庫,說起數(shù)據(jù)倉庫。終究就錯(cuò)了一個(gè)字,但是就是這一個(gè)字使這二者差異很大:
即數(shù)據(jù)庫為中心,保守的數(shù)據(jù)庫技術(shù)是以單一的數(shù)據(jù)資源。進(jìn)行事務(wù)處理、批處置等各種數(shù)據(jù)處置工作,主要是操作型處理,操作型處置也叫事務(wù)處理,指對(duì)數(shù)據(jù)庫聯(lián)機(jī)的日常操作,通常是對(duì)一個(gè)或一組紀(jì)錄的查詢和修改,主要為企業(yè)的特定應(yīng)用服務(wù)的注重響應(yīng)時(shí)間,數(shù)據(jù)的平安性和完整性。
用以支持經(jīng)營管理中的決策制定過程,而數(shù)據(jù)倉庫則是面向主題的集成的不可更新的穩(wěn)定性)隨時(shí)間不斷變化(不同時(shí)間)數(shù)據(jù)集合。主要用于分析型處理(也叫信息型處置)分析型處置則用于管理人員的決策分析,經(jīng)常要訪問大量的歷史數(shù)據(jù)。
二、數(shù)據(jù)倉庫的基礎(chǔ)知識(shí):
1.數(shù)據(jù)倉庫概念始于上世紀(jì)80年代中期,首次出現(xiàn)是在被譽(yù)為“數(shù)據(jù)倉庫之父”WilliamH.Inmon的《建立數(shù)據(jù)倉庫》一書中。隨著人們對(duì)大型數(shù)據(jù)系統(tǒng)研究、管理、維護(hù)等方面的深刻識(shí)認(rèn)和不斷完善,在總結(jié)、豐富、集中多行企業(yè)信息的經(jīng)驗(yàn)之后,為數(shù)據(jù)倉庫給出了更為精確的定義,即“數(shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題的、集成的、與時(shí)間相關(guān)的、不可修改的數(shù)據(jù)集合”。數(shù)據(jù)倉庫并沒有嚴(yán)格的數(shù)據(jù)理論基礎(chǔ),也沒有成熟的基本模式,且更偏向于工程,具有強(qiáng)烈的工程性。通常按其關(guān)鍵技術(shù)部份分為數(shù)據(jù)的抽取、存儲(chǔ)與管理以及數(shù)據(jù)的表現(xiàn)等三個(gè)基本方面。
數(shù)據(jù)倉庫的重點(diǎn)與要求是能夠準(zhǔn)確、安全、可靠地從數(shù)據(jù)庫中取出數(shù)據(jù),經(jīng)過加工轉(zhuǎn)換成有規(guī)律信息之后,再供管理人員進(jìn)行分析使用。數(shù)據(jù)倉庫主要是應(yīng)用于決策支持系統(tǒng),其主要目的是“提取”信息并加以擴(kuò)展,用來進(jìn)行處理基于數(shù)據(jù)倉庫的決策支持系統(tǒng)(DSS)的應(yīng)用。
2基于數(shù)據(jù)倉庫的決策支持系統(tǒng)基于數(shù)據(jù)倉庫的決策支持系統(tǒng)(DSS)由三個(gè)部件組成:數(shù)據(jù)倉庫技術(shù)(Datawarehousing),聯(lián)機(jī)分析處理技術(shù)(OLAP,On—LineAnalyticalPro—cessing),數(shù)據(jù)挖掘技術(shù)(DataMining)。
聯(lián)機(jī)分析處理(OLAP,On—AnalyticalPro—cessing)是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對(duì)從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解的、并真實(shí)反映企業(yè)給特性的信息進(jìn)行快速、一致、交互地存取,從而獲得對(duì)數(shù)據(jù)的更深入了解的一類軟件技術(shù)。OLAP的目標(biāo)是滿足決策支持或多維環(huán)境特定的查詢和報(bào)表需求。數(shù)據(jù)倉庫側(cè)重于存儲(chǔ)和管理面向決策主題的數(shù)據(jù);而OLAP側(cè)重于數(shù)據(jù)倉庫的數(shù)據(jù)分析,并將其轉(zhuǎn)換成輔助決策信息。OLAP的一個(gè)主要特點(diǎn)是多維數(shù)據(jù)分析,這與數(shù)據(jù)倉庫的多維數(shù)據(jù)組織正好形成相互結(jié)合、相互補(bǔ)充的關(guān)系。問此,利用OLAP技術(shù)與數(shù)據(jù)倉庫的結(jié)合可以較好地解決傳統(tǒng)決策支持系統(tǒng)既需要處理大量數(shù)據(jù)又需要進(jìn)行大量數(shù)值計(jì)算的問題。
OLAP的多維數(shù)據(jù)分析主要通過對(duì)多維數(shù)據(jù)的維進(jìn)行剖切、鉆取和旋轉(zhuǎn)來實(shí)現(xiàn)對(duì)數(shù)據(jù)庫所提供的數(shù)據(jù)進(jìn)行深入分析,為決策者提供決策支持。多維結(jié)構(gòu)是決策支持的支柱,也是OLAP的核心。
數(shù)據(jù)挖掘(DataMining)是從大量的、不完全的、有噪聲的。模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。
數(shù)據(jù)挖掘可以看成是一種數(shù)據(jù)搜尋過程,它不必預(yù)先假設(shè)或提出問題,但是仍能找到那些非預(yù)期的卻令人關(guān)注的信息,這些信息表示了數(shù)據(jù)元素的關(guān)系和模式。它能挖掘出數(shù)據(jù)鍵潛在的模式(pattern),找出最有價(jià)值的信息和知識(shí)(knowledge)。指導(dǎo)商業(yè)行為或輔助科學(xué)研究。研究對(duì)象是大規(guī)模和超大規(guī)模的數(shù)據(jù)集合。
三:在建立數(shù)據(jù)倉庫時(shí)應(yīng)該注意的重點(diǎn)問題:
1.找清楚主題,主題是你的數(shù)據(jù)倉庫研究的一個(gè)大方向,如果你把這個(gè)都沒有弄清楚的話后面的工作都是白費(fèi)了。一般數(shù)據(jù)倉庫的主題就是客戶最關(guān)心的部分,是客戶的項(xiàng)目做好以后在運(yùn)行期間時(shí)常進(jìn)行操作和觀察的核心內(nèi)容。只要你在建立的前真正弄清楚了客戶的需求,一般主題的建立就不會(huì)出問題。
2.維度的建設(shè),說白了維度就是客戶的使用分析處理是的一個(gè)觀察角度,數(shù)據(jù)倉庫是多維的,也就是用戶在觀察的時(shí)候是從多個(gè)角度來觀察的。這就要求你在具體的多維數(shù)據(jù)建立前要把用戶的業(yè)務(wù)模型建立完備,一般這是一個(gè)迭代的過程,在建立好或修改好一個(gè)模型后最好和用戶溝通一下,然后根據(jù)用戶的要求再做相應(yīng)的修改,另外基礎(chǔ)數(shù)據(jù)庫里面的維度表也要同步,把實(shí)際用到的維度都能在數(shù)據(jù)庫里有所反應(yīng)。
3.維度層次的建立:維度層次其實(shí)就是用戶在觀察時(shí)能夠細(xì)化的單位,也可以說是一個(gè)范圍,它是用戶在進(jìn)行切片,上鉆,下鉆時(shí)的重要單位,在建立層次的時(shí)候首先是要搞清楚要有那些層次,這個(gè)通常是用戶要求的,然后在基礎(chǔ)數(shù)據(jù)庫建立的時(shí)候一定要把這些層次的順序弄清楚,現(xiàn)在的數(shù)據(jù)倉庫工具大多都是自動(dòng)對(duì)你提供的數(shù)據(jù)表進(jìn)行搜索而發(fā)現(xiàn)維度層次的,要是的建立基礎(chǔ)數(shù)據(jù)表的時(shí)候不注意可能你以后得出的結(jié)果就會(huì)錯(cuò)很遠(yuǎn)。
四:總結(jié):
1.找實(shí)習(xí)工作的認(rèn)識(shí):
我覺得實(shí)習(xí)其實(shí)就是一個(gè)從大學(xué)生活到工作的一個(gè)過度階段,學(xué)校和社會(huì)差別很大。有很多學(xué)生在學(xué)校里對(duì)自己以后工作的事想的少,準(zhǔn)備的少,一旦步入社會(huì)自己心里上一片空白,在實(shí)習(xí)時(shí)對(duì)于自己到底干什么工作,自己有什么專業(yè)技能也不是很清楚,最后總是過了很久快返校時(shí)才找到實(shí)習(xí)單位。我認(rèn)為實(shí)習(xí)很重要,因?yàn)閷?shí)習(xí)和正常上班沒有什么兩樣,如果實(shí)習(xí)時(shí)就沒有方向的話,以后工作了想找到方向會(huì)走彎路。還有對(duì)于大多數(shù)同學(xué)來說,先就業(yè),在擇業(yè)是最好的,畢竟自己在學(xué)校里接觸社會(huì)少,專業(yè)實(shí)際操作和運(yùn)用能力與實(shí)際工作要求還是有一定的差距,不要老想著自己一定要找到一份好工作,自己專業(yè)內(nèi)的工作,自己喜歡的工作,這樣是不切合實(shí)際的。
2.工作總結(jié):在日常的工作中也有很多小問題值得我們注意,我總結(jié)了一下幾條:
①最好每天都能做工作日記,早上上班前寫好自己在這一天的工作目標(biāo),工作中應(yīng)該注意的重點(diǎn)問題,有哪些事情是要問清楚主管的等。然后在每天的下班前在看一下自己當(dāng)天做了那些工作,哪些工作目標(biāo)沒有完成,為什么沒有完成,自己在以后的工作中應(yīng)該注意哪些問題……,這些將是很重要的,經(jīng)常看看會(huì)有很大進(jìn)步。
②在開發(fā)項(xiàng)目的時(shí)候最好每天都有一個(gè)備份機(jī)制,因?yàn)殡娔X出故障是時(shí)常發(fā)生的,如果沒有備份的話可能會(huì)發(fā)生前功盡棄的可能。
③在開發(fā)時(shí)遇到需求說明不是很清楚的地方一定要向上級(jí)主管問清楚,因?yàn)檐浖亲鼋o客戶用的,我們不能憑空想像,那樣開發(fā)出來的東西很有可能會(huì)返工。
④在工作中可能會(huì)碰到和你的頂頭上司發(fā)生矛盾的事,如果已經(jīng)發(fā)生了,你要想清楚為什么會(huì)發(fā)生這種事,這些事情能不能避免,如果能避免自己在日后的工作中就要多注意一些。
⑤在討論問題時(shí)要有自己的見解,不能人云亦云沒有見解。
⑥工作要踏實(shí),認(rèn)認(rèn)真真做。
⑦要多總結(jié),多交流。
以上就是我在數(shù)據(jù)倉庫實(shí)習(xí)期間自己的一些認(rèn)識(shí)和看法,可能還有很多東西自己平時(shí)沒有注意到,我也希望,祝愿每一位實(shí)習(xí)生包括我自己能夠在日后的工作中取得更大進(jìn)步。