數據挖掘在商業領域的運用
時間:2022-12-31 09:27:18
導語:數據挖掘在商業領域的運用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
1數據挖掘的過程
數據挖掘的過程可以理解為以下幾個步驟。第一步,數據清理,解決數據的不一致問題、平滑噪聲、補充缺失數據、識別并刪除離群點。第二步,數據集成,把來自多個文件、數據立方或者數據庫中的數據組合在一起。第三步,數據選擇、分析、提取數據庫中與任務相關的數據。第四步,數據變換,通過數據平滑、匯總、聚集、泛化、規范化、屬性構造等操作提高對高維數據的理解,把數據變換統一成適合進行數據挖掘的形式。第五步,數據挖掘,選擇合適的數據挖掘算法智能的提取出有用的信息或模式。數據挖掘在于發現有價值的模式,總體來說,數據挖掘的目的可以分為兩類:描述性和預測性。描述性挖掘任務用于表示目標數據中數據的一般性質,包括分類、聚類、關聯分析、異常檢測等,預測性任務在匯總后的數據上進行歸納,作出預測,包括回歸、分類等。第六步,模式評估,根據某種度量確定出某些有趣的模式,或由專家來評定其價值和正確性。第七步,知識表示,使用可視化等信息表示方法,向用戶展示挖掘出的有用信息和結果分析。以上的步驟是進行數據挖掘的一般過程,對于不同的應用分析過程也不盡相同,在商業領域中,面對來自商業的各種不同的分析任務,首先應該理解該應用領域,對數據分析的背景有一個很好的理解,然后盡可能的按照所需信息進行信息的收集工作。
2數據挖掘在商業領域中的重要應用及分析
零售業是非常適合的數據挖掘的商業領域之一,因為它包含了大量的銷售記錄、顧客購買記錄、貨物運輸記錄等大量的原始信息,為數據挖掘提供了豐富的資源。分類和預測技術在市場分析、供應和銷售方面為商務智能提供預測分析;聚類可以在客戶關系管理方面,根據顧客的相似性把顧客進行分組以便進行更多的后續分析。數據挖掘在商業上的應用具體在以下幾個方面:第一,幫助設計和構造數據倉庫,由于商業領域中信息范圍太大,數據庫的設計也存在許多方式,我們可以使用數據挖掘演練結果指導數據庫的設計方便以后的使用和后續分析處理。第二,對顧客需求、產品銷售、趨勢等構造復雜的數據立方體,提供多維分析和可視化工具。第三,根據顧客購買記錄,使用序列模式挖掘顧客的消費變化,分析顧客的忠誠程度。第四,產品推薦和商品的交叉推薦,通過銷售記錄挖掘關聯信息,這類信息可以形成產品推薦,也可以根據其他顧客的購買意愿產生個性化購買服務。第五,通過多維分析、聚類分析和林群點分析可以識別可能的欺騙者和他們的習慣模式,檢測通過欺騙進入或未經授權訪問個人或組織的賬戶企圖,發現可能需要特別注意的不尋常模式。使用數據挖掘技術,可以更好的理解每組顧客的行為特征,開發制定銷售計劃。
3數據挖掘的典型分析方法
3.1特征化和區分
數據特征化就是簡潔的匯總目標數據的一般特征。在商業活動中,公司為保證自己的正常運營和經濟效益要保證有一定的客戶源。包括不斷發展新客戶,對已有客戶的消費行為和基礎信息作為基礎綜合考慮客戶的行為特征,對可能的客戶源加強推薦工作。
3.2頻繁模式和關聯規則
挖掘頻繁模式能找出大部分人的喜好,找出適用范圍更廣的有趣模式的關聯性和相關性。關聯規則若能同時滿足最小支持度閾值和最小置信度閾值,進一步發現關聯的屬性-值對之間的有趣的統計相關。關聯規則最早是用于解決購物籃分析問題,從購物籃數據中發現顧客的購買規律決定商品的擺放位置。還用于醫療中發現某些癥狀與某些疾病之間的關聯,為診斷提供更多依據。
3.3分類與回歸
分類可以找出描述和區分數據類的模型,以便接下來實現模型預測類標號以及預測位置類別的數據元素。決策樹、神經網絡是比較常見的用于分類的方法。相關分析是在分類和回歸之前進行,識別出顯著相關的屬性,其他不想管的屬性可以暫時不考慮。分類方法用于金融市場營銷、市場預測、信用評估、醫療診斷等方面。分類器還可用于預測某些產品的銷售情況、廣告的投放區域,以及保險業中評估客戶的信用等級。
3.4聚類(cluster)
與分類不同的是,分類需要一個類別屬性,而聚類不需要,它是將數據集劃分為由若干相似實例組成簇的過程,使得在同一個簇中數據相似程度最大化,簇間數據相異程度最高。是一種無監督的機器學習方法。涉及到的主要算法有K-means,EM算法和DBSCAN算法。聚類分析可以詳細的劃分市場,比如,基于客戶特征把客戶群進行劃分,房地產行業中對住宅戶型、地理位置等特征來鑒定一個城市的房產分組。
3.5離群點分析
前面討論的聚類、分類、關聯分析等方法的重點在于發現大多數數據所適用的常規模式。數據集中的數據中可能包含一些與其他數據一般行為不一致的點,這些數據就稱為離群點,大部分的離群點在一些有趣模式的挖掘過程中被丟棄,然而,在一些其他方面,可以直接將離群點單獨拿出來做分析。比如應用于災害氣象預報、欺詐檢測、藥物異常反應、網絡安全入侵檢測等領域。
4數據挖掘的分析軟件和展示工具
無論是數據分析、數據挖掘還是商業智能,在以后的應用中我們都有必要掌握幾種高效的軟件工具。對于商業領域中數據挖掘工作不僅要收集數據進行挖掘還要將結果以報表的形式展現給客戶。數據挖掘的工具可按應用分為幾個層次。數據存儲層:首先,我們需要存儲數據,能夠理解數據的存儲和數據的基本結構和數據類型以及SQL語句的基本結構和讀取等,常見的數據庫有Access、MySQL、SQLserver、DB2、oracle。報表層:數據存儲以后,我們要制作讓大部分人都能報表。比如CrystalReport水晶報表、Bill報表、Tableau報表。數據分析層:從長我們用的統計分析和數據挖掘工具,包括Excel、SPSS、Modeler、SAS、JMP分析。表現層:對分析挖掘以后的結果展現給客戶,即使非專業人員也可以明白,這樣的表現形式更加有價值,這個領域的軟件或工具非常有價值比如PowerPoint、Visio、SwiffChart、ColorWheel等。
5結語
數據挖掘用途廣泛,隨著近些年學術領域上進一步的研究,在商業活動和社會也在不斷應用和發展。在商業領域中,數據挖掘可以幫助我們更好的理解顧客、市場、供應和競爭對手等可以使得決策者進行有效的市場分析,做出明智的商務決策。
作者:趙凱 仁慶道爾吉 單位:內蒙古工業大學信息工程學院
- 上一篇:公司黨委民主生活會發言稿
- 下一篇:卷煙廠企業文化建設工作匯報材料