大數據挖掘在煤炭企業安全管理中的運用

時間:2022-04-14 10:14:30

導語:大數據挖掘在煤炭企業安全管理中的運用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

大數據挖掘在煤炭企業安全管理中的運用

摘要:從大數據環境下煤礦企業安全管理面臨的挑戰出發,應用大數據挖掘技術構建了煤炭企業安全管理體系結構。實現了數據的集中分析和深度挖掘,提升了信息利用的深度和廣度,是對大數據時代煤炭企業安全管理的有效探索。

關鍵詞:大數據挖掘;安全管理;煤炭企業;信息

煤炭企業安全管理在煤炭生產中占有重要地位。然而,煤礦安全事故涉及多參數、多目標、海量復雜的信息,如何及時、準確、有效地識別影響煤炭安全生產事故隱患、提升煤炭企業安全管理是當前研究和關注的熱點之一。伴隨大數據時代的到來,大數據挖掘逐漸滲透到各個領域,各行業紛紛加快大數據的應用規模,提升企業的競爭力。在此背景下,煤炭企業安全管理也應將關注點轉向大數據,提升信息利用的深度和廣度,對大數據時代煤炭企業安全管理進行創新式探索。

1大數據挖掘概述

(1)大數據大數據是指數據量超過傳統數據庫系統處理能力、數據規模和傳輸速度要求很高的復雜數據的集合。大數據的特點可概括為4個V,即Volume(體量大)、Variety(多樣化)、Velocity(生成快)、Value(價值大)。大容量是指需要進行分析處理的數據量非常浩大,使用傳統的數據處理工具往往不能在合理的時間內處理成預測趨勢和指導決策的信息;多樣化是指大數據包括來自不同領域、不同設備、不同平臺的各種類型數據;快速化是指對數據獲取、處理、分析和應用快速;高價值則是指挖掘出的知識對預測趨勢有重要作用,是指導決策的重要依據。大數據的特點表明,大數據有助于發現新事物、預測事物發展趨勢,也決定了原有的數據處理方式已不能適應大數據挖掘的要求,需要新的處理技術來有效地組織和使用大數據。(2)大數據挖掘技術大數據挖掘目標是將大容量數據轉換為有用的知識和信息,其關鍵技術主要包括數據采集、數據預處理、海量數據存儲、數據分析及挖掘和數據的呈現與應用。大數據的采集、預處理與存儲技術大數據的采集技術既包括通過數據傳感設備、智能識別終端及資源接入系統等實現對海量數據的識別、接入、傳輸、監控、初步處理,又包括提供大數據的一些平臺,如數據庫、ERP系統等。預處理技術主要包括數據清理、集成及變換。數據清理可去掉噪聲數據及異常數據,糾正數據中的不一致,可以采用傳統數理統計方法實現。數據集成從來自不同數據源的數據中提取出關系和實體,經過分類、關聯或聚類后采用統一的結構來合并成一致的數據存儲。數據變換可以將不同度量下的數據歸一化,使得數據的應用有意義。大數據存儲的關鍵技術是分布式文件存儲系統。該系統由若干個分布集群組成,1個分布式集群一般由1個主服務器和大量的塊服務器構成,許多用戶可以同時訪問。大數據的分析技術目前大數據的分析方法主要有并行計算、實時計算或流式計算。并行計算是指同時使用多個計算資源完成運算。其基本思想是將問題進行分解,由若干個獨立的處理器完成各自的任務,以達到協同處理的目的。已涌現出大量挖掘算法能運行于并行架構上,如非平凡策略、基于核函數的挖掘算法、傳統的數理統計方法和并行結構相結合算法等。實時計算處理通過建立新的概要數據結構以近似表達數據流,并使用傳統的挖掘算法對概要數據結構進行分析,獲得近似的數據挖掘結果。獲得概要數據結構方法有直方圖、哈希技術、隨機抽樣、小波變換等。目前應用廣泛的實時計算或流式計算方法大多是采用二層框架的模式,在線部分計算數據概要信息,離線部分進行數據挖掘。

2大數據環境下煤礦企業安全管理面臨的挑戰

(1)數據存儲和預處理能力難以滿足大數據量要求龐大的數據量的存儲和預處理不能通過簡單地升級原有服務器的方法來解決,要有具有可擴展性和容錯能力的數據存儲框架和預處理平臺。(2)復雜的數據類型對數據融合提出了挑戰安全事故的發生是多種因素共同作用的結果,需要分析多方面數據:一方面要獲取更多的數據,對比不同環境下哪些變化與事故的發生相關;另一方面要進行歷史數據對比。目前,雖然在時間上采樣率不斷提高,但是在空間上監控監測數據還很不完備。同時,各個系統數據標準不一致,難以在縱向和橫向上實現數據的融合。(3)數據的處理難以滿足高實時性要求廣泛分布的遠程站點高速、連續地產生異構的數據,要求實時完成對新到達數據點的處理。這就要求大數據挖掘系統能動態適應業務分析需求,快速響應復雜的查詢,具備實時的分析處理能力,而傳統的數據處理技術只能處理小規模的數據流。(4)大數據挖掘結果需要有效的可視化手段大數據挖掘的最終目的是將信息呈現給用戶。目前我國煤炭企業既懂各領域專業知識,又懂數理統計,還懂業務流程、信息技術的復合型人才極其匱乏,安全管理人員往往無法正確理解抽象的數據挖掘結果所蘊含的信息。

3基于大數據挖掘的煤炭企業安全管理體系

(1)數據采集層數據采集層實現了大數據收集工作。通過各類傳感器、視頻監測系統、智能終端、生產過程控制、操作臺、自動記錄系統等技術設備和平臺,數據采集層收集大量異構數據,為數據挖掘的后續工作做好準備。(2)數據預處理層數據預處理層需要完成對數據的清洗、集成和變換。異常數據可以采取移動平均線或自回歸模型等數據分析方法得到估計值進行替換;噪聲數據要使用濾波或小波消噪等處理方法;缺失數據可采用平滑處理方法補齊。預處理后的數據存儲在以云計算技術為基礎的存儲框架(數據倉庫)中,在數據挖掘之前使用。(3)數據挖掘層經過預處理層處理的數據,通過OLAP技術來進行初級分析,以支撐復雜的深度挖掘過程。鑒于煤礦安全事故預警對數據實時性要求很高,可以將相關大數據分為實時性數據和非實時性數據,采用流處理和批處理相結合的方式進行挖掘。對于非實時性數據,采用基于分布式文件系統如NoSQL數據庫和云計算平臺如Hadoop來進行數據處理。對于如瓦斯濃度、瓦斯涌出量等實時監測數據,可以在云平臺前面設置若干前置機用于實時接收數據,同時通過實時或流式計算技術,將全部數據概要表示并通過內存進行計算。

(4)數據展示層可視化數據展示層主要包括3個部分:通過數據可視化軟件來表達數據中的復雜信息;將可視化結果根據不同內容和需求呈現在移動終端、PC和各類信息系統上;用戶通過操作界面與數據交互,并對其進行進一步的分析。

4結語

煤炭企業安全管理涉及眾多因素及分析方法,數據越多,分析范圍越大,決策越有科學性。因此,需要廣泛拓展數據資源,獲取豐富的信息,需要利用大數據挖掘技術來挖掘與煤炭企業安全管理的所有關聯,在效率、質量和空間等諸多方面滿足安全管理要求。隨著國家層面對信息化和安全事故的重視,在煤炭企業安全管理領域利用大數據挖掘技術和大數據思維來實現數據集中分析和深度挖掘將是未來發展方向。

作者:李颯 單位:遼寧石油化工大學經濟管理學院

參考文獻:

[1]肖樂樂,魏久傳,牛超,等.中國煤礦事故相關性因素分析研究[J].煤炭技術,2015,34(1):349-351.

[2]廖建新.大數據技術的應用現狀與展望[J].電信科學,2015,31(7):7-18.

[3]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,50(1):146-169.

[4]于富東.大數據平臺的關鍵技術及組網方案[J].電信科學,2015,31(7):164-169.

[5]宋亞奇,周國亮,朱永利.智能電網大數據處理技術現狀與挑戰[J].電網技術,2013,37(4):927-935.