醫院信息管理數據挖掘論文
時間:2022-03-26 04:38:59
導語:醫院信息管理數據挖掘論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
1數據挖掘及其關鍵技術
數據挖掘技術是當前數據分析和處理領域一項十分重要的技術,具體而言數據挖掘技術可以看成是信息技術不斷發展和演進的結果,是在人們對于數據庫技術不斷發展和創新的基礎上發展而來的。在初期階段,商業數據往往只是簡單的進行存儲,然后有了對相關數據的查詢功能,再繼續發展為對相關數據的即時遍歷。數據挖掘技術使得數據查詢已經不僅僅局限于數據本身,同時還可以通過相關的算法和技術發現數據之間潛在的關聯性,從而在很大程度上增加了數據利用的深度和層次。隨著當前大數據時代的到來以及高性能計算機和數據挖掘算法的成熟,數據挖掘技術開始在商業領域進行應用,并且取得了快速的發展。在目前的醫院信息管理系統中已經積累了大量的數據信息,因此如何實現對這一部分信息的深層次數據挖掘是至關重要的,這也將直接決定著醫院將來的發展和命運。在醫院信息管理系統中應用數據挖掘技術可以在更深層次上對醫院的管理數據進行分析,從而可以為醫院從業人員的相關決策、管理以及研究提供更加有力的技術支持。因此數據挖掘技術在醫院信息管理系統中的應用具有十分重要的意義。在目前的數據挖掘技術中,其關鍵技術是數據的預處理。當需要進行分析的數據庫包含大量的噪聲或者存在數據不一致性時,數據預處理就顯得更加有必要。根據對相關數據挖掘過程的統計顯示,超過一半的時間用于進行數據預處理,而真正用于數據信息挖掘的時間則僅占到10%左右。目前的數據預處理技術主要分析對數據的清洗、集成、轉換以及消減等。另一關鍵技術是匿名化以及轉換技術,這主要是由于在目前的醫院信息管理中涉及到病人的隱私問題,因此在進行數據處理的同時需要對患者的相關記錄進行匿名化處理,以更好的保護患者的個人隱私。
2基于數據挖掘技術的醫院信息管理系統
2.1基于數據挖掘技術的醫院信息管理系統
關聯規則是目前進行數據挖掘的重要手段,在醫院信息管理系統中引入關聯規則可以進一步發現數據之間的相互關聯,并且在對病人的相關數據的分析和進一步挖掘過程中,嘗試分析患者年齡與醫療費用之間潛在的關聯,并且進一步通過這種關聯關系加強對醫院資源的合理優化配置,實現對不同年齡段患者的醫療費用的有效控制,進而實現醫院效益的最大化。具體而言,將關聯數據集合記為D{=t1,t2,...tn},tk={i1,i2,im..ip},tk為數據庫中的事務,im為數據庫中的項。在數據集合D中,其包含的集X的項數為集的支持數,將其記為σx,支持度為suppor(tX),則有suppor(tX)=σx/|D|×100%。假設X和Y為數據庫集合D中的項集,則有:假如XY,則有X項的支持度大于Y項的支持度,同時假如X是非頻繁項,則此時Y項也是非頻繁;則假如Y項是頻繁的,則X項也是頻繁的。在數據挖掘的關聯規則中有兩個至關重要的概念,即支持度與置信度。通常而言,支持度只要用于衡量采用的關聯規則的可信度,而置信度則用于表示在生成數據集中關聯規則的統計角色。在實際的應用過程中,假如support(XY)大于支持集,并且置信度大于最小置信度,此時XY可以稱之為強規則,否則將其稱之為弱規則。在數據挖掘的過程中,尋找強規則是整個數據挖掘過程的關鍵。在強規則XY所對應的項集中,必定存在著頻集。基于關聯規則的數據挖掘模型如圖1所示,其中主要包括數據集D、關聯規則搜索算法、數據挖掘結果R以及用戶與數據挖掘之間的交互,對相關的數據挖掘結果信息結果進行合理的評價。在實際的關聯規則數據挖掘過程中還需要考慮到以下兩個方面的問題:其一,盡量減少I/O操作的次數,這主要是由于數據挖掘過程中的數據量是非常大的,因此頻繁的進行I/O操作將會對數據挖掘的效率產生很大的影響,其根本的方法就是減少對于數據庫集的掃描頻率和次數;其二,避免候選集中項的數量過大,這主要是由于過多的項數將會使得存儲空間被大量占用,從而對數據挖掘的效率產生影響。
2.2基于數據挖掘技術的醫院信息管理系統的實現
數據準備階段。在研究過程中采用某醫院信息管理系統中的口腔潰瘍數據進行挖掘分析,其中數據準備階段主要包括集成、清洗以及轉換三個階段。具體而言,數據集成主要是將不同的患者數據表格及其費用數據整合到一起,并且對這些原始數據進行集成,將其集成到統一的數據表格中,其中主要包含患者的性別、年齡以及編號等信息。數據清洗指的是對原始數據進行進一步的處理,其目的是去除原始數據中的噪聲以及不相關信息、補充遺漏數據、去除白噪聲等,并且根據實際情況完成對原始數據的轉換。同時,由于醫院信息數據存在著其特殊性,醫院的數據往往產生于不同的場所,因此其產生的過程較為復雜,這就極易導致數據產生的過程中出現遺失或者出現數據錯誤的情況,因此數據清洗階段對于醫院數據挖掘工作是至關重要的,同時為了更好的保證數據清洗階段的準確性可以實行專業醫護人員監督的模式,此種模式可以有效的降低數據清洗過程中的差錯。數據轉換是針對數據的不同特征對數據進行有效的轉換,其中主要的手段包括對數據的規格化處理、數據信息歸納、旋轉等。結合實際的醫院信息管理系統數據挖掘案例,可以對年齡數據信息進分段編號處理,以更好的提高數據挖掘的效率。同時,在數據轉換的過程中還可以將一些沒有意義的數據進行刪減,以更好的保證數據挖掘的效率,同時還可以降低數據挖掘的誤差。
3結束語
現代化醫療事業發展關系到國計民生,在我國的社會主義發展過程中占到舉足輕重的位置。而信息化程度的提升對于推動現代化醫療事業發展具有十分重要的意義,基于數據挖掘的醫院信息管理系統能夠有效的提升醫院資源配置水平、提升醫院效益。
作者:沈旴亮單位:南京醫科大學附屬南京婦幼保健院