透析中醫藥科學數據建設的初步設想

時間:2022-05-16 05:55:00

導語:透析中醫藥科學數據建設的初步設想一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

透析中醫藥科學數據建設的初步設想

隨著科技部基礎性工作“醫學科學數據共享工程”的開展,中醫藥科學數據建設也從單一品種走到了全面發展的階段,并對整合全領域的資源提出了更高的要求。目前,中醫藥科學數據中心的建設,無論是在數據資源、建庫技術、建庫人才方面都有了一定的基礎,如何提高數據庫建設的整體水平和綜合服務能力,有效地管理科學數據,為中醫藥信息化科學研究提供充分的數據資源保證,是中醫藥科學數據中心今后應該深入研究的問題,也關系到中醫藥科學數據中心的可持續發展。筆者從以下幾個方面對中醫藥科學數據中心的建設進行探討。

1資源體系建設

資源體系的建設首先是資源調查,它是數據庫的建庫基礎,只有在全面掌握數據庫資源的基礎上,才可能對未來的工作進行規劃,對未來建庫的技術提出需求。目前,中醫藥科學數據中心已經完成了中醫藥科學數據資源手冊研制,但中醫藥科學數據中心受到人力、物力、財力的限制,較少開展真正切合實際的數據資源調查研究,比較隨機性較大,往往是找到什么樣的資源就做什么數據庫,申報項目也比較盲目,這些都給完成項目任務帶來了一些困難。如果我們能夠很好地開展資源調查研究,至少可以確定今后三五年的建庫目標,減少盲目性,也可為人才的培養把握一定的方向。

在資源調查的基礎上,要制定數據庫的建庫規劃,規劃應包括數據庫的建庫方法、建設時間及建設的技術準備。根據數據資源的不同屬性,分別提出不同的數據庫建庫方法,哪些數據庫要建成關系型的數據庫,哪些數據庫要建成結構型數據庫,哪些數據庫是全文型的數據庫,哪些數據庫是多媒體的,等等。哪些資源目前可建成數據庫,哪些還需假以時日等待數據資源的成熟,使之能夠很好地把握未來,對未來有所準備。

數據庫的建設要采用分步施實的方法。數據庫的建設是一個艱苦的過程,在調查資源規劃、數據庫的基礎上,還要有足夠的人力、物力、財力以及計算機技術的支持。采用分步實施的方法,充分討論實施的方案,哪些數據庫可在最短的時間內采用最簡單的方法就可建成,哪些數據庫目前可建,但成果需要長時間的建庫積累,哪些數據庫目前我們還沒有很好的方法,必須先進行計算機技術的探討。數據庫的建設必須追求完美性、實用性、真實性,不論是簡單的數據庫還是復雜的數據庫,要求我們在建庫的過程中少走彎路,建成一個使用一個,即使是在建設之初功能不夠完善,但是數據庫的設計必須合理,具有實用性。

2管理體系建設

中醫藥科學數據管理體系的建設分為3個方面。首先是項目管理體系的建設。隨著中醫藥科學數據中心的飛速成長,我們的數據庫建設已從單一的中醫藥文獻期刊數據庫,成為了多類型全方位的數據庫群,加強對數據庫群項目的科學管理已成為必須研究的問題。應該采用計算機技術對常態數據庫的與動態數據庫進行管理,動態數據庫多為復雜多數據集的關聯型數據庫,數據庫主管人員可以監測到自己所管理的數據庫的動態變化,但這種監測不直觀也不方便,服務器直接操作也影響數據庫的安全性,管理者與決策者無法監測數據中心的全部數據庫進展程度。加強計算機技術對數據庫科學管理的研究,建設數據庫科學管理體系,包括對動態數據庫與常態數據庫的監測、建庫程序運行監測等等,可最直觀地展示數據庫的進展,最大程度地減少人為干預。

其次為共建人員管理體系的建設,中醫藥科學數據中心經過多年的建設,現在已形成了全國近30家分中心200余人員的數據制作加工隊伍,目前每一個項目均形成了人員的三級管理制度,這種制度有效的保障了數據庫工作條塊清晰、互不干擾及各種數據的安全。同時,這種管理也具有很大的缺陷,條塊分隔明顯,難以統一管理,同一個人員參加多個數據庫的建設,沒有統一的權限,密碼賬戶多樣,給加工人員造成混亂。項目高層次管理人員無法統一管理,每個項目的人員管理互通性與共融性極差,不同的項目管理人員無法介入其它項目的工作,只能局限在自己所管理的項目,對其它工作了解甚少,也無了解的途徑。因此,加強共建人員管理體系的建設也是當務之急,要建立一個基于一個平臺上的人員管理體系,這個體系不僅要保留原有的數據庫條塊清晰、互不干擾、數據安全性好的特點,還要具有人員管理唯一性(各數據庫密碼賬號統一,或密碼賬號不統一但可查詢)、直觀性等特點。

第三為檔案文獻資原管理體系建設。中醫藥科學數據中心經過多年的建設,已形成了大量的技術檔案文件,這凝集了研究人員的大量心血,如各種課題項目申請書、預算書,成果申報書、各數據庫的技術文檔、各種程序的開發文件、各種數據庫加工制作培訓教材、各種總結等等。目前我們對已形成的文本文件進行了檔案管理,但大量的電子文檔還都散在不同的計算機上,沒有形成有效的管理,查詢整理非常困難。應該加強對檔案文獻資源管理體系的研究,對所有資料進行分級分類,確認保密級別,注意知識產權的保護,利用我們數據庫的建庫優勢,建設檔案文獻資源管理系統,研究存儲這些電子文件的方式,開發查詢檢索的方法,確立文件的等級制度,更有效地保護這些文件,更方便地查詢這些文件。

3標準規范及數據評價體系建設

中醫藥科學數據標準規范的研究是非常重要的一個方面,是科學數據共建與共享的前提,它的作用是在科學數據范疇內促進科學數據共建與共享的科學化、合理化和工程化,使數據庫工程建設在一開始就能夠自上而下地遵循規范化的途徑有序地進行,減少無效的建庫勞動,從而提高科學數據共享工程建設的效率。只有在統一標準的前提下,科學數據共享的總體目標才能夠有效地實現。科技部科學數據共享標準體系分為3方面:指導標準、通用標準和專用標準,共32項標準,這些均是管理性標準。目前我們已經研制了中醫藥科學數據元數據標準、中醫藥科學數據分級分類標準,但是還沒有詳細著錄所有數據庫的元數據,我們的分級分類標準是否合理,有待于實踐的檢驗。還要根據醫學數據中心總平臺管理性標準的研究進展,繼續研究相應的近30項管理標準。數據庫建設標準更是實際操作中不可缺失的重要內容,數據庫的建庫質量保證了數據庫的生命力,多年的實際工作也使我們體會到,標準的建設要密切結合數據庫的建設,只有和數據庫建設相融合的標準才有生命力。數據庫建庫加工制作標準的研究是一項長期的工作,只有在動態的加工數據庫的同時,才能不斷地完善標準、更新標準。標準詞的建設(包括臨床術語和語言系統)還需要深入探討標準顆粒度粗細問題,顆粒度太細導致數據過于分散,不能形成有效的查詢檢索結果,反之標準過于粗放,又影響數據的準確性,如何確定顆粒度粗細,這需要對數據進行深入研究。改變了標準,如何回朔以往的數據,如何將以往非標準化數據庫更改為標準化數據,也需要研制相應的程序,定期進行整理研究。

對現有數據庫進行評價是一個重要的方面,它關系到數據庫今后的發展方向與可持續發展問題。一個優良的數據庫并不應該由建庫人員主觀判斷,應該有一套評價體系,這個評價體系應遵循公正性、科學性、可操作性的原則,包括專家評價、一般用戶評價、決策層評價、自我評價等等。多年來我們除對個別數據庫進行過專家評價外,基本沒有形成一個有效的評價體系,這也不利于我們及早的發現問題,完善數據庫,擴充數據庫使用領域。建設有效的數據庫評價體系,將有助于中醫藥科學數據建設可持續性發展。

4共建與共享政策支撐體系建設

政策體系的研究包括數據資源政策、數據共享政策、資金政策、人才政策等等的研究,針對中醫藥科學數據庫研究過程中所產生的數據庫與擁有的科學數據資源,深入分析各種相關利益,如國家利益、集體利益、數據產出者利益、數據提供者利益、數據服務者利益等,通過政策與規范的研究和建設,實現科學數據最大程度地共享,最有效的知識產權保護,最佳的數據利用度和數據增值服務,最大程度的調動科研人員的積極性,充分發揮中醫藥科學數據資源在中醫藥科學研究中的巨大潛在作用。立足科學數據庫資源,研究制定數據共享的政策性的保障措施,建立政策層面的可行性數據共享保障體系,可為科學數據共享提供政策調控、法律規范和技術標準等各個體系的保障,從國家層面上統一規劃中醫藥科學數據庫的數據共享技術框架。

5服務體系建設

目前中醫藥科學數據中心服務體系建設是比較薄弱的環節,人力、物力各方面的投入不足,導致科學數據服務體系建設與研究的不足。服務體系的建設應包括服務方式與服務內容等方面。目前我們的服務方式有兩種,在線服務與離線服務,應重點研究導航方式、數據查詢方式、圖片與圖形展示方式、原始數據與數據集等查詢與利用方式的研究。

隨著數據庫建設水平的提高與數據庫建庫技術的提升,數據庫群整合的資源越來越豐富,越來越廣泛,目前我們已經提供了50多個數據庫的服務,隨著工作的進展,今后有可能提供上百個數據庫或數據集群,這些數據庫的種類有關聯結構型的、單表型的、多媒體、全文圖形等。要對數據庫內容的進行深入研究,哪些數據庫可成為一類,哪些數據庫可具有關聯性,檢索界面可分門別類多層次展示,利于擴展使用者的思路和聯想,繼續加強中醫藥科學數據本體查詢研究。

6技術與運行體系建設

科學數據庫系統平臺項目,主要基于計算機網絡與網格技術、元數據目錄技術等,實現對科學數據庫分布、異構的數據資源的共享、集成。科學數據庫系統平臺的建設任務主要包括三方面內容,即硬件環境建設、系統平臺軟件的開發、先進應用系統的開發。

科學數據庫系統平臺的維護分為硬件環境的維護、軟件系統的維護兩個方面。硬件環境的維護主要進行日常的硬件維護,包括對網絡設備、服務器、其它各類設備的維護。軟件系統的維護包括對軟件系統的更新、升級,軟件系統的性能調整,元數據目錄庫的備份、恢復等,以此保證整個系統的正常運行。

中醫藥科學數據庫的日常維護按照指定的《科學數據庫日常維護規程》進行,日常維護的內容包括運行環境的監控、軟件系統運行狀態監控、元數據目錄庫的備份管理、數據庫系統的備份管理等。日常運行維護應通過專門設計的運行支持系統來進行,可以監控系統的當前運行狀況,對數據備份、元數據備份等日常操作提供有效支持。

技術支持主要針對個建庫單位在數據庫建庫、數據庫日常維護過程中出現的技術問題提供有效的支持。主要包括在數據庫建庫中協助完成數據庫模式設計、應用系統結構設計、元數據建設等,在日常維護中對數據管理、數據備份提供技術指導,并在出現系統運行異常時進行更加有效的支持。

7小結

中醫藥科學數據建設應圍繞全面提升國家科技創新能力,實現推進現代化建設的國家目標,以科技創新為動力,以需求為導向,以政策法規為保障,實現科學數據資源的規范化管理與高效利用。以共享促進應用,最大限度地發揮科學數據的潛在價值,強化對科技進步與創新的支撐能力。