智能搜索引擎在商業銀行大數據中的應用

時間:2022-10-13 10:23:24

導語:智能搜索引擎在商業銀行大數據中的應用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

智能搜索引擎在商業銀行大數據中的應用

摘要:本文針對商業銀行大數據中使用的目錄式搜索、關鍵詞搜索和模糊搜索自身存在的缺陷,闡述了基于自然語言智能搜索引擎應用于商業銀行數據搜索中的理論價值和實用價值,以及商業銀行應用的可行性、原則和方法途徑。

關鍵詞:智能搜索;商業銀行;大數據

大數據是商業銀行的歷史記憶,保存的目的是為了利用。如何在浩瀚的大數據中快速、準確查找利用是一個重要科研課題。隨著計算機在商業銀行的應用,數據信息已經實現了從手工查找到計算機獲取,極大地提高了查找利用效率。但由于目前使用的目錄式搜索、關鍵詞搜索和模糊搜索都存在很大缺陷,不能滿足快速準確查找利用大數據的需要。因此,本文僅在提高大數據搜索速度和準確率這個層面上,闡述基于自然語言的智能搜索引擎應用于商業銀行的理論價值和實用價值,以及商業銀行應用的可行性、原則和方法途徑。

一、商業銀行大數據檢索存在的缺陷

目前,商業銀行使用的搜索工具主要是目錄式搜索、關鍵詞搜索和基于關鍵詞組合模糊搜索。

(一)目錄式搜索的缺陷是完全依靠手工操作,效率低速度慢

目錄式搜索是一些管理軟件自身攜帶的一種目錄導航,是以人工方式或半自動方式建立起來的。目錄的用戶界面是分類結構,提供幾個類的入口,逐級向下查詢或者復合查詢,直至找到需要的類別和結果,其過程需要若干個手工步驟。用目錄導航可以找到需要的數據信息,其缺陷是完全依靠手工操作,需要人工按照分類一層一層填寫,逐層進入,耗時費力,工作效率非常低,檢索速度非常慢。

(二)關鍵詞搜索的缺陷是信息過載

基于關鍵詞搜索在搜索速度上克服了目錄式搜索的缺陷。但使用關鍵詞搜索,必須先在腦子里思考一下,想出一個清晰的關鍵詞,即要搜索什么?給出的關鍵詞準確,搜索結果才可能準確。否則,執行搜索以后返回的信息過多,相關信息和無關信息混雜在一起,必須從結果中逐一進行篩選。可謂你要一點水,它給你一條河甚至一片海,讓人耗費的時間無法接受。要減少信息過載,就需要輸入多個關鍵詞進行漸進式查詢,讓人感到使用不方便。

(三)關鍵詞組合模糊搜索的顯著缺陷是漏檢和準確率低

模糊搜索是建立在關鍵詞搜索理論基礎上的同義詞搜索,只要輸入關鍵詞,該關鍵詞的所有同義詞信息都被搜索出來,沒有人能夠看得完。測試表明,只使用一個關鍵詞模糊搜索,出現信息過載問題;如果輸入關鍵詞組合,由于受中文分詞語料庫的局限,必定存在信息漏檢的問題。如果搜索一個信息,需要一次又一次的輸入多個關鍵詞才能找到結果,有時還找不到。因此,模糊搜索在應用方面不能滿足使用者的需求。

二、商業銀行應用智能搜索引擎的理論價值

智能搜索引擎把自然語言和人工智能、云計算服務理論高度融合,使搜索過程由傳統的關鍵詞匹配提升為內容概念相互關聯的匹配,從而彌補了僅表達形式匹配所帶來的種種缺陷,使用者不必再拘泥于關鍵詞、標題、作者、時間、分類等傳統搜索方法,可以直接基于自然語言搜索,即搜即得。智能搜索引擎開創了一種新型的全文搜索方式,應用于商業銀行大數據搜索的理論價值是:基于自然語言搜索,智能返回搜索結果。包括但不限于以下詮釋:

(一)簡便

人們在日常生活和工作中的交流是用自然語言而非關鍵詞,與目錄式搜索、關鍵詞和模糊搜索相比較,基于自然語言搜索的優勢,在于人機交流更加符合語言習慣,像人與人之間的交流一樣直接、輕松,簡便,這無疑給用戶帶來巨大的便利。

(二)智能

智能搜索引擎采用全信息智能匹配方式,可以直接以自然語言輸入一句話或一段文字,甚至可以直接輸入一篇文章作“關鍵詞”進行搜索。搜索過程是一框式完成,已經遠遠超出了搜索框理論和應用的限制。

(三)快速

智能搜索引擎在百萬級(每份為1000字以內)信息中的搜索響應速度為毫秒,并行訪問的用戶數量不受限制,使用戶與其所需要的準確信息之間的距離只有點擊一下鼠標那么遠。

(四)準確

傳統搜索引擎的查全率和查準率不能兩全其美,查全率高時,查準率低;查準率高時,查全率低。智能搜索引擎采用自動分類聚類、自動過濾技術,自動過濾掉相關度較低和無用的信息,查準率可以達到95%以上,查全率100%。

(五)安全

智能搜索引擎內設安全機制,可以有效整合提取各數據源的數據權限,然后賦予到不同的文檔和對象上,按照使用者權限動態配置權限,顯示結果,保證密級信息按身份使用,不泄密。還可以根據需要設置其它安全控制功能。

三、商業銀行應用智能搜索引擎的實用價值

商業銀行應用智能搜索引擎的實用價值主要體現在:

(一)應用的可行性

智能搜索引擎可以使用現有的服務器等基礎設施設備,不需要丟掉現有的設備,重新投資購置新的設備。尤其不涉及系統兼容性、穩定性和數據安全性等相關技術問題。從使用者的角度看,盡管目前使用傳統搜索已經習慣了,但更希望使用智能搜索引擎,因為它快捷簡便,正如美國《連線》雜志主編,克里斯•安德森所說,“搜索引擎的誕生,極大縮短了人們查找信息的時間,最大化的提升了人們的工作效率。”如果把目錄式、關鍵詞搜索比如是固定軌道上的一列火車,那么智能搜索引擎就像一架飛機,它能朝著無數個方向前進,還能根據需要改變目的地。可見,其應用勢在必行,是大勢所趨。

(二)應用的穩定性

商業銀行應用智能搜索引擎的基本原則是,不改變現有的外網、內網和網上辦公等系統,在繼續保留現有的多種搜索工具和查詢方法,不影響現有系統的穩定性與可靠性和存儲能力與計算能力的基礎上,增加一個“智能搜索服務平臺”,使商業銀行傳統與先進的多種搜索工具并存共舞,優勢互補,切實實現大數據信息搜索簡便、快速、準確。

(三)應用的簡便性

智能搜索引擎可以連接商業銀行內多個信息源同步搜索,是可以定制的內部大數據搜索利器。在一個銀行內,可以應用智能搜索引擎把大數據信息、資料、內網、外網等多個應用系統鏈接在一個應用平臺上,以云計算網絡化服務方式實現無縫鏈接、互聯互通、資源共享與自由轉換。使用方法非常簡便,各種查詢都統一使用一個搜索框,以自然語言輸入關鍵詞,或者文檔的中心思想,或者印象較深的內容,一站式完成搜索,智能返回搜索結果,省時省力,即搜即得。綜上所述,智能搜索引擎應用于商業銀行大數據搜索,對于提高大數據的查找速度、查全率和查準率,對于充分發揮大數據的作用,對于跨時間和空間界限更大范圍實現大數據互聯互通、資源共享等方面,都具有十分重要的意義,必將備受關注,廣泛應用。

作者:宮偉 單位:中國工商銀行運行管理部