商業銀行客戶數據管理水平研究

時間:2022-10-20 08:45:02

導語:商業銀行客戶數據管理水平研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

商業銀行客戶數據管理水平研究

摘要:為提高商業銀行大數據平臺用戶數據管理效率,在對用戶業務數據種類劃分、相關屬性和對應數據子集合關聯的基礎上,定義銀行客戶賬戶和對應日志數據外表,采用關系數據平臺關聯技術組織客戶數據,并基于客戶賬號實現客戶數據的關聯管理。在分析樣本客戶關聯業務數據表的基礎上,設計一個有相同賬號且包含多個流水數據的物理存儲子集,通過測試程序對客戶業務主表和日志外表進行聯合訪問。結果表明,該技術縮短了目標數據檢索時間,提高了數據管理效率。

關鍵詞:商業銀行;用戶數據;關聯技術

為滿足商業銀行大數據平臺上不同職能部門服務創新、客戶評價、精準營銷、業務實時跟蹤和事后稽核的需要,需對特定客戶對象(或客戶子集)有關業務的數據進行檢索和更新,以支持不同部門的業務開展?;谄脚_簇技術,對有代表性的客戶對象數據進行關聯操作,能提高職能部門工作效率,保證向決策部門提出的業務評價更科學??蛻粼谄脚_上辦理業務所產生的業務數據,銀行要依據業務種類進行分類,然后依據總賬、分類賬及永久數據和臨時數據的相關原則完成有序處理。對于銀行不同職能部門需要的業務數據,在實現數據倉庫對應邏輯對象設計時,需要先創建客戶賬戶,再建立客戶多個有業務聯系的邏輯對象的數據上的關聯關系,并將有同一賬號屬性值的多個邏輯對象的數據物理存儲在磁盤同一或若干個相鄰的磁盤塊,采用數據平臺關聯存儲技術進行管理,實現商業銀行客戶數據關聯存儲方案的建立。商業銀行客戶數據關聯存儲方案是將個性化客戶在辦理業務過程中所產生的多種業務數據,以賬號進行記錄分組,差異化地整合后分別存儲在一個指定或若干個地址連續的磁盤塊上,從而實現依據客戶對象不同和銀行業務數據劃分原則,優化客戶子集數據存儲的目標。

1商業銀行客戶數據關聯

客戶數據關聯應用是大數據平臺數據管理的一種技術,可以提高客戶數據處理效率。在商業銀行數據處理時,經常需要特定目標客戶(目標客戶群)在賬號鍵值確定的情況下,完成對多個邏輯對象的數據操作,有選擇地完成數據批處理過程可以滿足商業銀行不同職能部門對數據操作的需求[1]。在創建存、貸款和中間業務客戶賬戶邏輯對象時,對于個性化同一業務種類的客戶,創建邏輯對象關聯的基本指導思想是:首先分析客戶目標對象業務性質差異、元數據子集的業務性質;其次采集所有管理部門在業務辦理和目標數據操作上對系統功能、性能的具體指標要求,再依據業務數據生成、流向時序,無具體部門業務痕跡地設計客戶對象在數據流的不同階段的邏輯對象,實現多個邏輯對象中所標識的客戶對象是同一賬號業務數據的集合,從而實現客戶多個業務數據集合中公有賬號(或子集)集合的創建。創建客戶同一賬號(關聯屬性)多個邏輯對象的關聯關系,建立商業銀行客戶數據關聯方案。大數據平臺技術的商業銀行客戶數據關聯方案是根據賬號鍵值的不同,參考對應邏輯對象設計原則,由平臺獨立確定客戶數據存儲定位并完成數據存儲。平臺的這種技術首先能準確體現商業銀行不同應用領域的數據特性,便于管理方宏觀上的統計與決策,同時還能表現出多種邏輯對象之間的客戶整體性關系,將商業銀行業務領域的個性化需求同大數據平臺數據管理系統的大量、高速、多樣和真實等特點結合起來,實現了由特殊到普遍、個性到共性的演繹抽象過程。商業銀行不同的管理部門在訪問客戶數據時,依據部門任務需求的差異,由關系數據庫的數據庫管理系統,在分析客戶賬號的基礎上,檢索確定客戶數據磁盤存儲定位,依據數據庫頭塊地址表完成對多個關聯邏輯對象所對應物理存儲塊的數據訪問,有效減少管理部門在檢索平臺上不同種類邏輯對象,且反映于同一客觀對象相關屬性數據的時間[2]。

2商業銀行零售業務用戶數據

在商業銀行大數據平臺上使用簇關聯技術創建客戶邏輯對象。對于每個存、貸款和中間業務對象的基本賬戶數據,在賬號字段屬性值相等的情況下,系統會將隸屬于同一賬戶多個對象的對應數據記錄自動存儲在磁盤同一個或相鄰的若干個磁盤塊上,實現同一賬號的所有基礎和衍生數據存儲在相同或相鄰數據塊,提高管理部門在數據平臺上對其進行檢索和更新處理時的工作效率。在大數據平臺上,分布存儲的節點工具如果采用ORACLE數據庫系統,對關聯邏輯對象的空間定義是利用表空間關聯參數size來完成,通過對這個參數值的設計,確定ORACLE存儲節點關聯空間尺寸,在實際應用中,每個銀行客戶數據關聯方案的客戶關聯賬號值同參數size所確定的磁盤塊的存儲單元相對應。商業銀行大數據平臺可以將所有采用簇技術的關聯磁盤塊的大小規定為1kB,基本上能夠滿足同一個客戶辦理存、貸款和中間業務所產生的基礎、衍生數據存儲的需要。數據平臺可以完成在指定關聯方案下對客戶不同邏輯對象間關聯數據記錄的集中存儲[3]。

2.1商業銀行本、外幣主賬戶結構分析

以某家商業銀行本、外幣活期主賬戶結構為例,分析目標數據結構組成和邏輯關系。當前,大部分商業銀行對本、外幣的業務處理主要是以活期主賬戶為管理對象來完成的??蛻粼谵k理業務過程中,首先需要在經辦行開立一個活期主賬戶,以后發生的所有業務的數據都需要依附于本賬戶而存在,商業銀行會根據不同業務的屬性,利用大數據平臺將有關數據分門別類地存放在對應業務的數據集合中,系統能夠處理的客戶數據種類包括本、外幣活期主賬戶數據、賬戶日常存取業務歷史記錄數據、賬戶年度利息數據和凍結(解凍)、掛失(解掛)、換折等非常規操作的數據等。對于上述有關聯的數據集合,可以采用數據簇管理技術,以客戶賬號為索引鍵,創建單位是1kB的關聯塊空間,并將上面有關業務種類的數據存儲在磁盤的一個連續存儲區,提高大數據平臺在客戶賬號確定后對其相關數據檢索的訪問速度。

2.2創建商業銀行本、外幣主賬戶邏輯對象

(數據表)在ORACLE數據平臺上,用戶登錄平臺客戶端,在SQL提示符下,分別創建有簇管理功能關聯關系的主賬戶數據表和賬戶日常存取業務歷史記錄數據表[4]。(1)創建本、外幣主賬戶表和賬戶日常存取業務歷史記錄數據表的關聯簇集主賬戶數據表LOCAL_FOREIGN_CURREN-CY_TABLE、賬戶日常存取業務歷史記錄數據表DAILY_D_W_TABLE分別用來存儲商業銀行客戶主賬戶數據和隸屬于該賬戶的歷史交易流水數據,實驗所用數據分別如表1和表2所示。表1中11個字段分別表示賬戶種類、賬號、戶名、客戶號、支取方式、存折歷史狀態、開戶行、聯系電話、存折印刷號、開戶日期和銀行簽章;表2中9個字段分別表示流水記錄賬號、流水記錄日期、流水記錄交易種類、流水記錄幣種、流水記錄支出發生額、流水記錄存入發生額、流水記錄余額、流水記錄操作員號和流水記錄序號[5]。在關聯存儲中,表1、表2中字段A_C_NO的名稱和類型定義必須一致.

3大數據平臺簇技術的應用

為便于討論,在大數據平臺完成上面2個空數據表的建立并設定實驗平臺已經存在且同表1、表2結構相同,分別命名為LOCAL_FOREIGN_CUR-RENCY_TABLE_old和DAILY_D_W_TABLE_old的2個表,并存有表1、表2中數據的2個非簇表,分析2對數據表在存儲相同數據時的磁盤位置變化。

3.1將2個非簇表的數據分別插入已建簇表

altertableDAILY_D_W_TABLEdisablecon-straintLOC_FK,終止DAILY_D_W_TABLE外部關聯。truncateclusterCLUSTERLOCAL_FOR-EIGN_CURRENCY_DEPOSIT_WITHDRAW_CLUSTER,截斷已經建立的關聯關系。向DAILY_D_W_TABLE表中添加一個字段,以滿足驗證需要:AltertableDAILY_D_W_TABLEenablecon-straintLOC_FK,重建DAILY_D_W_TABLE外部關聯[6]。利用數據平臺原有LOCAL_FOREIGN_CUR-RENCY_TABLE_old和DAILY_D_W_TABLE_old2個表數據,用SQL向2個關聯表批量插入記錄,命令如下:insertintoLOCAL_FOREIGN_CURRENCY_TABLEselect*fromLOCAL_FOREIGN_CURRENCY_TA-BLE_oldinsertintoDAILY_D_W_TABLEselectDAI-LY_D_W_TABLE_old.*,’*’fromDAILY_D_W_TABLE_old。

3.2分析兩類數據表存儲狀態的變化

首先分析平臺上沒有使用簇技術的一對舊數據表,如果DAILY_D_W_TABLE_old和LOCAL_FOREIGN_CURRENCY_TABLE_old數據記錄中A_C_NO字段值相同的記錄,不存儲同一個磁盤塊,則在命令輸出項“F”下標記一個‘*’,數據庫參數DBMS_ROWID.ROWID_BLOCK_NUMBER標識磁盤塊編號,利用命令輸出研究2種數據表存儲塊號的變化,實驗設定、命令執行和輸出如下:selectLOCAL_FOREIGN_CURRENCY_TA-BLE_old_blk,DAILY_D_W_TABLE_old_blk,casewhenLOCAL_FOREIGN_CURRENCY_TABLE_old_blk<>DAILY_D_W_TABLE_old_blkthen'*'endflag,A_C_NOfrom(Selectdbms_rowid.rowid_block_number(LO-CAL_FOREIGN_CURRENCY_TABLE_old.row-id)LOCAL_FOREIGN_CURRENCY_TABLE_old_blk,dbms_rowid.rowid_block_number(DAI-LY_D_W_TABLE_old.rowid)DAILY_D_W_TA-BLE_old_blk,

4結論

大數據實驗平臺操作結果顯示,使用普通關系數據庫數據表存儲有關聯關系的用戶數據,2個舊表數據存儲在不同塊內;使用大數據關聯技術以后,原數據表數據完全存儲在同一磁盤塊。當業務需要對指定的客戶信息進行檢索和更新時,大數據平臺可以快速地在磁盤指定的盤快或若干個相鄰的磁盤塊(如果關聯數據較多)完成目標數據檢索,降低了大數據檢索在尋址階段的資源開銷,提高了系統檢索效率。

參考文獻

[1]崔超.校園一卡通系統中學生關聯信息的應用研究[J].北京石油化工學院,2018,6(2):37-40.

[2]洪源,王秀美,李燦華,等.面向對象數據庫的邏輯設計方法[J].北京科技大學學報,2001,23(4):382-385.

[3]張婧.面向對象數據庫探析[J].硅谷,2011(5):1-4.

[4]陳文瑋.數據倉庫與數據挖掘教程[M].北京:清華大學出版社,2006.

[5]王寧,王能斌.面向對象數據庫中的數據依賴和規范化[J].東南大學學報:自然科學版,1997,27(5):45-52.

[6]劉光遠,石冰心.面向對象數據庫在電信網絡管理中的應用[J].科學技術與工程,2004,4(8):679-693.

[7]馬曉冬.基于銀行客戶數據分析的用戶畫像系統設計與實現[D].成都:電子科技大學,2020.

[8]李岳昌.基于代價聚簇的城市路網移動對象索引技術[D].南京:南京郵電大學,2015.

[9]張學琴.數據倉庫中聚簇索引優化[J].西北民族大學學報(自然科學版),2007(3):42-46.

[10]孟軍,李建強,張大鯤.應用聚簇索引的多連接查詢優化方法[J].大連理工大學學報,2003(S1):186-189.

作者:崔超 馬卉宇 單位:齊齊哈爾大學計算機與控制工程學院