人壽保險行業(yè)應用管理論文

時間:2022-06-12 06:46:00

導語:人壽保險行業(yè)應用管理論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

人壽保險行業(yè)應用管理論文

摘要人壽保險行業(yè)在激烈的市場競爭中生成了大量的保單業(yè)務,如何對這些海量信息進行深層次的分析與挖掘,讓其發(fā)揮巨大的增值作用。針對這一問題,利用關聯(lián)規(guī)則挖掘技術從人壽保單數(shù)據(jù)中,分析投保人的各項特征與索賠的內在關系,所得到的結論對保險公司的業(yè)務發(fā)展具有重要的指導意義。

關鍵詞關聯(lián)規(guī)則;數(shù)據(jù)挖掘;人壽保險

1引言

近年來,數(shù)據(jù)密集型的保險行業(yè)經(jīng)過多年的運營,也已經(jīng)積累了海量的歷史數(shù)據(jù),這些數(shù)據(jù)是公司的重要財富。要從這些大量數(shù)據(jù)中獲取能給公司帶來無限商機的有價值信息,急需更高效的數(shù)據(jù)處理方法和技術。此時數(shù)據(jù)挖掘技術顯示出了它特有的優(yōu)越性。1

2關聯(lián)規(guī)則挖掘技術

數(shù)據(jù)挖掘(DataMining)是一個利用各種分析技術和工具從大量數(shù)據(jù)中提取有用知識的過程。它是一門交叉學科,把人們對數(shù)據(jù)的應用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。它包含很多技術與方法,其中關聯(lián)規(guī)則挖掘是一項非常重要的技術,是數(shù)據(jù)挖掘的一個主要研究方向。迄今為止,關聯(lián)規(guī)則挖掘已經(jīng)被應用到很多領域,例如零售業(yè)、市場營銷、醫(yī)學等,為各個領域的決策支持提高了一個有效的手段。

關聯(lián)規(guī)則挖掘是由R.Agrawal等人提出來的,關聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項之間某種潛在關系的規(guī)則[1],它的基本概念為:設為數(shù)據(jù)項集合,設D為與任務相關的數(shù)據(jù)集合,也就是一個交易數(shù)據(jù)庫,其中的每個交易T是一個數(shù)據(jù)項子集,即;每個交易均包含一個識別編號TID。設A為一個數(shù)據(jù)項集合,當且僅當時就稱交易T包含A。一個關聯(lián)規(guī)則就是具有“”形式的蘊含式;其中有,且。規(guī)則在交易數(shù)據(jù)集D中成立,具有支持度s,其中s是D中交易包含(即A和B二者)的百分比,這是概率P()。如果D中包含A的事務同時也包含B的百分比是c,則規(guī)則在交易數(shù)據(jù)集D中具有置信度c。這是條件概率P。即SupportP()=P(),ConfidenceP()=p()。

滿足最小支持度閾值和最小置信度閾值的關聯(lián)規(guī)則就稱為強規(guī)則。這兩個閾值均在0%到100%之間。挖掘關聯(lián)規(guī)則主要包含以下二個步驟[2]:

(1)發(fā)現(xiàn)所有的頻繁項集,根據(jù)定義,這些項集的支持度至少應等于(預先設置的)最小支持度閾值;

(2)根據(jù)所獲得的頻繁項集,產(chǎn)生相應的強關聯(lián)規(guī)則。根據(jù)定義這些規(guī)則必須滿足最小支持度閾值和最小置信度閾值。

3關聯(lián)規(guī)則挖掘技術在人壽保險行業(yè)中的應用

人壽保險行業(yè)在日常的經(jīng)營過程中,經(jīng)常會遇到這樣一些問題:如何能更好的理解客戶,挽留有價值的投保人,對不同行業(yè)的人、不同年齡段的人、處于不同社會階層的人的保險金額度該如何確定。這些問題都是影響公司經(jīng)濟運營的重要因素。為了更好的掌握投保人的特點及合理的制定保險金額度,可以利用關聯(lián)規(guī)則挖掘來發(fā)現(xiàn)投保人與索賠的關系,分析具有什么特征的投保人曾經(jīng)向保險公司索賠過。

3.1關聯(lián)規(guī)則挖掘的基礎數(shù)據(jù)

為了研究投保人與索賠的關系,我們從某城市一家人壽保險公司的歷史保單數(shù)據(jù)庫中提取出相關數(shù)據(jù),把其整合到關系表中進行關聯(lián)規(guī)則挖掘。下面的表1為整合之后的信息。

3.2基于概化的數(shù)據(jù)預處理

為了更好的進行關聯(lián)規(guī)則挖掘,要對表1中的基礎信息進行基于概化的數(shù)據(jù)預處理,具體的概化處理方法為:

①用符號A描述年齡,把年齡進行分段概化為:A1(£25歲),A2(25-35歲),A3(35-45歲),A4(³45歲)。

②用符號B描述性別,B1表示“女”,B2表示“男”。

③用符號C描述健康狀況,C1表示良好,C2表示一般,C3表示較差。

④用符號D表示工作單位,工作單位為外資企業(yè)的表示為D1,非外資企業(yè)的表示為D2。

⑤用符號E表示工資檔次,分別概化為:E1(高),E2(較高),E3(中),E4(低)。

⑥用符號F表示投保人是否曾向保險公司索賠過,F(xiàn)1表示曾經(jīng)索賠過,F(xiàn)2表示未曾索賠過。

3.3關聯(lián)規(guī)則挖掘過程

由關聯(lián)規(guī)則的概念和表2的概化結果,可得出項目集合為{A1,A2,A3,A4,B1,B2,C1,C2,C3,D1,D2,E1,E2,E3,E4,F(xiàn)1,F(xiàn)2},我們目的是要分析投保人的各方面情況和索賠情況之間內在的關聯(lián)規(guī)則。假設關聯(lián)規(guī)則的支持度至少為40%,置信度至少為80%。進行關聯(lián)規(guī)則挖掘過程如下:

(1)首先利用基于事物壓縮的Apriori算法找出頻繁項集如圖1所示。

(2)找出支持度至少為40%而且置信度至少為80%的強關聯(lián)規(guī)則。

由以上兩步我們得出的和索賠情況有關而且實用的強關聯(lián)規(guī)則為:(A4,B2,D1)→F1(置信度為100%,支持度為40%)此規(guī)則可解釋為投保單上年齡大于45歲,工作單位是外資企業(yè)的男性投保人,幾乎都曾經(jīng)向保險公司索賠過。

3.4關聯(lián)規(guī)則挖掘結果的指導作用

根據(jù)挖掘結果,我們分析原因,發(fā)現(xiàn)對于工作在外資企業(yè),年齡大于45歲的男性投保人來說,由于在外資企業(yè)工作壓力大,生活節(jié)奏快,同時45歲左右的中年男性正處于家庭負擔最嚴重階段,生活壓力也很大,這些因素導致這部分人群的健康狀況不好,因此索賠率也相對比較高,保險公司可以考慮相對提高對這部分人群的保險金額。此結論對于保險公司的增值服務具有重要的指導意義。

4結束語

本文利用關聯(lián)規(guī)則挖掘方法分析出了隱藏在人壽保險歷史數(shù)據(jù)背后的有效信息,然而關聯(lián)規(guī)則挖掘技術在人壽保險行業(yè)中的應用不只是文中提到的這幾個方面,例如利用關聯(lián)規(guī)則挖掘進行險種關聯(lián)分析,即分析購買了某種保險的人是否同時購買另一種保險。我們應該利用數(shù)據(jù)挖掘技術來分析人壽保險行業(yè)中的海量歷史數(shù)據(jù),進而從中獲取有意義的信息,并從中挖掘出業(yè)務的內在規(guī)律,以達到提高效益、減低成本、防范風險的目的。數(shù)據(jù)挖掘技術是具有廣闊前景的數(shù)據(jù)處理與分析技術,它將在有大量信息的保險行業(yè)中發(fā)揮不可估量的作用。

圖1頻繁項集的生成

參考文獻

[1]JiaweiHan.數(shù)據(jù)挖掘概念與技術,北京:機械工業(yè)出版社,2004.6:149—180

[2]陳文偉,黃金才.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘,北京:人民郵電出版社,2004.1:143—149

[3]吉根林,帥克,孫志輝.數(shù)據(jù)挖掘技術及其應用[J].南京師大學報,2000.23(2)

[4]李俊斌.淺析數(shù)據(jù)挖掘技術在保險業(yè)中的應用[J].大眾科技,2006.88(2)

[5]AlexBerson,StephenSmith,Kurt.BuildingDataMiningApplicationsforCRM[M].北京:人民郵電出版社,2001