8.1 數(shù)據(jù)生命周期管理及意義
數(shù)據(jù)的生命周期管理最初是由美國(guó)的存儲(chǔ)技術(shù)公司StorageTek提出來(lái)的,經(jīng)過(guò)這些年的發(fā)展和宣傳,目前逐漸開(kāi)始進(jìn)入市場(chǎng)化階段。數(shù)據(jù)的生命周期管理作為一項(xiàng)企業(yè)信息化戰(zhàn)略,是一項(xiàng)相對(duì)長(zhǎng)期的工作。
早期銀行的金融產(chǎn)品較少,主要以存貸匯為主,而且數(shù)據(jù)以?。ㄊ校閱挝环植即娣?,數(shù)據(jù)量相對(duì)較少。此外,由于還沒(méi)有數(shù)據(jù)集中挖掘與分析的需求,日常處理對(duì)象主要是短期數(shù)據(jù),時(shí)間跨度小,處理的數(shù)據(jù)規(guī)模相對(duì)可控。但是,隨著各家銀行的數(shù)據(jù)大集中以及業(yè)務(wù)的快速發(fā)展,客戶群體越來(lái)越大,客戶發(fā)生的交易行為也越來(lái)越頻繁,尤其是在大數(shù)據(jù)、互聯(lián)網(wǎng)金融時(shí)代,銀行業(yè)集中存放和處理的數(shù)據(jù)量急劇增加,有些銀行的數(shù)據(jù)容量甚至達(dá)到了PB級(jí)。有種說(shuō)法是:“今天一個(gè)現(xiàn)代人一天所吸收的信息,比莎士比亞一生所獲得的信息還要多?!庇纱丝梢?jiàn),當(dāng)今社會(huì)信息量是呈爆發(fā)式增長(zhǎng)的。對(duì)銀行來(lái)說(shuō),一方面數(shù)據(jù)成為銀行的重要資產(chǎn),對(duì)于分析客戶行為、評(píng)價(jià)客戶信用、提升營(yíng)銷精準(zhǔn)度等方面都起到了重要的作用;但是,另一方面日益增大的數(shù)據(jù)量對(duì)系統(tǒng)存儲(chǔ)、訪問(wèn)效率造成越來(lái)越大的壓力。因此,必須權(quán)衡效率和需求之間的關(guān)系,合理保留數(shù)據(jù)。
正常情況下,數(shù)據(jù)生成時(shí)間越長(zhǎng),其獲得的訪問(wèn)頻率則越低。但是,數(shù)據(jù)總量越來(lái)越大,如果將不活躍的數(shù)據(jù)進(jìn)行遷移,則可以降低企業(yè)的擁有成本。
數(shù)據(jù)生命周期中數(shù)據(jù)生成時(shí)間、數(shù)據(jù)訪問(wèn)頻率、數(shù)據(jù)總量等參數(shù)間的關(guān)系如圖8-1所示。
倘若不對(duì)數(shù)據(jù)進(jìn)行有效的數(shù)據(jù)生命周期管理,則會(huì)出現(xiàn)系統(tǒng)問(wèn)題。例如,數(shù)據(jù)增長(zhǎng)過(guò)快導(dǎo)致的系統(tǒng)資源浪費(fèi);又如,表數(shù)據(jù)量過(guò)大導(dǎo)致訪問(wèn)效率過(guò)慢等情況。以某商業(yè)銀行為例,早期因?yàn)闆](méi)有進(jìn)行勢(shì)據(jù)生命周期管理,出現(xiàn)了各種問(wèn)題,極大地影響了系統(tǒng)服務(wù)效率和客戶服務(wù)水平。從以下兩個(gè)例子可以看出數(shù)據(jù)生命周期管理的重要性。