數(shù)據(jù)模型將復(fù)雜的數(shù)據(jù)以結(jié)構(gòu)化的形式有序的組織起來。我們之前談到的指標(biāo),都可以作為維度使用。下面是范例:
·將用戶類型、活躍度、時(shí)間三個(gè)維度組合,觀察不同用戶群體在產(chǎn)品上的使用情況,是否A群體使用的時(shí)長更明顯?
·將商品類型、訂單金額、地區(qū)三個(gè)維度組合,觀察不同地區(qū)的不同商品是否存在銷量差異?
數(shù)據(jù)模型可以從不同的角度和層面來觀察數(shù)據(jù),這樣提高了分析的靈活性,滿足不同的分析需求、這個(gè)過程叫做OLAP(聯(lián)機(jī)分析處理)。當(dāng)然它涉及到更復(fù)雜的數(shù)據(jù)建模和數(shù)據(jù)倉庫等,我們不用詳細(xì)知道。
數(shù)據(jù)模型還有幾種常見的技巧,叫做鉆取、上卷、切片。
選取就是將維度繼續(xù)細(xì)分。比如浙江省細(xì)分成杭州市、溫州市、寧波市等,2010年一季度變成1月、2月、3月。上卷則是鉆取的相反概念,將維度聚合,比如浙江、上海、江蘇聚合成浙江滬維度。切片是選中特定的維度,比如只選上海維度、或者只選2010年一季度維度。因?yàn)閿?shù)據(jù)立方體是多維的,但我們觀察和比較數(shù)據(jù)只能在二維、即表格中進(jìn)行。
上圖的樹狀結(jié)構(gòu)代表鉆取(source和time的細(xì)分),然后通過對(duì)Route的air切片獲得具體數(shù)據(jù)。