大數(shù)據(jù)挖掘的技術(shù)及方法包括但不限于以下幾種:
1、回歸分析:反映事務(wù)數(shù)據(jù)庫中屬性值在時間上的特征,可生成映射數(shù)據(jù)項到實值預(yù)測變量的函數(shù),研究問題包括數(shù)據(jù)序列的趨勢特征、數(shù)據(jù)序列的預(yù)測以及數(shù)據(jù)間的相關(guān)關(guān)系等。回歸分析可以應(yīng)用到市場營銷的各個方面,如客戶尋求、保持和預(yù)防客戶流失活動、產(chǎn)品生命周期分析、銷售趨勢預(yù)測及有針對性的促銷活動等。
2、聚類:把一組數(shù)據(jù)按照相似性和差異性分為幾個類別,目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。聚類分析可以應(yīng)用到客戶群體的分類、客戶背景分析、客戶購買趨勢預(yù)測、市場的細分等。
3、關(guān)聯(lián)規(guī)則:描述數(shù)據(jù)庫中數(shù)據(jù)項之間所存在的關(guān)系的規(guī)則,即根據(jù)一個事務(wù)中某些項的出現(xiàn)可導(dǎo)出另一些項在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。關(guān)聯(lián)規(guī)則挖掘技術(shù)能對數(shù)據(jù)與數(shù)據(jù)之間的依賴關(guān)系進行準確描述,可以對給定事物數(shù)據(jù)庫進行深入分析,尋找各數(shù)據(jù)和項目之間的內(nèi)在聯(lián)系,然后將所有符合支持度和置信度的,符合一定標準的關(guān)聯(lián)規(guī)則進行羅列。
4、神經(jīng)網(wǎng)絡(luò):一種模擬人腦信息處理機制的機器學(xué)習(xí)算法。通過對數(shù)值數(shù)據(jù)進行處理,并在處理過程中表現(xiàn)出一種思維、學(xué)習(xí)和記憶能力。
5、統(tǒng)計學(xué)習(xí):一種預(yù)測方法,需要對數(shù)據(jù)進行深入分析,找出不能通過的規(guī)律,然后對所發(fā)現(xiàn)的規(guī)律進一步研究和分析,并結(jié)合實際情況對數(shù)據(jù)發(fā)展趨勢進行預(yù)測。
大數(shù)據(jù)挖掘的方法有很多,每一種方法都有其特定的使用場景和優(yōu)勢。在實際應(yīng)用中,需要根據(jù)具體的數(shù)據(jù)類型和問題來選擇合適的方法。