2003年,DARPA啟動(dòng)PAL計(jì)劃,將機(jī)器學(xué)習(xí)的重要性上升到美國(guó)國(guó)家安全的高度來(lái)考慮,眾所周知,美國(guó)最尖端科技的研究通常是由NASA和DARPA推進(jìn)的,而這兩大機(jī)構(gòu)不約而同地強(qiáng)調(diào)機(jī)器學(xué)習(xí)的重要性,其意義不言而喻.2006年,卡耐基梅隆大學(xué)宣告成立世界上第一個(gè)“機(jī)器學(xué)習(xí)系”,機(jī)器學(xué)習(xí)領(lǐng)域奠基人之-T.Mitchell教授出任首任系主任.2012年3月,美國(guó)奧巴馬政府啟動(dòng)“大數(shù)據(jù)研究與發(fā)展計(jì)劃”,美國(guó)國(guó)家科學(xué)基金會(huì)旋即在加州大學(xué)伯克利分校啟動(dòng)加強(qiáng)計(jì)劃,強(qiáng)調(diào)要深入研究和整合大數(shù)據(jù)時(shí)代的三大關(guān)鍵技術(shù):
機(jī)器學(xué)習(xí)、云計(jì)算、眾包(crowdsourcing).顯然,機(jī)器學(xué)習(xí)在大數(shù)據(jù)時(shí)代是必不可少的核心技術(shù),道理很簡(jiǎn)單:收集、存儲(chǔ)、傳輸、管理大數(shù)據(jù)的目的,是為了“利用”大數(shù)據(jù),而如果沒(méi)有機(jī)器學(xué)習(xí)技術(shù)分析數(shù)據(jù),則“利用”無(wú)從談起.談到對(duì)數(shù)據(jù)進(jìn)行分析利用,很多人會(huì)想到“數(shù)據(jù)挖掘”(data mining),這里簡(jiǎn)單探討一下數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的聯(lián)系.?dāng)?shù)據(jù)挖掘領(lǐng)域在二十世紀(jì)九十年代形成,它受到很多學(xué)科領(lǐng)域的影響,其中數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)無(wú)疑影響最大[Zhou,2003].數(shù)據(jù)挖掘是從海量數(shù)據(jù)中發(fā)掘知識(shí),這就必然涉及對(duì)“海量數(shù)據(jù)”的管理和分析.大體來(lái)說(shuō),數(shù)據(jù)庫(kù)領(lǐng)域的研究為數(shù)據(jù)挖掘提供數(shù)據(jù)管理技術(shù),而機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)的研究為數(shù)據(jù)挖掘提供數(shù)據(jù)分析技術(shù).由于統(tǒng)計(jì)學(xué)界的研究成果通常需要經(jīng)由機(jī)器學(xué)習(xí)研究來(lái)形成有效的學(xué)習(xí)算法,之后再進(jìn)入數(shù)據(jù)挖掘領(lǐng)域,因此從這個(gè)意義上說(shuō),統(tǒng)計(jì)學(xué)主要是通過(guò)機(jī)器學(xué)習(xí)對(duì)數(shù)據(jù)挖掘發(fā)揮影響,而機(jī)器學(xué)習(xí)領(lǐng)域和數(shù)據(jù)庫(kù)領(lǐng)域則是數(shù)據(jù)挖掘的兩大支撐.今天,機(jī)器學(xué)習(xí)已經(jīng)與普通人的生活密切相關(guān),例如在天氣預(yù)報(bào)、能源勘探、環(huán)境監(jiān)測(cè)等方面,有效地利用機(jī)器學(xué)習(xí)技術(shù)對(duì)衛(wèi)星和傳感器發(fā)回的數(shù)據(jù)進(jìn)行分析,是提高預(yù)報(bào)和檢測(cè)準(zhǔn)確性的重要途徑;在商業(yè)營(yíng)銷中,有效地利用機(jī)器學(xué)習(xí)技術(shù)對(duì)銷售數(shù)據(jù)、客戶信息進(jìn)行分析,不僅可幫助商家優(yōu)化庫(kù)存降低成本,還有助于針對(duì)用戶群設(shè)計(jì)特殊營(yíng)銷策略:……下面再舉幾例: