調(diào)參得好不好往往對(duì)最終模型性能有關(guān)鍵性影響.給定包含m個(gè)樣本的數(shù)據(jù)集D,在模型評(píng)估與選擇過(guò)程中由于需要留出一部分?jǐn)?shù)據(jù)進(jìn)行評(píng)估測(cè)試,事實(shí)上我們只使用了一部分?jǐn)?shù)據(jù)訓(xùn)練模型.因此,在模型選擇完成后,學(xué)習(xí)算法和參數(shù)配置已選定,此時(shí)應(yīng)該用數(shù)據(jù)集D重新訓(xùn)練模型,這個(gè)模型在訓(xùn)練過(guò)程中使用了所有m個(gè)樣本,這才是我們最終提交給用戶(hù)的模型.另外,需注意的是,我們通常把學(xué)得模型在實(shí)際使用中遇到的數(shù)據(jù)稱(chēng)為測(cè)試數(shù)據(jù),為了加以區(qū)分,模型評(píng)估與選擇中用于評(píng)估測(cè)試的數(shù)據(jù)集常稱(chēng)為“驗(yàn)證集”(validation set).例如,在研究對(duì)比不同算法的泛化性能時(shí),我們用測(cè)試集上的判別效果來(lái)估計(jì)模型在實(shí)際使用時(shí)的泛化能力,而把訓(xùn)練數(shù)據(jù)另外劃分為訓(xùn)練集和驗(yàn)證集,基于驗(yàn)證集上的性能來(lái)進(jìn)行模型選擇和調(diào)參.