交叉驗(yàn)證(Cross-validation)是一種常用的機(jī)器學(xué)習(xí)模型評(píng)估方法,目的是用來(lái)驗(yàn)證機(jī)器學(xué)習(xí)模型的泛化能力。在交叉驗(yàn)證中,將原始數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,然后在訓(xùn)練集上訓(xùn)練模型,在測(cè)試集上測(cè)試模型性能,得到一個(gè)測(cè)試誤差。重復(fù)這個(gè)過(guò)程多次,每次選擇不同的訓(xùn)練集和測(cè)試集,得到多個(gè)測(cè)試誤差,最終對(duì)這些測(cè)試誤差進(jìn)行平均,作為模型的性能評(píng)估指標(biāo)。
交叉驗(yàn)證的目的是避免模型對(duì)某一數(shù)據(jù)集過(guò)擬合(Overfitting),即模型在訓(xùn)練數(shù)據(jù)上表現(xiàn)良好,但在測(cè)試數(shù)據(jù)上表現(xiàn)很差的情況。通過(guò)交叉驗(yàn)證,可以評(píng)估模型的泛化能力,提高模型的魯棒性。常用的交叉驗(yàn)證方法包括 K-fold 交叉驗(yàn)證、Leave-one-out 交叉驗(yàn)證等。