久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

手機站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

千鋒教育

掃一掃進入千鋒手機站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > python 交叉驗證

python 交叉驗證

來源:千鋒教育
發(fā)布人:xqq
時間: 2023-11-08 01:05:12 1699376712

交叉驗證的優(yōu)點:

原始采用的train_test_split方法,數(shù)據(jù)劃分具有偶然性;交叉驗證通過多次劃分,大大降低了這種由一次隨機劃分帶來的偶然性,同時通過多次劃分,多次訓(xùn)練,模型也能遇到各種各樣的數(shù)據(jù),從而提高其泛化能力

與原始的train_test_split相比,對數(shù)據(jù)的使用效率更高,train_test_split,默認訓(xùn)練集,測試集比例為3:1,而對交叉驗證來說,如果是5折交叉驗證,訓(xùn)練集比測試集為4:1;10折交叉驗證訓(xùn)練集比測試集為9:1.數(shù)據(jù)量越大,模型準確率越高!

交叉驗證的缺點:

這種簡答的交叉驗證方式,從上面的圖片可以看出來,每次劃分時對數(shù)據(jù)進行均分,設(shè)想一下,會不會存在一種情況:數(shù)據(jù)集有5類,抽取出來的也正好是按照類別劃分的5類,也就是說第一折全是0類,第二折全是1類,等等;這樣的結(jié)果就會導(dǎo)致,模型訓(xùn)練時。沒有學(xué)習(xí)到測試集中數(shù)據(jù)的特點,從而導(dǎo)致模型得分很低,甚至為0,為避免這種情況,又出現(xiàn)了其他的各種交叉驗證方式。

Stratifidk-foldcrossvalidation

分層交叉驗證(Stratifiedk-foldcrossvalidation):首先它屬于交叉驗證類型,分層的意思是說在每一折中都保持著原始數(shù)據(jù)中各個類別的比例關(guān)系,比如說:原始數(shù)據(jù)有3類,比例為1:2:1,采用3折分層交叉驗證,那么劃分的3折中,每一折中的數(shù)據(jù)類別保持著1:2:1的比例,這樣的驗證結(jié)果更加可信。

通常情況下,可以設(shè)置cv參數(shù)來控制幾折,但是我們希望對其劃分等加以控制,所以出現(xiàn)了KFold,KFold控制劃分折,可以控制劃分折的數(shù)目,是否打亂順序等,可以賦值給cv,用來控制劃分。

以上內(nèi)容為大家介紹了python交叉驗證,希望對大家有所幫助,如果想要了解更多Python相關(guān)知識,請關(guān)注IT培訓(xùn)機構(gòu):千鋒教育。

聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通
免費領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT