機器學習_學習筆記系列(13)：交叉驗證(Cross-Validation)和MSE、MAE、R2

Feb 7, 2021

到目前為止我們讓機器學習和驗證的方式都一樣，都是按照特定比例，然後隨機抽取一些資料當作我們的測試集，而剩下的就是我們的訓練集。然而我們可以發現一些問題，假設我們今天想要讓機器學習分辨貓跟狗，但是我們今天很不幸的，剛好隨機抽樣，拿去訓練的都是狗的圖片，拿去測試的都是貓的圖片，我們就會看到我們的錯誤率會非常大。假想一下，你這輩子只看過狗，有一天一隻貓出現在你家，你會覺得他是貓嗎？

所以針對這樣的問題，我們偉大的科學家想出了很多方式來驗證我們的資料。其中最主要的幾種交叉驗證法(Cross-Validation)有

(1)Holdout Cross-Validation
(2) leave-one-out cross-validation
(3) k-fold cross-validation

而在介紹這些驗證法以前，我們要先來介紹計算模型錯誤率的一些指標。

Mean Square Error (MSE)

Mean Absolute Error (MAE)

R squared (R2)

由上述我們可以看到三種衡量模型的指標，MSE是計算模型預測值和實際值相差的平方總合除以資料數量、MAE是計算計算模型預測值和實際值相差的絕對值總合除以資料數量，R2則是1減掉模型預測值和實際值相差的平方總合除以實際值平均和實際值相差的平方總合。所以我們可以知道說MAE和MSE越接近0越好，而R2越接近1代表模型預測效果更好。

交叉驗證(Cross-Validation)

介紹完了三種評斷模型好壞的指標，我們現在就要進入重頭戲，Cross-Validation

(一) Holdout Cross-Validation

對於此種驗證方式，和我們在前個章節所用的驗證方法一樣，就是所有的資料集裡面，隨機抽取特定比例的資料作為訓練集，而剩下的部分就作為我們的測試集。但是此種方法的問題在文章一開頭也提到，如果我們今天運氣很不好，剛好訓練集挑選的資料都是狗，測試集都是貓，那我們訓練出來的模型就會很有問題。所以在這種情況下，我們需要確保，我們給機器的資料夠大也夠多元，不會說我今天要訓練分辨貓和狗的模型，我只有99張狗的照片，1張貓的圖片。

(二) Leave-One-Out Cross-Validation

在這種驗證方法當中，我們只會從資料中選1筆當作測試集，其他的資料就用來訓練我們的模型，而驗證方式，就是從第一筆開始當測試集，其他拿去訓練模型。在第二輪，我們換拿第二筆當測試集，其他一樣拿來當訓練集。第三輪則拿第三筆當測試集….，以這樣的方式，讓資料中的每筆的資料都當過測試集。雖然這樣的方式可以讓我們了解哪筆資料明顯造成我們模型的偏差，但是這樣一筆一筆驗證的方式非常的消耗計算資源和時間。