深度学习-李沐-第四节-模型选择、⽋拟合和过拟合
模型选择、⽋拟合和过拟合
训练误差与泛化误差
- 训练误差(training error)是指模型在训练数据集上计算得到的误差。即为模型在训练数据上的误差
- 泛化误差(generalization error)是指模型应用在同样从原始样本的分布中抽取的无限多数据样本时,模型误差的期望。即为模型在新数据上的误差
验证数据集和测试数据集
- 验证数据集:一个用于评估模型好坏的数据集
- 测试数据集:只用一次的数据集
k折交叉验证(K-Fold 交叉验证)
K-Fold 交叉验证:它将原始数据分成K组(K-Fold),将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型。这K个模型分别在验证集中评估结果,最后的误差MSE(Mean Squared Error)加和平均就得到交叉验证误差。
过拟合与欠拟合
模型容量
VC维
VC维是模型的复杂程度,模型假设空间越大,VC维越高。