亏本是一个数值方针文爱 电报群,用于形色模子的预计有多大偏差。亏本函数用于预计模子预计与本体标签之间的距离。磨砺模子的意见是尽可能裁减亏本,将其降至最低值。
不才图中,您不错将亏本可视化为从数据点指向模子的箭头。箭头暗示模子的预计效果与本体值之间的差距。
- 图1 -
亏本是从本体值到预计值预计的。
» 丢失距离
在统计学和机器学习中,亏本函数用于预计预计值与本体值之间的各异。亏本函数侧重于值之间的距离,而不是意见。举例,若是模子预计值为 2,但本体值为 5,咱们并不关注亏本为负值 −3(2−5=−3)。咱们关注的是这两个值之间的距离为 3。因此,所有效于猜测亏本的步调齐会移除象征。
移除此标记的两种最常用步调如下:
猜测本体值与预计值之间的差值的十足值。
将本体值与预计值之间的差值时常。
» 亏本类型
在线性回顾中,有四种主要的亏本函数,如下表所示。
- 图2 -
L1亏本函数和 L2 亏本函数(或 MAE 和 MSE)之间的功能各异在于时常。当预计值与标签之间的各异较大时,时常会使亏本变得更大。当各异很小(小于 1)时,时常会使亏本更小。
同期处理多个示例时,咱们提议对所有示例的亏本进行平均,不管是使用 MAE 依然 MSE。
» 猜测亏本示例
使用之前的最好拟合线,咱们将猜测单个示例的 L2 亏本。从最优拟合线中,咱们取得了权重和偏差的以下值:
Weight: −3.6
Bias: 30
若是模子预计重 2,370 磅的汽车每加仑可行驶 21.5 英里,但本体每加仑可行驶 24 英里,咱们将按如下风物猜测 L2 亏本:
( ※ 留意: 由于图表的比例为 1000 磅,因此公式使用 2.37)
- 图3 -
在此示例中,该单个数据点的 L2 亏本为 6.25。
» 选拔亏本
详情是使用 MAE 依然 MSE 可能取决于数据集以及您但愿处理特定预计的风物。数据衔尾的大大宗特征值频频属于一个特定界限。举例,汽车频频在 2,000 到 5,000 磅之间,每加仑汽油能行驶 8 到 50 英里。重 8,000 磅的汽车或每加仑汽油行驶 100 英里的汽车齐超出了典型界限,会被视为离群值。
离群值还不错指模子的预计与信得过值之间的差距。举例,3,000 磅的车重属于典型的车重界限,而每加仑 40 英里的油耗属于典型的油耗界限。然而,关于模子的预计而言,重 3,000 磅的汽车每加仑能行驶 40 英里属于离群值,因为模子会预计重 3,000 磅的汽车每加仑能行驶 18 到 20 英里。
选拔最好亏本函数时,请接洽您但愿模子若那处理离群值。举例,MSE 会使模子更接近离群值,而 MAE 则不会。与 L1 亏本函数比较,L2 亏本函数对离群值的解决更高。举例,以下图片清楚了使用 MAE 磨砺的模子和使用 MSE 磨砺的模子。红线暗示将用于进行预计的完全磨砺好的模子。离群值更接近使用 MSE 磨砺的模子,而不是使用 MAE 磨砺的模子。
- 图4 -
使用 MSE 磨砺的模子会使模子更接近离群值。
涩涩电影网站- 图5 -
使用 MAE 磨砺的模子与离群值的距离更远。
请留意模子与数据之间的策划:
MSE:
模子更接近离群值,但与大大宗其他数据点的距离更远。
MAE:
模子离离群值较远文爱 电报群,但离大大宗其他数据点较近。