您当前所在位置: > 网游 > 电竞动态

图解集成学习中的梯度提升思想

时间:2018-08-01 18:44:27  来源:  作者:网络

简介

机器学习(ML)中的一个关键步骤是选择适合数据的最佳算法,根据数据中的一些统计数据和可视化信息,机器学习工程师将选择最佳算法。假设数据如下图所示,现在将其应用于回归示例:

图解集成学习中的梯度提升思想

对数据进行可视化,如下图示所示,似乎线性回归模型对其比较合适:

图解集成学习中的梯度提升思想

将根据线性等式制定仅具有一个输入x和一个输出y的回归模型:

y=ax+b

其中a和b是上述等式的两个参数。

由于我们不知道适合数据的最佳参数,因此可以从初始化取值开始。可以将a设置为1.0,将b设置为0.0,并可视化等式,如下图所示:

图解集成学习中的梯度提升思想

从图中可以看到,似乎该模型不能基于参数初始化取值来拟合数据。

很明显,不可能第一次试验初始化就能取得很好的结果。但问题是如何在这种情况下提高性能?换句话说,如何最大化分类准确度或最小化回归误差?下面有不同的方法。其中一种简单的方法就是尝试更改先前选择的参数。经过多次试验,模型将知道最佳参数是a = 2和b = 1,该模型适合这种情况下的数据,如下图所示,可以看见拟合得非常好:

图解集成学习中的梯度提升思想

但是在某些情况下,更改模型参数并不会使得模型很好地拟合数据,仍然会有一些错误的预测。假设数据有一个新点(x = 2, y = 2)。从下图可以看出,不可能找到使模型完全适合每个数据点的参数,不适用于线性拟合。

图解集成学习中的梯度提升思想

有人可能会说,该模型能够拟合四个点而缺少一个点,这是可以接受的。但是,如果有更多的点,如下图所示呢?在这种情况下,该模型将做出更多的错误预测。没有一条直线可以拟合整个数据。该模型只对线上点的预测很强,但对其他点则较弱。

图解集成学习中的梯度提升思想

集成学习|Ensemble Learning

由于单个回归模型不适合整个数据,因此另一种解决方案是使用多个回归模型。每个回归模型都能够强有力地适应部分数据,将所有模型组合起来将减少整个数据的总误差,并产生一个通用的强大模型。在问题中使用多个模型的这种方法称为集合学习。使用多个模型的重要性如下图所示。图中显示了在预测样本结果时的误差很大。从图b中可以看到,当存在多个模型(例如,三个模型)时,其结果的平均值将能够比以前做出更准确的预测。

图解集成学习中的梯度提升思想

当应用于图7中的先前问题时,拟合数据的4个回归模型的集合在图9中已经表示出:

图解集成学习中的梯度提升思想

这就带了了另外的一个问题,如果有多个模型可以拟合数据,那么如何获得单个数据的预测?有两种方法可以组合多个回归模型来返回单个结果。它们是bagging和boosting(本文重点内容)。

在bagging中,每个模型将返回其结果,并对所有模型的输出结果进行综合,进而返回最终结果。一种综合方法是将所有模型的输出结果进行平均,bagging是平行工作的,因为所有模型都在同时工作。

相反,boosting被认为是顺序处理的,因为一个模型的输出结果是下一个模型的输入。boosting的想法是使用弱学习器来拟合数据。由于模型很弱,所以无法正确拟合数据,这种学习器的弱点将由另一个弱学习器来解决。如果仍然存在一些弱点,那么将使用另一个弱学习器来修复它们,直到最终从多个弱学习器中产生了强大的学习器。接下来将解释梯度增强的工作原理。梯度提升|Gradient Boosting

以下是基于一个简单示例梯度提升的工作原理:

假设要构建一个回归模型,并且数据具有单个输出,其中第一个样本的输出为15,如下图所示。最终目标是建立能够正确预测这种输出的回归模型。

图解集成学习中的梯度提升思想

第一个弱模型预测第一个样本的输出为9而不是15,如下图所示:

图解集成学习中的梯度提升思想

为了衡量预测的损失量,对其计算残差,剩余量是期望和预测输出之间的差异。计算等式如下:

期望?预测1=残差1

其中预测和残差1分别是第一个弱模型的预测输出和残差。

因此,上述例子的残差将为为:

15?9=6

由于预测输出和期望输出之间存在残差值为6的差距,因此可以创建第二个弱模型,其目标是预测输出等于第一模型的残差。所以,第二个模型将解决第一个模型的弱点。根据下面这个等式,两个模型的输出总和将等于期望输出:

期望输出=预测1+预测2(残差1)

如果第二个弱模型能够正确地预测残差1,则期望输出将等于所有弱模型的预测,如下所示:

期望输出=预测1+预测2(残差1)=9+6=15

但是,如果第二个弱模型未能正确预测残差1的值,而仅返回的值为3,那么第二个弱学习器也将具有如下的残差:

残差2=预测1?预测2=6?3=3

如下图所示:

图解集成学习中的梯度提升思想

为了解决第二个弱模型的弱点,将创建第三个弱模型。其目标是预测第二弱模型的残差。因此,它的目标输出值为3。所以,样本的期望输出将等于所有弱模型的预测,如下所示:

期望输出=预测1+预测2(残差1)+预测3(残差2)

如果第三弱模型预测是2,不等于3,即它不能预测出第二个弱模型的残差,那么对于这样的第三个弱模型将存在残差:

残留3=预测2?预测3=3?2=1

如下图所示

图解集成学习中的梯度提升思想

因此,将创建第四个弱模型来预测第三个弱模型的残差,其值等于1。期望输出将等于所有弱模型的预测,如下所示:

期望输出=预测1+预测2(残差1)+预测3(残差2)+预测4(残差3)

如果第四个弱模型正确地预测其目标(即,残差值3),则总共使用四个弱模型即可达到15的期望输出,如下图所示。

图解集成学习中的梯度提升思想

这就是梯度增强算法的核心思想,使用先前模型的残差作为下一个模型的目标,有点类似于递归算法,满足终止条件即退出递归。梯度提升总结

总而言之,梯度提升始于弱模型预测,这种弱模型的目标是使其预测值与问题的理想输出一致。在模型训练之后,计算其残差。如果残差不等于零,则创建另一个弱模型以修复前一个的弱点。但是这种新模型的目标并不是获得期望输出,而是先前模型的残差。也就是说,如果给定样本的期望输出是T,则第一模型的目标是T。在训练之后,对于这样的样本可能存在R的残差,所以要创建一个的新模型,并将其目标设置为R,而不是T,新模型填补以前模型的空白。

梯度增强类似于多个力量弱的人抬一个重物上楼梯。没有一个力量弱的人能够抬着重物走完真个楼梯,每个人只能抬着走一步。第一个人将重物提升一步并在此之后变得疲惫,无法继续;另一个人继续抬起重物并向前走另一步,依此类推,直到走完所有楼梯,重物到达指定位置。作者信息

Ahmed Gad,助教,专注于数字信号处理、计算机视觉

本文由阿里云云栖社区组织翻译。

文章原标题《Intuitive Ensemble Learning Guide with Gradient Boosting》,译者:海棠,审校:Uncle_LLD。

相关下载

玩家评论

炉石传说酒馆战棋英雄吃鸡梯度排行榜

炉石传说酒馆战棋目前版本中哪些英雄最容易吃鸡?对于当前游戏的版本如何选择最容易上分的英雄?下面小编就为大家带来炉石传说酒馆战棋英雄吃鸡梯度排行榜:以下是个人的排行榜,仅详情>>

阅读: 8
日期: 2019-12-02
奥拉星手游各系亚比推荐梯度排行

奥拉星手游在目前的版本中每一个系最强亚比是谁?想要知道的小伙伴就来看看下面小编整理带来的奥拉星手游各系亚比推荐/梯度排行/理想十强/战力排行吧:【水】山脉(打羽月/烈焰鸟详情>>

阅读: 6
日期: 2019-11-26
防范人脸识别滥用,该建个人信息梯度保护制度|新京报专栏

原标题:防范人脸识别滥用,该建个人信息梯度保护制度 | 新京报专栏 根据个人信息保护的制度和实践,可以有四种构造人脸识别技术应用场景的模式,相应地,详情>>

阅读: 5
日期: 2019-11-26
s17中单梯度更新:周瑜小乔登上t1,但也敌不过有皮肤的婉儿

原标题:s17中单梯度更新:周瑜小乔登上t1,但也敌不过有皮肤的婉儿 王者荣耀S17赛季更新后就在玩家群体中炸开了锅,不得不说新的版本变化还是蛮大的。其详情>>

阅读: 6
日期: 2019-10-24
s17上单抗压梯度排行榜,凯皇以废,梦奇上升至t1,他t0单挑无敌

原标题:s17上单抗压梯度排行榜,凯皇以废,梦奇上升至t1,他t0单挑无敌 S17赛季新版本已经上线第四天了,相信很有网友们体验过后,都会有自己的感触和游戏体详情>>

阅读: 9
日期: 2019-10-20
s16上单梯度排行:输赢全靠队友发挥,上单真是太难了

原标题:s16上单梯度排行:输赢全靠队友发挥,上单真是太难了 S16赛季已经进入中后期,上单位经过了一系列调整后自身的发育环境已经得到了很大改善。但由于详情>>

阅读: 10
日期: 2019-08-22
LOL无限乱斗延续开放至4月3日 英雄胜率排行梯度分析

LOL无限乱斗延续开放至4月3日 英雄胜率排行梯度分析编辑:潮文2019-03-05 英雄联盟在春节期间开放了无限乱斗模式,这个模式从上线之后就吸引了大批玩家朋友们的关注,... 详情>>

阅读: 7
日期: 2019-04-06
【中文字幕】《堡垒之夜》游戏解析——武器稀有度与等级梯度【Drift0r】

【中文字幕】《堡垒之夜》游戏解析——武器稀有度与等级梯度【Drift0r】详情>>

阅读: 2
日期: 2018-08-25
法师梯度排行分析 为你上分提供最佳选择

虽同作为中单法师,但法师的作战和输出方式却是有着差别的,有的法师擅长与敌人打消耗,像貂蝉、诸葛亮、扁鹊;有的法师突进能力特别强,像不知火舞详情>>

阅读: 3
日期: 2018-07-30
绝地求生:新版本枪械梯度排行,这次真的大换血!

【T1级别狙击枪】SLR:7.62新枪,自动填装步枪,这是目前版本一把可以媲美空投般存在的枪,如同激光般的弹道和良好的子弹下坠,高额的伤害,三个配件和步枪通用,只能用完详情>>

阅读: 2
日期: 2018-05-04
绝地求生:新版本枪械梯度排行,这次真的大换血!

原标题:绝地求生:新版本枪械梯度排行,这次真的大换血!【T1级别狙击枪】SLR:7.62新枪,自动填装步枪,这是目前版本一把可以媲美空投般存在的枪,如同激光般的弹详情>>

阅读: 5
日期: 2018-05-04
少女前线枪娘排名最新版 枪支排行梯度分析

随着枪娘越来越多,是不是不知道练哪些好?这篇文章小编就带来少女前线枪娘排名最新版的内容,也就是枪支排行梯度分析,来看看吧。注:最新排名看下面不同枪种的排名文章。详情>>

阅读: 4
日期: 2018-04-04
精彩推荐
相关专题