1.绪论与前提 1.1机器学习是什么 机器学习定义 给定(训练)数据,发现一些潜在的模式并将这个模式应用于新数据。机器学习的核心是“使用算法解析数据,从中学习潜在的模式,然后对世界上的某件事情做出决定和预测”。 机器学习与人工智能的关系
基本术语
1.2发展历程与流派 机器学习是人工智能研究发展到一定阶段的必然产物 推理期: 二十世纪五十年代到七十年代初,人工智能研究处于“推理期”,那时人们以为只要能赋予机器逻辑推理能力,机器就能具有智能;这一阶段的代表性工作主要有A.Newell 和 H.Simom的“逻辑理论家”程序以及此后的“通用问题求解”程序等。 知识期: 二十世纪七十年代中期开启,人工智能研究进入了“知识期”,在这一时期,大量专家系统问世,在很多应用领域取得了大量成果并获得图灵奖,但是面临明显知识工程瓶颈:由人来把知识总结出来再教给计算机是相当困难的。 学习期: 二十世纪八十年代进入了“学习期”,“从样例中学习”的一大主流是符号主义学习,其代表包括决策树和基于逻辑的学习;典型的决策树学习以信息论为基础,以信息熵的最小化为目标,直接模拟了人类对概念进行判定的树形流程。基于逻辑的学习著名代表是归纳逻辑程序设计(ILP,Inductive Logic Programming) 统计学习: 二十世纪九十年代中期,“统计学习”登场并占据主流,代表性技术是支持向量机(SVM,Support Vector Machine)以及“核方法”(kernel methods) 深度学习: 机器学习中一种基于对数据进行表征学习的算法 机器学习现今已经发展成为一个相当大的学科领域,本文仅是管中窥豹,很多重要技术不再展开赘述,感兴趣的读者可查阅《神经网络与深度学习》、《机器学习》等书籍。 机器学习的五大流派,主要有符号主义、贝叶斯派、联结主义、进化主义、行为类推主义等 2.机器学习算法图谱 2.1监督及非监督式学习 监督式学习 采用标记数据以特定的模式来识别每种标记类型的新样本,主要类型是分类和回归 非监督式学习 训练数据没有标签或答案,目的是找出数据内部的关联和模式、趋势。分为聚类和降维 强化学习 给予算法一个不断试错,并具有奖励机制的场景,最终是算法找到最佳路径或者策略 半监督式学习 在训练阶段结合了大量未标记的数据和少量标签数据 3.上线流程简述 3.1 机器学习模型上线流程 3.1.1选择数据(特征工程) 训练数据、测试数据、验证数据(训练效果、泛化效果、验证效果)---将原始数据(日志、产品购买的历史记录等)数据清洗成可以由学习算法在训练和预测中使用的矢量(vector)的过程 3.1.2数据建模 使用训练数据来构建使用相关特征的模型 3.1.3训练模型 特征数据接入算法模型,来确定机器学习算法的类型、特征、参数等 3.1.4测试模型 使用测试数据检查被训练模型的表现(准确率、召回率) 3.1.5验证模型 使用完全训练好的模型在新数据上做预测 3.1.6调优模型 使用更多数据、不同特征或调整过的参数来提升算法的性能表现 4.PUBGM项目落地实践 4.1 算法接入背景
4.2 算法上线流程-产品侧主要工作 前面已经讲述过算法的整体上线流程,产品侧的工作重点在于训练数据梳理涉及的特征工程及调优模型设计的特征,整体流程回顾: 选择数据(特征工程) 训练数据、测试数据、验证数据(训练效果、泛化效果、验证效果)---将原始数据(日志、产品购买的历史记录等)数据清洗成可以由学习算法在训练和预测中使用的矢量(vector)的过程 具体步骤 特征数量 游戏道具特征s1(s11,s12,s13,...,s1k),s2(s21,s22 ,... s2k)...n 、用户特征u(u1,u2,u3 ... un) 创建训练实例,u(u,si)(1 – 购买)和(u,sj)(0 – 未购买) 特征逻辑 梳理特征具体至Tlog表名、字段提取逻辑,提取数据进行清洗 项目实践 总计梳理900+特征及日志提取逻辑,提供给算法团队进行数据建模、训练及测试,在算法模型不变的情况下,特征会显著影响算法效果 数据建模、训练、测试、验证模型由数据挖掘侧负责进行,此处不再展开赘述 4.3 具体落地算法简析 决策树算法 决策树算法将一组“弱”学习器集合在一起,形成一种强算法。一种流行的决策树算法是随机森林。在该算法中,弱学习器是随机选择的,这往往可以获得一个强预测器。 优点: 1)概念简单,计算复杂度不高,可解释性强,输出结果易于理解; 2)数据清洗工作较为简单,能够同时处理数据型和常规型属性,可扩展性强; 缺点: 1)容易过拟合 2)对于那些各类样本数量不一致的数据,在决策树当中,信息增益的结果偏向于那些具有更多数值的特征 3)信息缺失处理困难,人为改变特征容易使得分类器判断错误 集成学习原理 集成学习归属于机器学习,他是一种「训练思路」,并不是某种具体的方法或者算法;它并没有创造出新的算法,而是把已有的算法进行结合,从而得到更好的效果。 集成学习会挑选一些简单的基础模型进行组装,组装这些基础模型的思路主要有 2 种方法:
具体过程: 1)从原始样本集中抽取训练集。每轮从原始样本集中使用Bootstraping的方法抽取n个训练样本(在训练集中,有些样本可能被多次抽取到,而有些样本可能一次都没有被抽中)。共进行k轮抽取,得到k个训练集。(k个训练集之间是相互独立的) 2)每次使用一个训练集得到一个模型,k个训练集共得到k个模型。(注:这里并没有具体的分类算法或回归方法,我们可以根据具体问题采用不同的分类或回归方法,如决策树、感知器等) 3)对分类问题:将上步得到的k个模型采用投票的方式得到分类结果;对回归问题,计算上述模型的均值作为最后的结果。(所有模型的重要性相同)
Boosting的核心思路 :挑选精英
1)通过加法模型将基础模型进行线性的组合; 2)每一轮训练都提升那些错误率小的基础模型权重,同时减小错误率高的模型权重; 3)在每一轮改变训练数据的权值或概率分布,通过提高那些在前一轮被弱分类器分错样例的权值,减小前一轮分对样例的权值,来使得分类器对误分的数据有较好的效果。
4.4 游戏商业化系统落地 游戏内幸运空投系统
不放回抽奖系统 现存问题
解决方案
XGBoost算法原理
具体过程 lXGBoost算法的基本思想与GBDT类似,不断地地进行特征分裂来生长一棵树,每一轮学习一棵树,其实就是去拟合上一轮模型的预测值与实际值之间的残差。当我们训练完成得到k棵树时,我们要预测一个样本的分数,其实就是根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数,最后只需将每棵树对应的分数加起来就是该样本的预测值。 5.其他游戏商业化应用现状 5.1 精细化概率 《英雄联盟》的页面抽奖
CFM的放回抽奖
5.2 实时彩蛋 CF的王者轮回及千变轮回、COD的夺宝行动、剑灵的洪门秘宝、NBA的巨星陈列室等
CF的每日一抽
5.3 个性化奖池 《英雄联盟》的武神降临抽奖、鸡里奥宝典等比较具有代表性 今天,机器学习经过半个世纪的发展,已经进入计算机科学的诸多分支学科领域中,并且与普通人的生活密切相关,本文仅是结合自身在PUBGM游戏中的落地实践进行抛砖引玉,尝试针对游戏商业化相关的机器学习分析,欢迎交流讨论,新年快乐哇! |
相关下载 |
原标题:【短篇漫画】交换人生的机器 详情>>
据外媒报道,DoorDash正在将机器人的足迹扩展到厨房。 这家快递公司将收购位于旧金山湾区的机器人公司Chowbotics,据悉,该公司以制作沙拉的机器人Sally而出名。 DoorD详情>>
据外媒报道,加法制造已被证明是某些任务的理想解决方案,但该技术在许多领域仍缺乏更传统的方法。其中最大的一个就是印刷后组装的要求。3D打印机可以制作出极其复杂的组详情>>
2015 年的时候,日本软银集团收购了法国机器人公司 Aldebaran 。不过大家最熟悉的,还是“派博”(Pepper)这台问候 / 标牌机器人。此后 SoftBank Robotics 曾接手波士详情>>
机器码修改大师好用吗 这款软件是自主研发的一种硬件,机器码修改类工具不仅能有效地帮助用户轻松快速地进行机器码的修改,同时还能对电脑系统和硬件实施保护,不会因为详情>>
近日,Reddit用户warartic公开了自己使用探路者并假装成《APEX英雄》中的马文机器人并最终取得胜利的片段。 在游戏中,他将自己的游戏id改名为I'mMVRN并静止不动,因为其详情>>
机器人没电了就需要充电,不过很多玩家并不了解要如何才能给机器人充电,下面我们就为大家带来戴森球计划机器人怎么充电的介绍,有需要的玩家都来看看吧! 机器人没电详情>>
原标题:《超激斗梦境》NPC档案迪乌斯:我喜欢机器 因为机器不会背叛它的主人 《超激斗梦境》是网易推出的一款3D动作游戏,它有着庞大且完整的世界观背详情>>
据国外媒体报道,Uber去年斥资26.5亿美元收购外卖巨头Postmate旗下送货机器人部门PostMates X。目前正在寻找投资者,欲剥离这个部门使其成为一家独立的公司。 PostMa详情>>
1000个加特林海绵宝宝组成四方阵,包围5个无限赛罗和500个机器人详情>>
机器人可以攀爬崎岖的地形,帮助人类保持社会距离协议,甚至可以旁若无人地跳舞。现在,研究人员发现它们可能会表现出“同理心”的闪光点。周一发表在 《自然科详情>>
【17173鲜游快报,专注于快速带来全球新游信息】2012年推出的《CS:GO》目前依然是Steam上日均玩家最多的游戏,V社也一直在对它进行更新和维护。而最近游戏中突详情>>
《使命召唤》手游机器人怎么刷新?具体的刷新方法介绍小编已经为大家准备好了。那么接下来,就跟随07073游戏网的小编一起继续往下看,感兴详情>>
如今射击类的手机游戏越来越多,但是过多的射击游戏让广大射击手游爱好者不知如何选择了。小编在为大家挑选了一些机器人动作射击手机游戏来,如果你还在为玩什么射击手游而烦详情>>
在经过一系列预热后,漫威终于正式公布了蜘蛛侠彼得·帕克在漫画世界里的全新战衣,这款战衣将在明年3月10日的《超凡蜘蛛侠》61期详情>>
蜘蛛机器人英雄:蜘蛛机器人爬入基地,开始恶战!详情>>
原神雪山上机器人的记录是什么意思?很多玩家对此很好奇,那么接下来小编就为大家分享一下原神雪山上机器人的记录意思介绍,希望能够帮助到大家,一起来看看详情>>
在使命召唤手游中有各种各样的武器供玩家选择,其中最终兵器有很大的攻击能力,是可以改变战局的利器。今天小编为大家准备了《使命召唤手游》战争机器使用技巧,快来看看要怎样详情>>
原标题:我国首台“蜘蛛侠”智能采胶机器人问世 12月21日,在中国热科院橡胶所试验示范基地,科技人员现场展示了研发的固定式(一树一机)和移动式(一机多树详情>>
使命召唤手游战争机器配件的选择是非常的重要的,在游戏中我们的枪法都是需要不断的锻炼的,但是配件的搭配好了就可以一劳永逸,下面小编带来的使命召唤手游战争机器配件选择,其详情>>
原神雪山机器人是新地图中玩家会遇到的一个野怪,而且是boss级别的,实力非常高。玩家在攻击的时候还是要注意,要选择它的薄弱部位。 第一步: 详情>>
原神雪山机器人编号是什么?雪山机器人怎么打?龙脊雪山地图中有着各式各样新增的材料以及野怪,雪山机器人就是新增的boss之一,其实力是非常强的,因为它有着三个核心,并且其回复详情>>
原标题:窗户专属蜘蛛侠,科沃斯WINBOT 920擦窗机器人体验评测 每到冬天,因为空气质量的原因,家里的窗户总是感觉有很多灰尘,清理起来总是感觉很麻烦,而且详情>>
摩托机器人英雄:白色机器人出现,被摩托机器人KO了!详情>>
原标题:机器人总动员之:那些工地上的劳模机器人 欢迎各位来到2030年的美丽小区施工现场,我是本次工地环游活动的导游小智,请各位先戴好安全帽,准备完毕详情>>
近日,谷歌通过官方博客公开了 Google Photos 的新功详情>>
《战争机器5》(Gears 5)是一款第三人称射击游戏,由The Coalition制作,微软发行,目前Steam折扣促销减免76%现仅需29元,“年度版”也已在Steam详情>>
战机机器人英雄:机器人围攻汽车人,暴击机器人!详情>>
变形机器人英雄:机器人连续大战三个汽车人,逐个击破!详情>>
据国外媒体报道,外界期待很高的苹果自动驾驶项目,在近几年的进展看起来并不顺利,去年出现了大规模人员调整的消息,去年在加州公共道路上进行路测的里程也大幅减少,不及2018详情>>
《LOL》S11赛季新增了神话装备,并且每个英雄每局只能出一件。蒸汽机器人在英雄联盟是一名辅助英雄,他的钩子可以把对方抓过来,拥有不错的先手开团能力。在S11赛季机器人应该详情>>
原标题:LOL:4个反野最强的英雄,机器人太欠打,图4至今无法破解 在LOL中,有4个反野最强的英雄。一个就是盲僧了,很多人应该都玩过。盲僧之所以反野强,是因为详情>>
原标题:LOL:4个反野最强的英雄,机器人太欠打,图4至今无法破解 在LOL中,有4个反野最强的英雄。一个就是盲僧了,很多人应该都玩过。盲僧之所以反野强,是因详情>>
《宇宙机器人无线控制器使用指南》是PS5内置的游戏,旨在让玩家感受到PS5新手柄的特性。这款休闲游戏受到了玩家的广泛好评,在Metacritic得分为82分。详情>>
当剧情杀也成为玩家手中的武器之一。 在传统的游戏中,剧情往往是由制作团队的编剧精心设计的。游戏中的叙事是与游戏机制相对独立的游戏内容,即使偶尔出现几个选择支,玩详情>>
未来机器人英雄:机器人变成飞船形态,到达目的地!详情>>
作为一种非常搞怪的射击游戏,战争机器人有着十分简洁的操作,没有复杂的操作界面,玩家在游戏中操作一个长相比较奇怪的机器人展开一系列的冒险之旅。更多软件咨询体验,请详情>>
战机机器人英雄:汽车人直接冲了过来,机器人力争上游!详情>>
LOL机器人出钢铁烈阳之匣、舒瑞娅的战歌,舒瑞娅的战歌提供AP加成,钢铁烈阳之匣主动详情>>
解谜游戏:两个机器人比武,谁更厉害一些?详情>>