您当前所在位置: > 网游 > 综合热点

AI challenger又发福利:零样本学习算法大赛 and 零样本数据集

时间:2018-08-27 22:40:05  来源:  作者:网络
请注意:本文为编辑制作专题转载的资讯,页面显示的时间仅为生成静态页面时间而非具体内容事件发生的时间,由此给您带来的不便敬请谅解!

本文内容转载自今日头条“机器之能”头条号

火遍全球的AI challenger又派发数据集福利啦!

去年,由创新工场、搜狗、今日头条联合主办的AI Challenger(以下简称AIC)全球AI挑战赛吸引了来自65个国家近万团队参赛。今年,AIC预热赛零样本学习(zero-shot learning)竞赛即日起开始比赛。

零样本学习竞赛同样发布大规模图像属性数据集,包含78017张图片、230个类别、359种属性。与目前主流的用于zero-shot learning的数据集相比,图片量更大、属性更丰富、类别与ImageNet重合度更低。

创新工场AI工程院运营副总裁吴卓浩表示,“人工智能发展的必经之路之一是‘教会’机器认识我们的世界,这也是为什么有了互联网发展过程中所积累下来的海量标注数据,才促成了最近这一波人工智能技术和应用的突破。但是,让机器认识世界的挑战仍然非常大,因为在很多情况下人们难以获得足够的有标注的数据来训练识别或预测模型”。

因此,受人类学习能力的启发,零样本学习(zero-shot learning)希望借助辅助知识(如属性、词向量、文本描述等),在没有任何训练样本的情况下,学会从未见过的新概念。这具有重要的研究意义和广泛的应用场景,被认为是实现大规模物体识别的一个重要方式。

瞄准这个国际前沿课题,AI Challenger带来了目前世界最大的零样本学习数据集、以及国内首次零样本学习竞赛。

01

最具挑战的AI识别方法

零样本学习是当前最具挑战的AI识别方法之一。简单来说就是识别从未见过的数据类别,即训练的分类器不仅仅能够识别出训练集中已有的数据类别,还可以对于来自未见过的类别的数据进行区分。

这是一个很有用的功能,使得计算机能够具有知识迁移的能力,并无需任何训练数据,很符合现实生活中海量类别的存在形式。

传统的“零样本学习”方法首先是让智能体(Agent)对类别进行语义理解。将类别标签利用辅助知识(如属性)嵌入到语义空间中,再利用训练集中的数据,学习这种从图像到语义的映射关系。此后,即使遇到新的类别,只要提供了该类别的语义知识,模型即可识别该类别,这就是零样本学习。

例如,识别一张斑马的图片,但在训练时没有训练过斑马的图片。那么我们可以通过比较这张斑马图片中包含的属性和各个类别的属性定义,进而在属性空间中找到与该测试图片相近标签,即为该图片的标签。

而零样本学习的意义也显而易见:在传统图像识别任务中,训练阶段和测试阶段的类别是相同的,但每次为了识别新类别的样本,则需要在训练集中加入这种类别的数据。一些类别的样本收集代价大,即使收集到足够的训练样本,也需要对整个模型进行重新训练。这都会加大识别系统的成本,零样本学习方法便能很好的解决这个问题。

02

将来未知语言也能翻译

早期的零样本学习研究可以追溯到2008年,Larochelle等人针对字符分类问题提出了零样本学习(zero shot learning)方法,并且识别准确率达到了60%。

2009年,Lampert等人提出了Animals with Attributes数据集和经典的基于属性学习的算法,才真正打开零样本学习的关注度。

北大硕士赵波表示,在一些场景下,如细粒度物体识别、任意语言之间的翻译等,难以获得足够的有标注的数据来训练识别或预测模型。因此,零样本学习具有重要的研究意义和广泛的应用场景。

受人类学习能力的启发,零样本学习希望借助辅助知识(如属性、词向量、文本描述等)学习从未见过的新概念。目前,零样本学习被认为是实现大规模物体识别的一个重要方式。

以下是零样本学习的几个潜在应用场景:

01

未知物体识别

例如,模型在“马”、“牛”等类别上训练过,因此模型能够准确地识别“马”、“牛”的图片。当模型遇到“象”这个新类别,由于从未见过,模型无法作出判断。

传统解决方案是收集大量“象”的图片,与原数据集一起重新训练。这种解决方案的代价高、速度慢。

然而,人类能够从描述性知识中快速学习一个新概念。例如,一个儿童即使没有见过“象”,当提供他文本描述“象是一种的大型食草类动物,有长鼻和长牙”。儿童能够根据描述快速学会“象”这一新类别,并能在第一次见到“象”时识别出来。零样本学习与之类似,在没有任何训练样本的情况下,借助辅助知识(如属性、词向量、文本描述等)学习一些从未见过的新概念(类别)。

02

未知语言翻译

比如,要进行三种语言之间的翻译,按照传统的方法需要分别训练六个网络,在日语和韩语之间没有那么多样本的情况下,训练英语→特征空间→日语,韩语→特征空间→英语这两个网络,那么就可以自动学会韩语→特征空间→日语这个翻译过程。

03

未知类别图像合成

近年来,对抗网络GAN被用于图像合成,取得了以假乱真的效果。但传统图像合成仅能合成见过的类别的图像。零样本图像合成希望模型能够合成从未见过的类别的图像。目前已有一些算法通过条件GAN网络实现了零样本图像合成。

04

图像哈希

传统图像哈希算法利用一些训练样本来学习针对某些类别的哈希算法。但这些学习到的哈希算法无法用于新类别。零样本图像哈希,希望在已知类别上学到哈希算法能够运用到新的未知类别上。一些基于属性的零样本哈希算法已经被提出。

03

AI Challenger的“野心”

“数据是AI的燃料,开放数据集,才会更好地推动AI产业的进步”。去年底,创新工场董事长兼CEO、人工智能工程院院长李开复在北京举办的AI Challenger颁奖典礼上如此描述举办“AI Challenger全球AI挑战赛”的初心。

按照最初设定的目标,“AI Challenger全球AI挑战赛”首先要建设紧贴前沿科研任务需要的数据集,再者是要建立超大规模的高质量数据,第三个目标是要打造开放的世界级平台。

在初步打开影响力的基础上,大赛执委、创新工场人工智能工程院副院长王咏刚表示,希望在2018年,AI Challenger能吸引更多国际、国内的高水平参赛团队,并建立算法、代码、论文、数据、比赛的分享和交流平台。此次零样本学习算法大赛,正是将赛事常规化,技术分享平台化的一个有力尝试。

据主办方透露,除了AIC大赛,类似的零样本学习竞赛的小型赛事将按季度举办,贯穿全年,用更高水准、更多样化的比赛形式,打造出成为一个真正连接人才、AI、数据的优质平台。

竞赛奖励

以下提及金额为税前金额,详细规则请参考《竞赛选手报名协议》

冠军:30,000人民币,颁发获奖证书

亚军:10,000人民币,颁发获奖证书

季军:3,000人民币,颁发获奖证书

双周冠军:3,000人民币

双周亚军:2,000人民币

双周季军:1,000人民币

数据集下载

数据集下载地址:

https://challenger.ai/datasets

此次数据集和竞赛,由北京大学博雅特聘教授、博导、国家杰青王亦洲教授,复旦大学付彦伟教授,创新工场AI工程院,在AI Challenger平台联合推出。

背景知识

什么是经典零样本学习方法?

最经典的零样本学习方法是Lampert提出的直接属性预测模型(DAP)。模型中属性训练是在传统特征提取的基础上的进行的,首先使用颜色直方图、局部自相似直方图、SIFT 和PHOG 等6 种方法来提取样本图像的底层特征,这几种特征包含了图像的颜色、形状和纹理等方面,所以通过这种特征提取方法得到的特征可以良好的表达图像中的信息。这几种图像特征不仅适用与线性分类器,而且在非线性分类器中也能达到良好的表现。

在DAP方法中,通过上述的特征提取方法得到样本的图像特征后,将特征用于属性分类器的训练,然后将训练得出的模型用于属性的预测,最后采用贝叶斯方法推算测试样本的类别。近年来深度特征的使用大幅提高了零样本识别的准确率。

相关下载

玩家评论

《魔兽世界怀旧服》纯净的样本怎么得 纯净的样本获得详情一览

导 读 魔兽世界怀旧服怎么获得纯净的样本?相信很多玩家都很好奇这个道具的获得方法,这边九游小编给大家介绍下吧! 纯净的样本获得详情一览: 魔兽世界怀旧服游戏中有一个远方的详情>>

阅读: 4
日期: 2019-12-23
出行大变局,曹操出行成主机厂转型样本

原标题:出行大变局,曹操出行成主机厂转型样本 经过几轮厮杀后,网约车拥挤的赛道上突然挤入了一些“不一样”的选手。或许是看到了出行市场的巨大增长详情>>

阅读: 8
日期: 2019-11-15
筹备未来登月计划NASA打开尘封40多年的登月样本

原标题:筹备未来登月计划 NASA打开尘封40多年的登月样本 中新网11月8日电 据外媒报道,1972年,美国阿波罗17号飞船登月时,带回了部分土壤和岩石样本供详情>>

阅读: 7
日期: 2019-11-08
南山国家公园︱国家公园的南方样本

原标题:南山国家公园︱国家公园的南方样本 六月初,连日的暴雨将通向坳岭村三组的砂土路撕开了一道近七十公分的裂口,横在村委会书记伍玉彪跟前。他连忙详情>>

阅读: 13
日期: 2019-08-28
《dnf》泥土样本怎么得 在哪里?

DNF很多玩家不知道泥土样本是怎样获得的,下面我们一起来看看玩家们的详细的方法介绍。 泥土样本获得: 打蚂蚁,走上面,最好把左上2个图也刷了。会有几率掉落泥土样本。接下去还有详情>>

阅读: 6
日期: 2019-08-23
深海迷航珊瑚管样本在哪里 珊瑚管样本怎么获得

在深海迷航中珊瑚管样本是非常重要的,因为它可以用来制作漂白剂。漂白剂可以用来合成高级无菌水,维持基本的生命体征。那么深海迷航珊瑚管样本在哪里?珊瑚管样本怎么获得?攻略对详情>>

阅读: 21
日期: 2019-06-29
DNF魔界裂缝生物样本怎么获得 生物样本速刷攻略

不少玩家都很感兴趣2018DNF魔界裂缝生物样本怎么快速获得,因此针对这个问题给各位介绍一番魔界裂缝生物样本速刷攻略/换什么好,希望对你们有用各位。 详情>>

阅读: 3
日期: 2018-09-11
dnf魔界裂缝生物样本怎么得 生物样本在哪刷

dnf魔界裂缝生物样本怎么得 dnf魔界裂缝生物样本在哪刷dnf魔界裂缝生物样本可以在活动商店换奖励,是魔界裂缝调查行动活动道具。dnf魔界裂缝生物样本怎么得,小编分享下... 详情>>

阅读: 3
日期: 2018-09-11
样本采集选择时间的最佳原则中,不正确的是

小编为您搜罗的答案:正确答案:A解析:样本采集时间要根据血循环中分析物水平的变化而定,保证每天样本采集时间恒定对于消除由日内变异造成的影响很重要。选择最佳采集时间的目的是为了提高检出的阳性率。症详情>>

阅读: 4
日期: 2018-08-13
dnf泥土样本怎么得 在哪里

dnf泥土样本怎么得 在哪里.游戏更新,尽在52PK新游戏频道.... DNF很多玩家不知道泥土样本是怎样获得的,下面我们一起来看看玩家们的详细的方法介绍。 泥土样本获得: 打... 详情>>

阅读: 12
日期: 2018-07-21
鱼宝样本制造法

AB两号各放一百鱼宝,然后A号复到B号,然后把B号的鱼宝卖光,买个药,存盘下线!详情>>

阅读: 6
日期: 2018-06-23
[教育攻略]护士求职简历样本模板参考 详解怎么玩

个人基本简历姓名:赵xx小姐国籍:中国无照片目前所在地:广州民族:汉族户口所在地:湖南身材:162cm 62kg婚姻状况:已婚年龄:53岁培训认证:详情>>

阅读: 5
日期: 2018-06-23
中国游戏产业的进化样本:37互娱

在快速崛起的游戏公司中,三七互娱2011年创业,2014年登陆资本市场,去年的游戏营收为42亿元。它已经在2015年5月完成整体上市,2016年跻身互联网百强企业前20名。详情>>

阅读: 16
日期: 2016-09-17
精彩推荐