您当前所在位置: > 爆料站 > 有深度

从上千篇论文脱颖而出,支付宝论文凭什么获得WWW2020评委认可?

时间:2020-04-15 20:15:58  来源:  作者:网络

原标题:从上千篇论文脱颖而出,支付宝论文凭什么获得WWW2020评委认可?

2020年4月20-24日,国际顶级学术会议WWW2020(The Web Conference 2020)在中国台湾举办。创办于1994年的WWW会议,是CCF-A类会议,每年有大批的学者、研究人员、技术专家、政策制定者等参与。

据悉,受COVID-19疫情影响,WWW2020将在线上举行。此次会议共收到了1129篇论文投稿,录用217篇,录取率仅为19.2%。 其中蚂蚁金服有多篇论文入选,围绕智能服务、认知计算等课题,向行业分享自身沉淀的金融智能应用成果。

事实上,蚂蚁金服一直是国际顶级学术会议的“常客”。除了WWW,蚂蚁金服也多次亮相NeurIPS、ICML、ICLR、AAAI、IJCAI、SIGIR、NAACL、VLDB、ACM T-IST、KDD、CVPR 等国际顶级学术会议,为学界带来了诸多结合实际业务场景的创新研究和应用。对蚂蚁金服而言,在顶级学术会议上发布论文,一方面可推进人工智能最前沿研究的发展,将学术研究与应用相结合,另一方面可推进前沿技术从研究到实际应用中落地,为用户带来价值,为我们的生活服务带来改变。

接下来,小蚂蚁将为大家重点介绍本次蚂蚁金服入选的论文成果。

Enhanced-RCNN: 一种高效的比较句子相似性的方法

在本篇论文中,我们提出了一种新型高效的比较句子相似性的方法 Enhanced-RCNN,来更好的捕捉待比较的两个文本自身以及相互之间的信息。这是我们在经典文本匹配模型 ESIM的基础上改进的模型,该模型在 Quora Question Pair 和 Ant Financial 两个公开的文本匹配数据集上均取得了非常有竞争力的结果,并且和时下火热的预训练语言模型 BERT 相比,Enhanced-RCNN 也取得了相当的效果,其中参数量相比BERT-Base 也大幅减少,较为适合用于线上部署使用。同时,通过一些知识蒸馏的方法(KnowledgeDistillation),也可以将Enhanced-RCNN作为学生模型(Student Model)去学习BERT-Base,即老师模型,来进一步提升原有Enhanced-RCNN模型的预测准确率。

IntentDial: An Intent Graph based Multi-Turn Dialogue System with Reasoning Path Visualization

(基于意图图谱的路径推断可视化多轮对话系统)

本论文中,蚂蚁金服工程师创新性在智能问答中结合图谱结构和强化学习进行建模,(1)通过引入图谱结构,可将问答相关的领域先验知识引入模型训练,加速强化学习模型收敛,同时模型结果为当前上下文获得的图谱路径推断,可解释性高,一方面可用于指导分析模型训练过程中出现的问题,另一方面路径推断中的要素节点可作为实体识别结果用于对话其他模块。(2)通过采取该多轮对话方式,可以有效同时解决对话过程中用户描述清晰和模糊的情况,扩展性高。

A Generic Solver Combining Unsupervised Learning and Representation Learning for Breaking Text-Based Captchas

在过去的十多年里,人们已经提出了多种验证码破解方法,其中许多方法需要针对不同的验证码类型使用独特的滤波和分割方法来实现字符识别,这类方法的泛化性较差,且需要过多的人工参与。随着更复杂的安全特性被引入到文本验证码中,这些方法也不再适用。而一些基于深度学习的验证码识别算法在准确性上取得了显著的提高,但这些方法的主要问题是需要大规模的带有标签的训练样本参与训练,而这通常需要耗费大量的人工成本。

大规模带有标签验证码图像难以收集,但是无标签的图像样本却是很容易大量采集得到。在深度学习领域中,无监督学习和表征学习都可以减少对于标签样本的依赖,充分利用无标签数据样本去学习数据表征,提升深度学习方法的性能。我们通过设计了一个结合无监督学习和表征学习的验证码识别方案,在不依赖人工参与和大规模带标签训练样本的前提下,实现文本验证码的自动识别。经过实验测试发现,我们的方法仅仅使用500张带有标签的训练样本就可以破解大多数主流网站的验证码,这也说明了目前文本验证码的部分安全特征很容易破解。通过我们所提出的方法可以发现现有验证码的漏洞,并且分析不同安全特征的有效性,从而开发出更安全可靠的验证码。

Solving Billion-Scale Knapsack Problems

(求解亿级变量背包问题)

背包问题 (knapsack problem) 是经典的整数规划问题,求解如何从多个物品中选取一个子集放入背包,在容量限制下最大化子集的效用。互联网场景下很多问题可以看成超大规模的背包问题或者它的变种问题,比如红包营销,用户流量分配等,都有某种总资源的限制,需要在大量的用户粒度的决策中选取一个子集来最大化业务收益。由于背包问题是 NP-hard,求解复杂度高,所以精确算法无法做较大规模的求解。而近似类算法对问题的形式化有具体要求,实际业务的需求一般不会严格符合背包问题的定义,所以需要求解算法有更强的泛化性和通用性。因此,如何在高精度下求解超大规模背包问题及其变种问题仍然是一个挑战。

蚂蚁金服的工作是最早做到对亿级变量的背包问题求解工作之一。我们的问题形式化涵盖了互联网海量数据场景下的泛化背包问题。它的“物品”有两个维度:用户和选项,即“为每位用户选择哪些选项”。它的“背包容量”扩展到了多个维度,即每个用户的每个选项可以消耗多个不同的资源。同时我们还支持对每个用户的选项做任意整数规划的约束。

用于图像检索的等距离等分布三元组损失函数

图像检索由于类内差异大、类间相似性高,非常具有挑战性。深度度量学习在该任务上取得了一定的效果。然而,最为经典的深度度量学习损失函数——三元组损失,存在一定的问题。首先,三元组损失约束了匹配对和不匹配对间的距离差异至少为一个固定间隔值,由于没有直接约束匹配对或者不匹配对的距离,使得局部范围内三元组满足间隔约束时不能保证全局范围内也满足。其次,改进的三元组损失进一步约束所有匹配对距离小于某个固定值以及所有不匹配对的距离大于某个固定值,这种固定值约束没有考虑到图像不同类别的独特性,容易造成特征空间扭曲。因此,为了在全局范围内进一步拉近匹配对的距离和推远不匹配对的距离,在三元组损失的间隔约束基础上,我们针对匹配对和不匹配对分别进行了相对距离约束。

在本篇论文中,蚂蚁金服工程师提出了EET方法,通过等距离约束进一步拉近匹配对的距离,等分布约束进一步推远不匹配对的距离,最终实验结果亦表明该方法可以用在多个检索任务上。游戏网

相关下载

玩家评论

2018年全国产出卓越科技论文31万余篇

原标题:2018年全国产出卓越科技论文31万余篇 2018年我国产出卓越科技论文31万余篇 新华社北京11月19日电(记者温竞华)中国科学技术信息研究所19日详情>>

阅读: 3
日期: 2020-03-20
《率土学院第一期:游戏论文大赛》正式启动,解锁论文新玩法_活动

原标题:《率土学院第一期:游戏论文大赛》正式启动,解锁论文新玩法 12月19日,网易旗下三国策略手游《率土之滨》,宣布其《率土学院第一期:游戏论文大赛》详情>>

阅读: 9
日期: 2019-12-30
《率土学院第一期:游戏论文大赛》正式启动,解锁论文新玩法

12月19日,网易旗下三国策略手游《率土之滨》,宣布其《率土学院第一期:游戏论文大赛》活动正式开启。本次活动与网易游戏学院、大学生体验式学习成长平台——创详情>>

阅读: 7
日期: 2019-12-26
曹雪涛论文受质疑续:3篇论文作者承认用错图

原标题:曹雪涛论文受质疑续:3篇论文作者承认用错图 11月13日以来,美国微生物学家Elisabeth Bik在国际匿名科研评审网站Pubpeer上发表文章,质疑曹雪涛详情>>

阅读: 8
日期: 2019-11-19
e只知道?论文 战犯杉山元:只知道将战争叫嚣到底的傻瓜元

 侵华骨干  九一八事变后,在陆军内部,拥戴荒木贞夫、真崎甚三郎的激进青年军官为中心的"皇道派"同以陆军省军务局长永田铁山大佐为主体的"统制派"之间的斗争越来越尖锐,1详情>>

阅读: 28
日期: 2019-10-20
核心论文发表,我和女朋友需要教育教学论文发表和经济论文发...

小编为您搜罗的答案:直接找个代理,帮你解决。常青藤论文网。文达论文网期刊360等等。很多。详情>>

阅读: 10
日期: 2018-07-23
在育碧你甚至能修改论文 玩家咨询历史论文获《刺客信条》制作组回复

《刺客信条》最大的魅力莫过于其浓浓的历史韵味,游戏细节当中处处体现着《刺客信条》制作组雄厚的历史功底。近日,有一位中国玩家在埃及历史论文上遇到了一些问题,询问育碧是否能就托勒密时期埃及的论文给自己一些详情>>

阅读: 4
日期: 2018-04-27
在育碧你甚至可以修改论文?暖心故事:玩家获得育碧指点历史论文

原标题:在育碧你甚至可以修改论文?暖心故事:玩家获得育碧指点历史论文育碧这个公司相信很多玩家都知道,代表游戏有刺客信条、雷曼、波斯王子、孤岛惊魂5等。育碧的游戏一直详情>>

阅读: 9
日期: 2018-04-26
精彩推荐