原标题:焱融科技助力科大讯飞搭建AI超大规模高性能存储集群
科大讯飞在语音及语言、自然语言理解、机器学习推理及自主学习等领域保持着国际前沿技术水平,同时在机器翻译、自然语言理解、图像识别、图像理解、知识图谱、知识发现、机器推理等方向上也处于业界领先水平,是国内当之无愧的人工智能领头羊。人工智能是高度依赖IT的行业,大量数据和计算的强有力支撑,也成为成就科大讯飞技术领先性的重要因素。
科大讯飞的数据平台架构和重点
谈到人工智能,不得不提深度学习,如今通过深度学习技术来实现人工智能,已成为业界普遍接受的共识。深度学习概念,在上个世纪80年代就已经被提出,但直到近些年才真正得以重视和应用,其背后是因为深度学习所依赖的两大要素(海量被标记的数据和强大的算力)成为现实,人工智能实质上变成了对数据的处理和计算的科学。科大讯飞人工智能的数据处理,也采用了业界主流的处理流程,可以通过下面的图示来描述:
在整个数据处理过程中,不同阶段所使用的技术,以及这些技术对数据访问的要求都有差别。数据处理的各个阶段及每个阶段对数据的访问特点如下图所示:
在数据准备阶段,科大讯飞采用Hadoop等大数据技术对数据进行清洗;模型训练阶段是整个处理过程的核心,它负责从海量数据的特征中通过深度学习算法,获得可交付的模型,用于人工智能产品和方案中。
科大讯飞的基础架构团队,需要为各个人工智能团队及业务部门提供稳定、高性能的训练存储平台,同时管理近千台高性能GPU服务器,训练使用的存储平台性能如何,直接影响业务部门的训练效率,是整个数据处理流程的重中之重,也是优化训练平台的切入点。
为了满足众多人工智能业务部门训练的需要,科大讯飞用于模型训练的数据平台必须具备以下特性:
为什么选择YRCloudFile作为训练的数据平台
焱融科技和科大讯飞从2019年开始,就进行了多次的交流和实际测试。科大讯飞的技术团队对训练使用的存储平台选型非常重视,最为关注的是数据平台的实际性能,包括大文件的随机读写、小文件的读写性能;海量元数据的操作性能(creation、stat、removal等);海量文件的支持,以及在海量文件的背景下,数据访问和操作性能是否保持一致;存储平台的稳定性;在故障场景,尤其是元数据服务故障场景下,集群性能的稳定性;与容器平台的对接;数据生命周期的管理等多方面能力。这些严格的评估标准,也是从实际业务的诉求和科大讯飞基础架构团队在多年的实际工作积累中提炼出来的。
YRCloudFile在架构上,可以完全与硬件解耦;在通用的服务器上就能充分发挥出高速存储介质和网络的性能,相对于其它的存储产品,性能领先数倍;元数据处理和访问性能,在故障场景下,元数据的访问性能尤为突出,充分满足海量小文件的访问需求和特点;在容器平台对接、冷热数据分层上具有特色鲜明的功能。综合产品多方面的考量要素,YRCloudFile是最贴近科大讯飞训练数据平台的高性能分布式文件存储产品。
在科大讯飞对焱融科技YRCloudFile进行深入了解和测试之后,双方达成了全面的合作。
YRCloudFile在科大讯飞的运行状况
随着科大讯飞和焱融科技的共同合作,YRCloudFile得以快速应用在科大讯飞核心的大规模深度学习训练集群生产环境中。凭借YRCloudFile灵活的软件部署架构和界面化快速部署能力以及焱融科技的全方位售后服务,从第一个YRCloudFile集群上线,到后续数个集群陆续部署,数据快速增长,只经历短短几个月时间,总数据规模已达到近10PB,存放近百亿用于训练的音频、视频、图片文件,单集群峰值带宽达近十GB/s,训练效率大幅提升。
整个科大讯飞语音训练平台服务于科大讯飞内部人工智能研究院近千台高性能计算服务器,大量科学家和算法工程师通过这些数据对模型进行持续优化,完成科大讯飞各类语音服务的产品输出。
在YRCloudFile服务科大讯飞过程中,焱融科技和科大讯飞的基础架构团队保持密切的沟通,通过数据IO模型特点的分析,焱融科技研发团队进一步针对科大讯飞的数据特点对YRCloudFile进行产品层面的优化,由此形成了YRCloudFile部署->IO特点分析->读写优化->更新上线的完整闭环。双方技术团队,基于YRCloudFile在2019年的IO500测试中,获得了全球第六的成绩。
YRCloudFile也通过在科大讯飞大规模的使用,快速积累更多服务人工智能企业高性能存储场景的经验和能力,产品得到了进一步的增强,也证明了YRCloudFile的产品稳定性及性能优势。
YRCloudFile在科大讯飞未来的规划
目前YRCloudFile已经为科大讯飞的训练集群提供了大规模的高性能数据服务,接下来还会继续扩大在此场景下的使用。
YRCloudFile给科大讯飞带来的价值
正如我们所介绍的那样,海量数据和强大算力是深度学习得以发挥作用的两大要素。YRCloudFile作为科大讯飞深度学习集群中所使用的高性能文件系统,在提供人工智能基础架构的核心存储服务的同时,也逐步体现出越来越大的商业价值。
总结
目前,国内的人工智能行业正迎来飞速发展的时机,AI交通、AI医疗、AI政务、AI教育、自动驾驶等多个人工智能场景在不断深入到我们的生活,YRCloudFile将帮助语音识别、视觉识别、自动驾驶等人工智能企业提升训练效率,增强人工智能企业的产品竞争力,从而更好地服务于更多的用户。
关于科大讯飞
科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界。2008年,公司在深圳证券交易所挂牌上市(股票代码:002230)。游戏网
相关下载 |
原标题: 游戏本用桌面级处理器有高性价比?GTX1650、高色域屏4599元 游戏本是一类既能玩游戏又满足便携性要求的产品,而对于一些不怎么经常“搬运”硬详情>>
原标题:亲民高性价比 雷柏VH500虚拟7.1游戏耳机点评 现在电竞游戏已经成为了我们日常生活中必不可少的组成部分,非常多的90后都是竞技类电脑游戏的详情>>
原标题:ROG魔霸3深度体验,一款散热表现优秀的出色游戏本 随着新兴电子产业链的日趋完善,笔记本界的各位大佬们争先斗艳,各自拿出看家本领,一次次升级完详情>>
原标题:光启技术:高性能电磁材料突破禁运后 签订千万级别订单 证券时报e公司讯,15日,e公司记者从光启技术独家获悉,该公司自主研发的外国禁运高性能电详情>>
原标题:更快搬出金秋礼包 近期高性价比搬砖图推荐 金秋版本已经开放了很长一段时间,对于很多回归玩家来说,已经开始慢慢积攒材料,等待制作装备、升级详情>>
原标题:光启技术:高性能电磁材料突破禁运 实现批量生产 光启技术研制的高性能电磁材料“白起”系列日前实现批量生产。这标志着我国在高性能电磁材详情>>
原标题:铂悦旅拍好评,为高性价比的婚纱照点个赞 拍婚纱照基本上是每个准备结婚的小伙伴备婚时的一个必备步骤,每对新人来决定拍摄婚纱照时心里都会有详情>>
原标题:吃鸡上分就要选择高性能手机,这些手机考虑下 [PConline 导购] 近年来,以王者荣耀、和平精英为代表的竞技类手机游戏红遍大江南北。无论是已经详情>>
原标题:携手京东安吉尔哪吒高性能净水器发布 要评选2019年的中国流行色,绝大部分消费者一定会将票投给“红、黑”,一部票房高达49.1亿的现象级电影《详情>>
原标题:全球最高性能 AI 芯片,阿里巴巴平头哥含光 800 正式发布 深圳湾现场报道,9 月 25 日上午,在 2019 云栖大会的开幕主会场上,阿里巴巴集团 CTO 兼详情>>
能选择以下几款键鼠,是在朋友们引导下做出的选择,既然对键鼠不专业,没法写出各位键盘发烧或已退烧玩家那种人键合一的专业点评,换个有说服力的形式,说明下面几款应该是特别有性价详情>>
原标题:被高性价比打动 入手浪琴785复古 中秋携媳妇儿和弟弟一家去过节,王府中环吃饭,吃完在王府大街遛弯,因为一直喜欢表,逢表店必进,当然也就想挨个表详情>>
原标题:编辑推荐:高人气商务台式机 高性价比更省预算 在企业的运营过程中,最离不开的一个词就是"成本",整个公司的住、用、人工都是企业运营的成本。详情>>
中新社呼和浩特8月22日电 (记者 李爱平)英特尔、华为、联想、戴尔、浪潮等全球知名科技“大咖”22日齐聚中国内蒙古自治区呼和浩特市,共同就高性能计算等话题展开探讨。当日,2详情>>
原标题:没有廉价版?传下代Xbox不再搞多版本 统一高性能 微软Xbox One X是本世代功能最强的游戏主机,而下一代“Xbox Scarlett”性能也会更强。不过之前的消息都详情>>
距离最新的“甜品”级游戏显卡GeForceGTX1660Ti系列发布不过一个月的时间,作为国内高端显卡品牌的iGame又一次为广大玩家带来了大惊喜——高性能PC平台的理想之选GeForceGT详情>>
近几年,随着科技的发展和游戏产商水平的提高,市面上游戏的种类和可玩性越来越高,游戏也变得越来越精致,成为了许多年轻人娱乐放松,缓解压力的方式之一。当然,想要... 详情>>
诛仙十年 送十年祝福语拿礼包周边 文章搜索 搜索 ...搭配弄出来的难度是差不多的,御仙流多3000气血5000...级真气流玩家御仙御魔真气6孔阵灵搭配取舍的探索,... 详情>>
它配备了一块刷新率为144Hz的电竞级别的屏幕,能有效的避免画面撕裂,让你拥有更流畅,更极速的游戏体验。此外,7.03毫米的微边框搭配上高达72%NTSC色域的IPS超高清... 详情>>
iGlassUSA公司宣布将在2019CES展会上演示一款增强现实眼镜,该款设备的售价不到300美元,定位消费品市场的相关应用。iGlassUSA宣称,iGlassAR眼镜是美详情>>
即日起至6月2日8点,惠普暗影精灵II代在京东商城开启预约,并于6月2日8点-6...雷神小钢炮ST-R1和联想拯救者14-ISK和华硕ROG S5VT6700和神舟战神Z7-SL7S4和... 详情>>
【中关村在线兰州行情】2018年3月13日,联想小新700电竞版是定位学生市场的一款笔记本,在继承了典雅秀丽风格的... 详情>>
欢迎阅读本期栏目,喜欢关注哦2018新年伊始,炫龙就给咱们献上了大礼,新上线发售了多款游戏主机。今天就先给大家介绍一下毁灭者K7Ti。目前京东已经开启预定,可享受400详情>>
R星今天发布了《GTAOL》的更新,玩家在本周游玩可获最高135万的GTA游戏币奖励,同时顶级洛圣都零售商推出得各种高性能载具优惠低至六折。&详情>>
《无限法则》这款游戏里A卡该如何设置高性能模式呢?许多玩家可能还不太清楚切换高性能的方法,下面就一起来看看“日向雏田?”介绍的《无限法则》笔记本A卡高性能设置方详情>>
小编为您搜罗的答案:N卡需要更新最新的显卡驱动,就能解决进入比赛跳出,读取进度跳出,以及回放会闪白,模糊的问题。我昨天刚刚晚上,也是这个问题。生涯模式做了2个多月板凳,终于首发,跳出~驱动精灵更新显卡详情>>
不知不觉,暑假已经快要结束了,相信很多小伙伴都在调整心情,准备开始下一阶段的学习生活。新学期,新气象,为自己配置一台称心如意的装备也是很有必要的,今天来谈谈电脑的显卡。显卡是电脑主机的重要组成部分,详情>>
2016年,通过OwensCorning、+Lab和KUKA的合作,3D打印热固性连续纤维复合材料Atropos3D打印研究项目屡获殊荣。据悉,+Lab是由米兰理工大学的MarinellaLe详情>>
小编为您搜罗的答案:首先要给你科普一下笔记本上面现在一般都是一张集显一张独显是两个芯片根据用户的使用方式选择合适的显卡工作比如你办公你不需要那么大的处理就用集显省电详情>>
0引言现代高性能处理器对数据传输和数据处理需求越来越高,时钟树作为处理器时钟信号传递的载体,对整个处理器的计算性能有着直接的影响。要想在低时钟偏差(clockskew)的要求下将时钟信号分配到各详情>>
非常感谢《芯板坊》提供此次测评的板卡:Z-turnLiteBoard,《芯板坊》打造电子行业最全的开发板&芯片资讯、评测、试用于一体的平台,有兴趣的朋友,可以关注他们的微信公众号,说不定会有意想详情>>
原标题:适合摄影爱好者的高性能相机:松下LUMIXGX9微单评测松下LUMIX的微型单电相机GX系列一直轻便和高规格都兼顾,不过在之前的GX8上面松下似乎想有所改进,所以用更大的机身尺寸来换取更丰详情>>
“投资界有一句至理名言——“不要把鸡蛋放在同一个篮子里”。说的是投资需要分解风险,以免孤注一掷失败之后造成巨大的损失。随着企业服务窗口的不断增加,业务中断对很多企业意味着毁灭性的灾难,因此,跨多个详情>>
随着大家对户外运动的热情高涨,摩托罗拉ME525+(Defy+)(改版MB525+、Defy)是MOTO推出的新款具备有三防功能的... 详情>>
8月份是最适合买手机的时刻,上半年的旗舰手机已经全部发售,大部分的旗舰手机进行了让利优惠,其中最值得入手的是这4款,性能强劲的同时还有很大的优惠,看好了直接入手哦,非常的超值!魅族16这是一款性价比详情>>
其次,联想也是最先入围全球超级计算机500强榜单的中国企业——2002年7月成功研制了世界上第一个实际速度超过1万亿次的大规模机群系统“深腾1800”,并凭借“深腾... 详情>>