您当前所在位置: > 爆料站 > 发号福利

国内科学家团队发布超大规模AI预训练模型

时间:2021-03-24 15:18:02  来源:  作者:网络转载
疯狂的科学家 Terapets2

疯狂的科学家 Terapets2

大小:43.0MB更新:2019-07-03

分类:休闲益智

  北京智源人工智能研究院发布四个超大规模人工智能预训练模型,统称为“悟道1.0”,涵盖中文语言、多模态、认知、蛋白质预测四个领域,是帮助国内企业、机构开发人工智能应用的大型基础设施。

1

  “悟道1.0”由智源研究院学术副院长、清华大学唐杰教授领衔,带领来自北京大学、清华大学、中国人民大学、中国科学院等单位的100余位AI科学家团队联合攻关,同时与快手、搜狗、360、阿里、新华社等龙头企业共同研发工业级示范性应用。

  智源研究院院长黄铁军教授介绍,近几年这轮人工智能浪潮的基本特点是“数据+算力+算法=模型”,模型浓缩了训练数据的内部规律,是实现人工智能应用的载体。近年来人工智能的发展,已经从“大炼模型”逐步迈向了“炼大模型”的阶段,通过设计先进的算法,整合尽可能多的数据,汇聚大量算力,集约化地训练大模型,供大量企业使用,是必然趋势。

  智源研究院2020年10月启动“悟道”项目,研发规模大(主要体现为参数量)、智商高、具备类人认知能力、统一对多模态数据的理解和建模、满足各种应用需要的预训练模型,特别是注重中文语料的采集和训练。

  四大模型:中文、多模态、认知、蛋白质预测

  “悟道”模型技术委员会主任、智源研究院学术副院长唐杰教授介绍,“悟道1.0”先期启动了4个大模型的研发。

  以中文为核心的预训练语言模型“悟道·文源”目前模型参数量达26亿,具有识记、理解、检索、数值计算、多语言等多种能力,并覆盖开放域回答、语法改错、情感分析等20种主流中文自然语言处理任务,技术能力已与GPT-3齐平。

  其目标是构建完成全球规模最大的中文预训练语言模型,在文本分类、情感分析、自然语言推断、阅读理解等多个任务上超越人类平均水平,探索具有通用能力的自然语言理解技术,并进行脑启发的语言模型研究。

  超大规模多模态预训练模型“悟道·文澜”,目前模型参数量达10亿,基于从公开来源收集到的5000万个图文对上进行训练,是首个公开的中文通用图文多模态预训练模型。

  其目标是突破基于图、文和视频相结合的多模态数据的预训练理论难题,并最终生成产业级中文图文预训练模型和应用,并在多个评测应用上超过国际最高性能。

  该模型已对外开放API,并有两款小应用,可以为用户上传的照片配文,或搭配最合拍的音乐。

  面向认知的超大规模新型预训练模型“悟道·文汇”,目前参数规模达113亿,在AI作诗、AI作图、AI制作视频、图文生成、图文检索、复杂推理等多项任务中的表现已经接近突破图灵测试,可以应用在电商行业自动撰写商品文案等场景。

  其目标是研发出千亿至万亿级参数量的、更通用、且性能超越国际水平的预训练模型,搭建预训练模型体系,从认知角度研究通用人工智能,发展模型基于逻辑、意识和推理的认知能力。

  超大规模蛋白质序列预测预训练模型“悟道·文溯”,已在蛋白质方面完成基于100GB UniParc数据库训练的BERT模型,在基因方面完成基于5-10万规模的人外周血免疫细胞(细胞类型25-30种)和1万耐药菌的数据训练,同时搭建训练软件框架并验证其可扩展性。

  其目标是以基因领域认知图谱为指导,研发出十亿参数规模、可以处理超长蛋白质序列的超大规模预训练模型,在基本性能、可解释性和鲁棒性等多个方面达到世界领先水平。

  WuDaoCorpora:全球最大中文语料数据库

  在科研方面,“悟道1.0”取得了多项国际领先的AI技术突破,与现有同类算法及模型相比提升了训练速度,提高了识别准确度和效率。不过更值得一提的是该项目建设并开放了全球最大中文语料数据库WuDaoCorpora。

  WuDaoCorpora数据规模达2TB,超出之前全球最大的中文语料库CLUECorpus2020十倍以上,同时着重去除了数据中包含的隐私信息,防止了隐私泄露。

  WuDaoCorpora的数据来源丰富,包括新闻咨询、评论、百科、论坛、博客、学术论文等,使得该数据集能够适用于不同种类的自然语言处理任务,训练出的模型泛化性更强。

  此外,WuDaoCorpora数据标签的完备性较高,语料中包含医疗、法律、金融等领域标签,可以依据需求抽取某个特定领域的数据,用于训练该领域的模型,也可以用于对大模型进行微调,构建某一特定领域的应用。

  该数据集不仅为“悟道”项目提供了数据支撑,还可被用于中文自然语言处理领域的多种任务模型训练,包括文本生成模型、词嵌入模型、问答对话模型等,对于国际自然语言处理领域的发展将有着积极的促进作用。

  【来源:cnBeta.COM】

资源转载网络,如有侵权联系删除。
相关下载

玩家评论

科学家找到未来节能数据存储的新型超快控制方案

  据外媒报道,现在,全球每年产生的数字数据正在以泽字节(以下简称zb)计算,即万亿亿字节--相当于每秒传送数亿本书的数据。生成的数据量在继续增长。如果现有的技术保持不变,那详情>>

阅读: 2
日期: 2021-03-21
科学家研制新光盘:存储容量高达700TB!

  磁盘和闪存是当下最主流的存储方案,但从绝对寿命来说,其远不如光盘。  一些研究者认为,因为磁盘的可靠性问题,并不会减少数据中心领域的碳足迹。  据报道,来自上海理工详情>>

阅读: 1
日期: 2021-03-19
科学家利用新双面投影技术绘制更优质地球平面地图

  据Phys.org报道, 三位科学家发明了一种新方法,试图用一种新投影方式来将我们的球形行星描绘成一幅平面图像,这包括将地图打印成一个双面圆。 Double-Sided Gott投影将一详情>>

阅读: 1
日期: 2021-02-19
科学家设计AI系统从无声钢琴演奏视频中再现演奏声音

  据外媒New Atlas报道,想象一个计算机程序能够直观地识别出在无声的钢琴演奏视频中演奏的是哪首乐曲,或许并不夸张。然而, 一个新的人工智能系统却更进一步,以数字方式逼真详情>>

阅读: 4
日期: 2021-02-12
AmongUS:科学家的实验失误,居然带来如此严重的后果。

AmongUS:科学家的实验失误,居然带来如此严重的后果。详情>>

阅读: 10
日期: 2021-02-08
科学家开发智能诊断App:通过咳嗽声可识别新冠

  据俄媒 Vesti 报道, 俄罗斯专家开发了一种神经网络诊断系统,能够通过咳嗽声实时判断患者是否患有新冠肺炎 。目前基于该诊断系统的手机 App Acoustery 也已开发出来。 详情>>

阅读: 2
日期: 2021-01-19
因地球自转速度加快科学家提议将一分钟缩短至59秒

  据外媒BGR报道, 一些科学家正提议将一分钟缩短至59秒,以弥补地球自转速度加快带来的影响。 有人提议通过“负闰秒”来保证计时精确地与地球自转一致。然而,从详情>>

阅读: 4
日期: 2021-01-15
原创LNG被毒奶,IG仍获首败!宁王:我尬了!曾经的我相信科学

原标题:LNG被毒奶,IG仍获首败!宁王:我尬了!曾经的我相信科学 北京时间2021年1月13日,英雄联盟LPL春季赛常规赛第二周迎来了IG与LNG的对决。值得一提的是详情>>

阅读: 4
日期: 2021-01-13
LNG被毒奶,IG仍获首败!宁王:我尬了!曾经的我相信科学

原标题:LNG被毒奶,IG仍获首败!宁王:我尬了!曾经的我相信科学 北京时间2021年1月13日,英雄联盟LPL春季赛常规赛第二周迎来了IG与LNG的对决。值得一提的是,从详情>>

阅读: 2
日期: 2021-01-13
SpaceX将把满载科学实验结果的“龙”飞船返回舱带回地球

  SpaceX公司在为NASA完成第21次商业补给服务任务后,会安排一艘独特的货运“龙”飞船返回地球。 改造后返回舱将在大约12小时后离开国际空间站,并在佛罗里达州详情>>

阅读: 6
日期: 2021-01-11
王志军:讲究科学性是面部年轻化的第一要务_效果

原标题:王志军:讲究科学性是面部年轻化的第一要务 近日,联合丽格第二医疗美容医院王志军院长做客《健康大讲堂》,就面颈部软组织松弛松垂、脸型改变详情>>

阅读: 4
日期: 2020-12-25
惊艳!济南国际医学科学城体验展示中心设计出炉!_生命

原标题:惊艳!济南国际医学科学城体验展示中心设计出炉! 近日,天津大学建筑设计规划研究总院中标济南国际医学科学城体验展示中心项目。 该项目总建详情>>

阅读: 2
日期: 2020-12-10
惠普推出数据科学软件包简化数据科学工作

  以“Z by HP Data Science Software”软件包的形式,惠普今天为部分移动工作站和笔记本电脑提供了全新的 Ubuntu Linux 发行版本。这不仅仅只是在设备上预装详情>>

阅读: 5
日期: 2020-12-08
科学家提出疯狂地球拯救计划:将阳光调暗

  据外媒报道,近日在《Environmental Research Letters》上发表的一篇新论文指出, 向地球大气中喷射反射粒子可能最终会阻止地球因持续的气候变化而遭受毁灭性的干旱问题详情>>

阅读: 3
日期: 2020-11-25
小函逃跑吧少年401:小函购买科学家啦!还成功抓4人

小函逃跑吧少年401:小函购买科学家啦!还成功抓4人详情>>

阅读: 20
日期: 2020-11-08
科学家发现让喵星人一天多餐可能存在健康风险

  据外媒报道, 你是否经常每天喂猫超过一次?如果是这样的话,你可能无意中让你的猫的健康处于危险之中 ,至少根据加拿大圭尔夫大学的安大略兽医学院和农业学院的一项新研究是详情>>

阅读: 4
日期: 2020-09-24
科学家发现能完全中和新冠病毒的突破性药物

  据外媒报道,来自匹兹堡医学院的研究人员最近取得了一项科学突破,这项突破将可能有助于人们摆脱新冠大流行。具体来说,研究人员成功分离出了能完全中和新冠病毒的最小分子详情>>

阅读: 5
日期: 2020-09-20
前FB数据科学家批判公司无视平台的政治操控问题

  据外媒报道,一名被解雇的Facebook数据科学家撰写了一份6600字的备忘录。 在这份备忘录中,她谴责了该公司无视其平台被用来左右公众舆论和操纵世界各地选举的证据。 获悉详情>>

阅读: 7
日期: 2020-09-15
科学家们可能已经找到能逆转孤独影响的方法

  据外媒报道,多年来,一些研究已经将社会孤立--特别是在童年时期--跟一个人一生中的负面健康结果包括心理健康问题、某些疾病风险的增加等联系起来。孤独是如何导致这些问详情>>

阅读: 7
日期: 2020-09-02
科学幻想系列《机器人笔记:精英》10月14日登陆Steam

  根据MAGES.官方的相关消息,科学幻想系列《机器人笔记:精英》将于2020年10月14日在Steam平台推出,故事发生在“扩张现实”的附近,2019年的种子岛,世界线变动率&ldqu详情>>

阅读: 1
日期: 2020-09-02
外媒:科学家即将探索海洋中的神秘“蓝洞”

  据外媒BGR报道, 研究人员正着手探索海洋最大的奥秘之一:一种被称为 “蓝洞”的海底天坑。 蓝洞是海底下的巨大洞穴,是由某种未知的力量形成的,不过科学家们相信详情>>

阅读: 6
日期: 2020-08-10
MC小盘点:炼药锅能压缩水?一点也不科学!

MC小盘点:炼药锅能压缩水?一点也不科学!详情>>

阅读: 22
日期: 2020-08-10
双生视界某科学的超电磁炮联动活动介绍 某科学的超电磁炮联动决定

双生视界某科学的超电磁炮联动已经决定了,很多玩家对于某科学的超电磁炮联动也是非常期待,下面小编给大家带来了双生视界某科学的超电磁炮联动介绍,一起来看看吧。 某科学的超详情>>

阅读: 12
日期: 2020-08-08
双生视界某科学的超电磁炮联动活动介绍某科学的超电磁炮联动决定

双生视界某科学的超电磁炮联动已经决定了,很多玩家对于某科学的超电磁炮联动也是非常期待,下面小编给大家带来了双生视界某科学的超电磁炮联动介绍,一起来看看吧。某科学的超电详情>>

阅读: 10
日期: 2020-08-08
人类存在的意义是什么?科学家怀疑,我们或被某种无形力量控制_宇宙

原标题:人类存在的意义是什么?科学家怀疑,我们或被某种无形力量控制 生活在太阳系,地球是我们赖以生存的家园,而人们每每仰望星空,总是会发出类似的感想详情>>

阅读: 3
日期: 2020-08-07
《咔叽探险队》科学家武器怎么选择 科学家武器选择方法

导 读 《咔叽探险队》中武器可以提高科学家的战斗能力,那么科学家武器选择什么好呢?那么今天小编就为各位玩家整理出了科学家武器推荐及选择指南,有需要的小伙伴们千万不要错详情>>

阅读: 12
日期: 2020-07-30
《最强蜗牛》科学院研究笔记怎么得 科学院研究笔记获取攻略

《最强蜗牛》科学院研究笔记怎么得 科学院研究笔记获取攻略 作者:互联网来源:九游发表时间:2020-07-详情>>

阅读: 7
日期: 2020-07-29
科学家研发新型自愈材料:自逾期从24小时缩短至1秒

  过去十几年间,不断有各种用途的自愈材料问世,未来汽车剐蹭、飞船破损都能自我修复。 近日受鱿鱼启发的自愈材料声称自愈能力要比大多数材料更快,只需要 1 秒就能自我修复详情>>

阅读: 6
日期: 2020-07-28
科学家开发智能搅拌棒将实时数据报告传送给用户

  据外媒报道,毋庸置疑,当化学家在实验室中搅拌溶液时,他们需要检查溶液的特性如何变化。 一种新型的 "智能搅拌器 "就是考虑到这一点而设计的,因为它可以自动检测和报告转详情>>

阅读: 10
日期: 2020-07-24
科学家意外培育出新品种杂交鱼Sturddlefish

  据外媒CNET报道,美国匙吻鲟(American paddlefish)和俄罗斯鲟鱼(Russian sturgeon)本来是没有关联的两种鱼类。 然而,匈牙利的科学家却意外地培育出两种鱼的新杂交品种 sturd详情>>

阅读: 4
日期: 2020-07-21
《咔叽探险队》科学家怎么玩 科学家玩法介绍

《咔叽探险队》科学家怎么玩 科学家玩法介绍 作者:互联网来源:九游发表时间:2020-07-19 19:22:00手详情>>

阅读: 1
日期: 2020-07-19
咔叽探险队科学家阵容攻略:科学家羁绊最强搭配推荐[多图]

咔叽探险队科学家阵容是很多玩家想要搭配好的一支强势阵容,那么怎么样搭配才能发挥出科学家羁绊效果达到最强战斗力呢,今天小编就为大家分享咔叽探险队科学家阵容攻略:科学家详情>>

阅读: 14
日期: 2020-07-19
咔叽探险队科学家怎么用 科学家沃尔特氪金培养方式

咔叽探险队科学家怎么用很多小伙伴都很不了解,接下来就让小编给各位小伙伴详细介绍。关注我们给你带来最新游戏小技巧!科学家沃尔特氪金培养方式首先我们从碎片获取开始,两种详情>>

阅读: 9
日期: 2020-07-18
咔叽探险队怎么刷科学家碎片 虚空岛刷科学家攻略

咔叽探险队怎么刷科学家碎片?作为开服最强的角色,自然是人人都想要拥有的,但也不是人人都那么欧可以抽到,所以我们只能选择碎片拼了。让我们一起来看看怎么刷科学家碎片吧。咔详情>>

阅读: 3
日期: 2020-07-18
咔叽探险队科学家怎么用 科学家沃尔特培养攻略

咔叽探险队科学家怎么用?作为开服最强咔叽,玩家们对他的培养自然也是优先级最高的啦。那么科学家怎么用呢?让我们一起来看看吧。咔叽探险队科学家怎么用首先我们从碎片获取开详情>>

阅读: 8
日期: 2020-07-18
咔叽探险队科学家怎么加点?科学家天赋加点推荐[多图]

咔叽探险队科学家天赋怎么加点?科学家这个角色使用起来非常的容易,上手比较快,很多新人玩家都会选择科学家,既然选择了科学家,那么就要了解科学家的天赋加点,如何选择天赋是很重详情>>

阅读: 14
日期: 2020-07-14
《某科学的超电磁炮T》16话PV公布7月24日播出!

【导读】先前,由于受到疫情的影响,《某科学的超电磁炮T》官方宣布第16话“天赋梦路”延期至7月24日播出。目前,距离该话正式播出已经不到两周了,官方目前公开了一段第16话“天赋详情>>

阅读: 3
日期: 2020-07-13
科学家设计新型空气过滤器据称可杀死COVID-19病毒

  据外媒报道,在新冠大流行期间戴口罩和保持社交距离绝对是当务之急, 但一种实验性的新型空气过滤器可以帮助限制COVID-19的传播。据称,该装置可以通过加热导致疾病的病毒,详情>>

阅读: 7
日期: 2020-07-08
辐射4科学怎么升级_辐射4科学的升级方法_快吧单机游戏

作者: 可达鸭 2020-06-29 16:17 整理 《辐射4》游戏中玩家在技能树面板(智力per详情>>

阅读: 13
日期: 2020-06-29
最强蜗牛大科学家评测大科学家获得方法与使用点评

最强蜗牛中的装备是非常重要的,本次就为大家带来了最强蜗牛大科学家评测,也是大科学家获得方法与使用点评,非常全面的内容,想了解大科学家的朋友可以参考,希望能帮到大家。大科学详情>>

阅读: 3
日期: 2020-06-18
精彩推荐