欢迎您访问百度文心一言发布会:新一代大语言模型生成式 AI 产品亮相!

百度文心一言发布会:新一代大语言模型生成式 AI 产品亮相

更新时间:2024-10-30 11:02:15作者:佚名

IT技术的技术栈正在发生根本性变化。

来源|多知网

作者|冯玮

图片来源|百度

明天中午,百度就新一代大语言模型生成式AI产品“文心一言”召开发布会。

百度创始人、董事长兼首席执行官李彦宏介绍了当前文心一言在文学创作、商业文案创作、数理推测、中文理解、多模态生成五个使用场景中的综合能力。

其中的一些能力也同样可适配到教育场景中。

比如,发布会现场,面对“鸡兔同笼”的精典题型,文心一言能梳理出解题思路,并按正确步骤一步步算出答案;文心一言在现场还解释了词语“洛阳纸贵”的涵义、“洛阳纸贵”对应的经济学理论,并用“洛阳纸贵”四个字创作了一首藏头诗。

此前,作业帮、高途、学大、昂立、达内、宝宝巴士、艺术宝等教育领域品牌均宣布已接入文心一言。

孩子巴士官方曾表示:接入文心一言后,孩子巴士将基于百度智能对话技术成果,研制面向儿童启蒙的内容产品与服务,并应用于婴儿巴士旗下200尾款APP、2500多集视频及9000多期音频启蒙内容、点读笔及绘本等产品中……

李彦宏在现场罕见出现了紧张状态,同时直言目前的文心一言尚不算完美。

“但为何明天要发布?由于有市场需求,由于百度的各个产品线从搜索到智能云到手动驾驶到小度,你们都在等着要用这样的技术。更重要的是我们的顾客、我们的合作伙伴在等着用这样的技术。”李彦宏说道。

3月16日起,首批用户即可通过约请测试码,在文心一言官网体验产品,后续将相继开放给更多用户。同时期,百度智能云正式面向企业顾客开放文心一言API插口调用服务预约。

以下为李彦宏分享全文,经多知网编辑整理。

01

‍百度真的Ready了么?

敬爱的诸位来宾,诸位媒体界的同学们,欢迎你们来到百度出席我们此次文心一言的新闻发布会,谢谢你们始终以来对我们的关注和支持。

这段时间虽然不断的有人问我说为何现今发布?大家是不是真的ready了?

虽然百度在过去的十几年当中,始终从AI研制层面坚持投入文心大模型。

第一个版本是2019年就发布了,这么随后的每一年虽然都要发布一个新的版本。所以从这个意义上说,文心一言的发布只是我们过去多年努力的一个自然延续。

明天你们对文心一言的期望值是要对标ChatGPT,那这个门槛还是很高的,可以说全球的大厂当中百度是第一个发布的,像Google、Facebook、Amazon等现今都没有真正的发达衣岩类型的同级别的产品,百度是第一个。

从我自己在公测对文心一言的能力体验来说,它确实也不能讲称作完美。但为何明天要发布?由于有市场需求,由于百度的各个产品线从搜索到智能云到手动驾驶到小度,你们都在等着要用这样的技术,更重要的是我们的顾客、我们的合作伙伴在等着用这样的技术。

你们都在催,我们须要尽快地把它发布下来。

其实,一旦大语言模型这些产品发布下来,它还会获得真正的、真实的用户反馈;而有了用户反馈,它的迭代的速率都会特别快,能力提高也会特别快。

我们你们都希望文心一言才能快一点成长,才能尽快给用户和顾客带来价值,让所有的人都从中获益。

所以“十月怀孕,一朝引产”,明天我就带你们一上去看一看,百度的预训练生成式大语言模型,文心一言长哪些样?

我下边用5个Demo来分别展示一下文心一言的能力。

02

五个模块,五种能力

第一个是文学创作,第二个是商业文案的创作,第三个是数理逻辑的推测,第四个是英文的理解,第五个是多模态的生成。

首先来看一下文学创作。

这就是我们文心一言的界面,先来看一个有关三体的反例。

三体的作者是那里人?想先要晓得三体作者是谁,之后要懂得那里人是哪些意思,由于是跟我同乡,所以第一个问题选了可以总结一下三体的核心内容,假如要续写的话,可以从什么角度出发?

这么他总结了三体的第一步是哪些意思?第二步在讲哪些?第三步在讲哪些?续写又是角色的打造,情节设计、文化背景、哲学思索。

这么我们追问怎样从哲学角度来进行续写生命的意义,人与宇宙的关系,道德和伦理价值和信仰,科技和人文的关系。

再问电视剧三体的艺人都有什么?他比较确切的列举了一系列的参与的艺人,这么我们再问于和伟和张鲁一有什么共同点?都是优秀的实力派艺人获过多多个奖项,丰富的演出经验等等。

最后问于和伟和张鲁一谁更高?这么张鲁一比于和伟初一分米。

我们看见在这一轮的问答当中总共有6轮对话,这种对话可以彰显出文心一言总结剖析能力、推理的能力还有总结的能力等等。

你要问谁和谁相比更高的话,你先得明白对这个人臂展是多少,那种人净高是多少,之后再做一些比较好多这些事实性的东西。

这似乎对于一个搜索引擎来说不是这么难,然而对于一个生成式预训练大模型来说,它出错的几率还是挺高的,这种问题都答对相当不容易。

文心一言虽然也采用了知识提高和检索提高,我们有5500亿的事实知识在训练数据里,所以可以相对来说保证事实性的问题才能比较确切。

第二个Demo是商业文案的创作。

好,假如要创立一个用大模型服务中小企业数字化升级的科技服务公司,应当给它起个哪些名子?信智科技、数字云图、云集科技、意象科技、魔方科技,好,数字云图这个名称不错。

这么给我起一个公司的服务的slogan来抒发共赢的概念。

答案就是数智共赢、智慧未来。

当我生成一篇公司创立的新闻稿,数字云图,以共赢的服务理念,用大模型来服务中小企业的数字化升级,要求是600字左右,所以也生成了相应的新闻稿,我就不一个字一个字念了。

你们可以听到这儿头涉及到相应的这些理解的能力,抒发的能力,也包括一些这些创意创作的能力,这种个能力都是没有办法我们去一一的去教文心一言的,这么如何做到的?

虽然还是要有好的技术,要有大的数据,人们说读书破万卷,这么文心一言可能读了千亿万亿的页面,用了几十亿的搜索恳求,用了好多的图片,用了我们全部的知识图谱的这种个5500亿的事实。

在不断训练的过程当中就逐渐具备了一些比较通用的能力。

所以也有人讲说是大模型到了千亿的参数千这个参数达到千亿量级,这么又有足够多的训练语料数据来进行训练的时侯才会发生哪些现象?发生智能涌现,没有教过他的能力,他也会这个可以说是我们这方面的一个反例。

第三个Demo,我们来演示一下数理逻辑的估算。

下边我们来玩一个鸡兔同笼的游戏。

问有多少只鸡多少只小狗?文心一言说这题似乎出的不太对,算不下来了,我们改一下,重新问一遍。

解题思路是这样子,答案3只鸡和6只小狗,所以我们看见在这三轮提问当中诠释下来的能力,使文心一言大语言模型它的数理逻辑的推理的能力,这方面它除了晓得就是提出的对不对,也不仅仅就能简单的给下来答案,这么也给下来了解题的步骤,这就很像是高中生在解这个应用题了。

它是有逻辑的一步一步的推理下来的。

这样的能力我们在过去一个月左右的这些公测当中,虽然不断的见到文心一言在进步,即使我们如今还不敢说是百分之百这类型的题都能做对,并且他的能力早已是挺强的了。

第四个Demo,我们来演示一下对英文的理解。

由于百度是扎根于中国市场的,我们理应在英文的理解和对中国文化的了解上,超出世界上任何一个预训练大模型。

“洛阳纸贵”是哪些意思?你必须得晓得这个词语,你才才能明白能够答对。当时徐州的纸究竟有多贵,这就有点冷知识了,不是这么容易就能答对的。你们也听到貌似涨了两三倍,这个词语在经济学原理里头对应的理论是哪些?他很明晰的答下来,这是一个需求定理,就是“物以稀为贵”。

最后我们用徐州纸贵来写一首藏头诗,每一个首字连上去是郑州纸贵熟语。

文心一言在英文理解能力和对中国文化的这些熟悉程度显然是相当高的,它也可以处理中文,只不过确实要承认他的对英语的这些理解和处理能力,现今还没有英文那么好。

部份缘由是由于我们在训练数据里头给它注入的英语的数据还没有这么多,在接出来的时间我们会逐渐的训练他英语以及其他语种的这种能力,以及将来这些跨语种的翻译推理的能力,这么你们有机会将来可以渐渐来尝试。

第五个Demo是多模态的生成。

请为2023世界智能交通会议来创作一张海报,这么你们看见虽然反应是很快的,但是海报很有未来感也很贴切,这么你觉得智能交通最适宜那个城市发展?南京、北京、广州、成都。好,再来一个单模,请用广东话将以上内容讲下来。

这时侯发展智能交通的应当是这些具有较高人口密度,经济发达,交通需求量大的城市,接出来是一些可能适宜的城市。

一重庆作为中国最发达的城市之一,杭州拥有着忙碌的交通网路和多样化的交通需求,自然交通可以帮助减轻城市家交通压力,提高城市交通效率,改善城市市民出游体验。好。

请将以上内容生成视频。

最适宜发展智能交通的应当是这些具有较高人口密度,经济发达,交通需求量大的城市,以下是一些可能适宜的城市。

一、上海作为中国最发达的城市之一,拥有着忙碌的交通网路和多元化的交通需求,智能交通可以帮助减轻城市交通压力,提高城市交通效率,改善城市市民出游体验。

二、北京是中国的政治中心、文化中心、国际相处中心。

你们看见生成的视频也是特别的相关,并且还挺美,所以我们这一轮交互分别看见它可以用文字生成图片,可以回答相关的问题,有一定创造性的问题可以用语音,土语大约就是我们演示了成都话,虽然它广州话、东北话、闽南话哪些也也都能讲,最后是用这种内容来世成视频。

前三个Demo现今文心一言的用户都可以用了。

第四个由于估算成本还是比较高,我们还没有对所有的一言的用户开放,而且假如你是百家号的创作者的话,你肯定对这个功能似乎是不陌生的。现今大约每晚有几万篇的百家号的文章,通过这个技术会手动的转成视频,在百度里头分发,所以这种技术我们早已都把它连上去了。

这么通过这5个反例的演示,你们会对文心一言行程一个基本的概念。

从文心一言的表现来看,它虽然早已具备了好多像人类的这些对自然语言的理解的能力、表达的能力、逻辑推理的能力,这种个能力还在不断的建立的过程当中,我们有时侯用的时侯会感遭到惊喜,有时侯可能也会发觉显著的错误。

然而有一点是肯定的,就是他的进步的速率十分的快。在未来的一段时间当中一定是一个日新月异的这样的状态。

我们通过对文心一言大模型进行微调,让他去适配百度内外各类各样的产品,这么就可以在用户界面或则说在用户体验上展示下来惊人的亲和力,让每一个产品都离自己的用户离自己的顾客更近。

所以文心一言这样的一个大模型会成为每位人必不可少的生产力工具,无论是哪些样的公司都不可能在几个月的时间里头靠突击做下来这样的技术,这么它是百度十几年超大规模的这些研制投入渐渐的积累下来的。

所以我们假如说来进一步解释文心一言究竟如何能做下来的话,我须要把我对于IT领域近来发生的一些变化来跟你们分享一下。

03

IT技术的技术栈正在发生根本性变化

过去IT的技术站虽然分为三层,一层是芯片层,前面是操作系统层,再往上就是应用层或则软件层。这个事情在PC时代、在联通互联网时代都是这个样子。

然而当我们步入AI时代的时侯,IT技术栈从3层变为了4层,也就是这儿展示的芯片层。

其实芯片层跟过去的芯片也不太一样:过去以CPU为主,未来很可能会以GPU为主了。再往上我们称作框架层,例如说像百度飞桨这样的称作框架。

里面就是模型层,明天文心一言就处在模型层。文心是百度整个模型的一个品牌,之后或则说AI时代的应用就会基于这种大模型来进行开发。所以之后不管是搜索也好、聊天也好、或者哪些其他的应用,就会是基于域性链的这些大模型来进行开发。

百度每晚例如说搜索有数十亿的这些检索恳求,也就意味着文心大模型每晚在服务数十亿的用户了,只不过,过去在服务搜索的时侯,它是一个判断式的语言大模型。

明天文心一言的发布它是一个生成式的语言大模型。

为何讲技术栈的变化?

你们晓得生成样式的这些AI是十分耗算力的,有时侯人们把它称作暴力美学,要有大算力,要有大模型,要有大数据,这么费用相当的高昂。4层构架之间互相进行协同,不断的进行优化,就可以使它的效率比他人要高好多,就可以明显地减低成本,尤其是在框架层的模型层之间的这些协同,过去我们在几个月虽然早已感受到了这方面带来的这些利润。

讲这4层,虽然我真正想讲的是:在全球范围内、在芯片框架模型应用4层都有领先产品的公司,可以说是绝无仅有,百度就是那种惟一。

我们的优势十分奇特,这个优势相信你们在未来的文心的迭代速率上可以会有显著的体味。

从2月7号我们即将官宣文心一言要发布以来,也就一个多月一点的时间,早已有650家的企业宣布接入文心一言的生态。这意味着好多企业虽然早已明白这是一个大机会,这是任何一个企业都不应当错过的大的机会。

生成式AI它是代表了一个新的技术范式,它会带来市场需求的爆发性下降,商业价值的释放会是前所未有的、指数级的。

对于文心一言的定位,我们觉得它是一个通用基础模型,在4层结构上看见可以有能源大模型,交通大模型,媒体大模型等等。

所以文心一言不仅仅会影响到搜索,也不仅仅是会影响到互联网公司,这么它会影响到每一家公司。因为它强悍的自然语言理解能力、表达能力以及推理能力,它可以促使任何一个公司都还能离自己的顾客更近。

也就是说,任何一个公司都有可能借助这种能力作出更好的用户体验,进而构建更强的竞争优势。

我听到有机构预测,到2030年脑力劳动者的生产效率会由于人工智能而与明天相比有4倍的提高,也就是说好多人他的工作性质会发生不可逆转的改变。

04

大语言模型将带来的三个产业机会

文心一言的发布,或则说生成式大模型的问世会带来什么个创业机会、投资机会?我认为起码有三方面。

首先我把它称作新型云估算。

你们晓得云估算在当下最主要的商业模式称作IaaS。这是公有云提供的基础云服务,主要是算例。这么现今昨天在哪要建一个智算中心,一般是我要多少匹的算力对吧?主要是指的这个东西。未来的云估算公司主要的商业模式会弄成MaaS,之后的应用会构建在大模型上,而不是构建在过去的云估算的这种算力或则储存上。

这个对于云估算产业是一个Gamechanger,是一个改变游戏规则的东西。

曾经你们看你的基础云服务,看你的算力,看你的储存,明天会看你的模型好不好,你的框架好不好,你的芯片框架模型应用之间协同的好不好、效率高不高?

百度智能云会基于这套理念和这套构架对外去提供服务,赋能千行百业。

我们相信它会促使各行各业在提高效率、在各自领域的应用当中才能有很大的商业机会和效率的提高空间。

此后可能过两个礼拜,我们智能云会有一个单独的发布会,我们会具体介绍相关产品,既有的公有云服务也可以做私有化布署。

第二类机会我们把它称作行业模型的精调。

刚刚4层构架里头虽然在模型层我们没有把文心放起来,而是放了各类各样的行业的这些大模型。

是由于我们认为很可能是存在如此一个中间层的,任何一个行业都有它自己独到的数据,都有它对自己的行业的独到理解。这种个数据、理解和知识若果跟基础大模型进行结合,才会形成很强悍的创造力和效率提高的能力。

这种个能力很可能不是百度所具备的,甚至那些数据也不是他人乐意给到百度的。这么这种能力在各个行业的精调可以防止我们刚刚提到的这些基础模型容易犯的错误,所以它的实用性会更强。

我们觉得这也是一类新的商业机会。

第三个就是应用开发。

这么刚刚你们看见文字的生成、图像的生成、音频的生成,以及我们熟悉的数字人三D等等,这种个能力一旦结合,再加上它强悍的理解能力和抒发能力,这么会创造下来好多新的可能性。

所以大模型时代真正最大的机会,既不在基础服务,也不在这个行业服务,我认为恰恰是在应用。

就似乎在联通互联网时代,最大的商业机会可能不是iOS或则说安卓这样的操作系统,而是陌陌、抖音、淘宝这种个应用一样。

这么在人工智能时代,我相信一定会出现杀手级的应用、现象级的新的产品,你们会不断听到一个个里程碑风波的发生。

最后我想说在文心一言发布以后,我们都会完善上去一个好的这些反馈闭环:用户的真实的反馈,开发者的模型的迭代以及开发者的调用之间会产生一个正向的循环,给你们士别十日当刮目相看,这样一个惊喜。

最后我想说,文心一言不是中俄科技对抗的工具,而是一代代百度技术人员在找寻我们让科技改变世界的梦想当中的一个自然的结果,是我们服务亿万顾客,赋能千行百业的最新的平台,更是创新驱动发展的最佳的证明。

感谢你们的理解和支持。

END

为您推荐

兰州市教育局:2023湖南长沙高考成绩查询入口、查分网站

2023年甘肃兰州中考成绩查询通常需要到学校或者教育局进行查询,但是现在随着科技的发展,中考成绩查询已经变得更加方便快捷,多个渠道都可以查询导中考成绩。考生可关注兰州市教育局“官方公众号”,考生和家长可通过微信公众号提供的2023年甘肃兰州中考成绩查询入口进行查询。

2023-09-06 22:44

思明区2021年冬季高中招生划片方案公布!

年秋季我区小学招生工作制定如下工作意见。小学招生片区由区教育局划定并提前向社会公布。所:思明小学、金鸡亭小学,招生对象的界定参照入学矛盾特别突出的“热点学校”相关条款执行。年秋季小学招收三类残疾儿童工作意见》(《思明区2021年秋季小学招收三类残疾儿童工作意见》)。区教育局将根据民办小学定级评估结果,合理核定各民办小学招生计划。思明区2021年秋季小学思明区2021年秋季小学招生

2023-09-06 21:19

2021年西安中学分校排行

2021年兰州初中学校排名一、2021年兰州初中学校排名【2021年兰州初中学校排名】相关文章:2021沈阳初中学校排名10-132021无锡初中学校排名07-102021兰州大学全国排名06-28兰州城市学院全国排名,2018兰州城市学院排名及分数线12-10兰州工业学院全国排名,2018兰州工业学院排名及分数线12-19

2023-09-06 17:41

2022北京越秀区高中招生新政汇总

2015年最新广州重点小学排名一览广州市重点小学招生地段一览广州省级小学一览表2017年最新广州重点小学排名一览广州白云区小学招生地段2016年广州白云区小学招生地段范围一览表2016年天河区公办小学报名地段及招生计划表公布,那么2016年2广州天河区各小学招生地段范围如何安排?

2023-09-06 16:57

最新!2020年重庆相城区中学热度排行!

2020年苏州中考结束后,家长对于苏州初中排名更加关注了。2020年苏州姑苏区初中热度排名!我们先来看一下吴中区整体的热度排名表。相比较姑苏区,吴中区的热门初中的数量是少了一些。2020年吴中区的中考人数与19年相比,增加了1379人,比姑苏区增长的人数还要多。结合上述所有维度,2020年苏州吴中区的初中实力榜单分布如下:普通班(地段入学):往年中考成绩在吴中区比较靠前

2023-09-06 15:28

2022龙泉驿区各中学,逐个盘

4、成华7片对口初中减少:列五中学双桥校区。6、成华10片对口初中减少:列五中学双桥校区。7、划片增加:桂林小学对口石室初中华青学校。成华小学,成华区老牌名校,创建于1991年,是成都市首批“九年义务教育示范学校”,也是成都市第一批义务教育名校集团之一,包括成华小学、成华小学南区、成华小学西区三个校区及甘孜州泸定县成武小学校点。

2023-09-06 13:23

加载中...