当下,全世界互联网都刮起了一阵ChatGPT风,其中钻研AI能力十年的百度,以及其将推出的大语言模型“文心一言”,被市场寄予最大厚望。业内讨论,随着“文心一言”的推出,百度或将进入业绩修复的快车道,成为中国科技赛道的绝对C位。
值得关注的是,为什么百度最有可能在中国做出千亿参数级别的大语言模型?“文心一言”未来将为百度业务带来赋能和想象力?
开发大语言模型“文心一言”,
百度不是从零开始
由OpenAI推出的通用型对话机器人ChatGPT持续引发全球范围的“AI狂欢”。一时之间,资本圈、产业界、创业者趋之若鹜,试图抓住技术红利,引领下一个时代。
在赶超ChatGPT的巨大产业机遇下,国内大小企业打响了追平基础大模型差距的“攻坚战”。
2月7日,百度对外证实正在打造生成式AI产品文心一言(英文名ERNIE Bot),位于模型层,在做上线前的冲刺准备工作,预计三月份完成内测,面向公众开放。除百度外,还有快手、京东、360、商汤、美图等均趁势宣布正积极发展AI聊天机器人,或在AIGC有所布局。
实际上,这场全球新一轮AI技术竞赛,投入门槛和研发难度都极具挑战性。
ChatGPT火爆的同时,其背后的成本支出也引发业内的关注。作为OpenAI早期投资人的埃隆·马斯克在推特平台提问ChatGPT“每次聊天的平均成本是多少”。OpenAI的CEO山姆·阿尔特曼回复称,ChatGPT平均每次的聊天成本为“个位数美分”,并表示正在试图更加准确地计算。
资深人工智能研究专家田涛源曾告诉网易科技,“GPT3.5训练一次需要花费300-460万美金,还只是算力的成本,没算人才的成本,Open AI一共375人左右,一年工资开支就要2亿美金,AI算力开支5亿美元,需要雄厚的资本支撑。”
除了如此高的资金和能源门槛,最具挑战性的是能够驾驭千亿参数的技术实力。
ChatGPT在对语言进行分析和理解时,需要有参数支持,类似于神经网络,初代ChatGPT就有超过40亿个参数,而上一代GPT-3已经有1750亿个参数。有数据称,国内实验室目前做过的模型大多是在10亿个参数,也就是ChatGPT是国内模型的175倍。
同时,ChatGPT能在自然语言处理、文本生成和人机对话上有惊艳的表现,除去硬件支持外,大量数据获取下的语料库建立也很关键,中文语料内容全面性也成为了挑战。
对于这些掣肘难题,百度并不是从零开始突破。大语言模型产品最显著的几个关键词——AI、NLP、搜索,也都是百度的标签。
数据显示,过去10年,百度研发投入超1000亿元。从算力、算法到数据,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,百度在各个层面都早有关键自研技术,给百度即将发布的生成式对话产品文心一言,提供了强大的技术支持。
以深度学习框架这个人工智能的底层操作系统为例,百度飞桨已超过谷歌TensorFlow在国内市场排名第一。IDC发布《中国深度学习框架和平台市场份额,2022H2》报告,显示,百度居中国深度学习平台市场综合份额第一。
在ChatGPT火爆全球之前,2021年9月,百度发布了PLATO-XL,曾一举超过Facebook Blender、谷歌Meena和微软DialoGPT,成为全球首个百亿参数中英文对话预训练生成模型,刷新了开放域对话效果。
同时,搜索起家的百度,坐拥千亿级全网索引和覆盖超过50亿实体的中文知识图谱。百度文心系列大模型在行业已普遍应用,截至2022年11月,文心已累计发布11个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域,加速推动行业的智能化转型升级。
但无论是AIGC,还是ChatGPT,AI技术最终会变成什么样的产品,还有很多不确定性。如李彦宏曾经说过的:“把这么酷的技术变成人人需要的产品才是最难的。”
“文心一言”领路,
百度智能云提速
毋庸置疑,生成式AI所需要的巨大算力需求以及对云业务的赋能,正成为云厂商不容错过的新战场,AI也成为了云计算下半场竞逐的关键变量。
ChatGPT以及其背后的基础大模型,不仅能给出更准确的结果百度快速排名系统,还有更强的通用性和泛化能力,被认为是一项面向未来的先进生产力,让世界看到人工智能技术进化,这让其成为了AIGC生态最值得关注的能力,也被认为AIGC长期价值的重要增长点。
大洋彼岸,微软已宣布将OpenAI整合进微软云服务中。ChatGPT不仅将会接入微软旗下的搜索引擎必应(Bing),还将整合OpenAI的技术以改进Office应用,并强调将通过微软的云服务提供ChatGPT。
与微软将 ChatGPT接入 Azure的思路类似,百度智能云宣布将在5月推出针对文心一言模型的 API 接口,吸引大量企业和机构客户使用百度智能云提供的API和基础设施百度快速排名系统,搭建AI模型、开发应用,调用文心一言的能力来解决不同场景里的具体问题。
在云业务上,百度和微软都高举着AI大旗。
去年底,百度同样提出了“AI大底座”这个概念,简单来说,百度作为云计算厂商将标准化地输出智能化的底层能力,把芯片、大模型、深度学习框架等高门槛的技术,变成像水电一样供客户按需取用。
IDC《2022 H1中国AI云服务市场研究报告》报告显示,2022H1,在AI公有云服务市场份额占比28.1%,已连续四年市场份额第一。
“在产业智能化浪潮来临之际,百度正处于前所未有的最佳位势,百度智能云凭借着‘云+AI’战略发展迅猛。”李彦宏认为智能化对各行各业效率的提升比技术更重要,“ChatGPT是AI技术发展到一定阶段后的新机会,怎么赋能千行百业,让他们的生产效率大幅度地提升?这一步才是最难的,也是最伟大、最能够产生影响力的。”
未来的云市场中,竟争将越来越聚焦智能,而不只是存储带宽和算力。
百度集团执行副总裁、百度智能云事业群总裁沈抖表示,“文心一言”是基于百度智能云技术打造出来的大模型,它将根本性地改变云市场的游戏规则,云服务将从数字时代跃迁到智能时代。以前企业选择云厂商更多是看算力、存储等基础云服务,以后企业对云的需求会更加聚焦智能服务,会更多看框架好不好、模型好不好,以及模型—框架—芯片—应用这四层架构之间的协同是否高效。”
目前,至少有300家知名企业宣布接入文心一言,涵盖互联网、媒体、金融、保险、汽车、企业软件等行业,包括爱奇艺、携程、长虹、海信等已成为生态合作伙伴。
随着“文心一言”生态拓展,百度智能云将在云市场获得更大话语权,并赢下更多的市场空间。
搜索变革,
来势汹汹?
财报显示,目前,百度移动生态流量强劲,依然是贡献经营利润和现金流的重要来源。第四季度百度移动端搜索查询次数和信息流分发量继续实现同比两位数的增长。12月,百度App月活跃用户达到6.48亿,同比增长4%。
对智能搜索赛道而言,类ChatGPT的引入,或将促成其焕发全新的生命力。
在AI技术的不断升级和迭代中,ChatGPT让人们看到了搜索引擎的另一种可能:AI搜索引领的生成式答案。比如,针对开放式问题,ChatGPT可以通过匹配网络中的数据生成较为完整的答案,在处理知识类以及创意类的问题时,ChatGPT甚至可以帮助人们更高效率的获取灵感,提供的搜索体验优于目前的传统搜索引擎,这让使得众人看到搜索引擎的下一代模样。
目前,ChatGPT最显性的价值与落地场景,也正是搜索。
微软将ChatGPT整合进必应搜索,谷歌也计划在其搜索引擎中添加高级人工智能功能。有报道称,百度搜索今年在技术上最重要的工作就是要把整个检索系统变成检索+生成双模系统,并将百度版ChatGPT嵌入到百度主要的搜索服务中,实现搜索代际变革。
百度很早之前就意识到,生成式AI和搜索引擎是互补关系。
早在2015年,百度就提出了多模搜索概念,探索从文本搜索向语音、视觉、视频等多模态搜索延伸。在百度App中,早可以进行语音搜索、拍照搜索、实时翻译、植物识别、视频搜索等操作。
在百度Create AI开发者大会前夕,百度搜索就宣布将基于百度自研的生成式模型,升级“生成式搜索”能力,并指出,生成式AI和搜索引擎是互补关系而不是替代,搜索底层技术和AI底层技术是相通的。
更值得想象的是,以ChatGPT为代表的智能生成技术在应用场景上也不断创新,除了智能对话、写文章、写代码外,智能生成技术应用还可以作画、作曲、制作电影,且应用范围还在进一步探索,为百度获得极大丰富的内容生态和供给,将产生里程碑式的革命。
未来,依托AIGC赋能,百度搜索将开创更广阔的想象力,实现搜索能力的高速进化,也将为大众提供更优质、高效的搜索体验。
根据投行瑞银集团发布的一份研究报告显示,爆红聊天机器人ChatGPT的月活跃用户在2023年1月份预计达到1亿,这距离它推出只有两个月时间,其成为史上增长最快的消费者应用。
目前百度拥有6.48亿的月活,“文心一言”落地后,短时间内势必大幅拉升百度搜索MAU,吸引到更多的用户,产生新的流量入口,进一步优化用户体验,有望为百度搜索带来商业价值的快速增长。
在李彦宏看来,AI技术已经发展到一个临界点,各行各业都不可避免地被改变。中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。
他在内部信中也提到:文心一言与搜索整合,将引领搜索体验的代际变革;文心一言将通过百度智能云对外提供服务,根本性地改变云计算市场的游戏规则;此外,文心一言大模型还将搭载到Apollo智舱系列产品,并与小度进行集成。
可以想象,随着“文心一言”的推出,百度将进入业绩提速的快车道。
1、本站资源针对会员完全免费,站点中所有资源大部分为投稿作者付费教程,切勿轻易添加教程上除本站信息外的任何联系方式,谨防被割,如有疑问请随时联系客服。
2、本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。