作者 | 徐杰承
2月7日,百度官方公众号发布了一条极为简短的通告——《官宣:文心一言》。据了解,文心一言正是百度内部所研发的类chatgpt聊天机器人,其英文名称则为ernie bot。
据百度内部人员表示:文心一言由基于百度提出的知识增强大模型(ernie)扩展而成的一系列高级大模型构成,可以执行广泛的任务,包括语言理解、语言生成(ernie 3.0 titan)以及根据文本生成图像(ernie-vilg)等。与其他语言模型相比,文心一言能够将广泛的知识与海量数据相结合,从而产生非凡的理解与生成能力。公司计划在3月完成文心一言的内部测试,然后向公众正式开放使用。
虽然对于文心一言的实际表现我们暂且不得而知,但通过百度此前所发布的名为《ernie 3.0 titan: exploring larger-scale knowledge enhanced pre-training for language understanding and generation》的论文,目前我们可以大致了解到一些有关其所应用的语言模型ernie 3.0 titan的相关信息。
据论文显示:ernie 3.0 titan是百度于paddlepaddle平台上所训练的千亿参数模型,其中包含多达2600亿个参数(chatgpt使用1750亿参数的gpt3.5模型)。此外,百度还设计了一个自我监督的对抗性损失和一个可控的语言建模损失,使ernie 3.0 titan生成可信和可控的文本。
为了减少计算开销和碳排放,百度还为ernie 3.0 titan提出了一个在线蒸馏框架,其中教师模型将同时教授学生和训练自己。ernie 3.0titan是迄今为止最大的中国密集预训模型。相关实验结果表明,ernie 3.0 titan在68个nlp数据集上的性能已优于现阶段最先进的语言模型,包括chatgpt所应用的gpt3.5模型。
ernie 3.0 titan模型架构图
据悉,目前文心一言已进入上线前的最接冲刺阶段,而相关消息的曝出,也使百度港股一度暴涨超17%,市值增长约700亿港元。据部分业内人士推测,百度文心一言项目或早在2022年9月便已启动研发,彼时百度ceo李彦宏在世界人工智能大会上就曾表示:无论在技术层面还是商业应用层面,人工智能都有了巨大的进展,有些甚至是方向性的改变。
考虑到目前由chatgpt所带来的生成式ai的火爆,未来觊觎这一领域市场的国内企业,势必不止百度一家。就市场角度而言,目前类chatgpt聊天机器人最明显的价值与落地场景,正是百度主营的搜索业务。如此看来,如果下一次科技革命真的爆发在该领域,那么百度无疑已拔得头筹。此外,不少业内人士认为,考虑到谷歌和微软的推进节奏,文心一言开放内测的进度还有可能继续提前。
以上就是百度官宣:文心一言即将问世,或将比chatgpt更强!的详细内容。