说2023年是ChatGPT元年是一点都不夸张,开年以来,ChatGPT就屡屡霸屏热搜。国内互联网大厂坐不住了,也纷纷入局人工智能。

百度的反应速度最为迅速,在3月中旬上线了AI产品文心一言。不少用户都在第一时间体验了这款产品,但是评价却不大理想。

脉脉用户直言:文心一言是搞笑版AI,因为它看起来不太聪明的样子,缺乏必要的语言理解能力。无法通过用户提出的需求生成相应的绘画作品。


(资料图片仅供参考)

在广大用户对文心一言进行“考察”后,大概可以这么总结,文心一言一方面逻辑推理欠佳,对数学、计算机编程几乎“一窍不通”;一方面归纳总结能力较强。但是在文学创作、古诗文理解上也不太有潜质。

文心一言具备多模态生成能力,包括生成图片、生成语音(包括方言)以及生成视频的能力。

综合看下来,文心一言基于“本土优势”展现出自己在文学、艺术等方面的长处,相应地也暴露出在理科、以及逻辑思辨能力的较大短板。

在AIGC时代,算法、数据、算力是衡量差距的三把标尺:

在算法层面,百度与ChatGPT事实上是站在同一起跑线上的——百度与OpenAI、谷歌都是基于Transformer模型去做不同的变体,延展出各自的深度学习框架以及再上层的大模型。

在数据层面,二者差距较为明显:相比于百度文心一言,ChatGPT经历了多次模型训练,并被无数个“考官”进行无数次指点,同时有专门的数据标注人员进行方向的修正。

据华西证券表示,ChatGPT大模型最大的特点便是,引入人类反馈的强化学习(RLHF)。

RLHF简单来说,就是用人工标注的方式,不断地将结果去反馈给模型:回答好的给出正反馈(例如图上的Correct),回答不好的,就通过加分机制的方式让模型进一步的自我迭代,并进行不断的调优,直到回答正确。

百度同样也采用RLHF,并辅以“对话增强、有监督精调”等机制,也就是说底层架构、技术路径相似,百度缺的是大量语料库的训练与反馈。毕竟,未被RLHF狠狠修正过的ChatGPT,在刚上线的时候也出现了大量混乱的回答。

总结来看,文心一言的“文具”已然备齐,缺的是大把时间、大量资金去训练。

那么百度若想让文心一言达到中上水平,需要砸多少钱?

根据华西证券测算,在不考虑人力支出及维护费用条件下,百度需要补足的成本拆分为训练成本、推理成本及数据标注成本,分别需要2.29亿元、13.62亿元、0.05亿元。也就是说,百度需要保持年均16亿元的投入,将有可能达到ChatGPT目前的能力。

人工智能固然是一个不错的赛道,但是在做好准备的情况下贸然入局,步子迈得太大,终究不是件好事,毕竟欲速则不达。国内互联网大厂想要打造出好的AI产品,还需要好好沉淀!

标签: