- 文心一言 VS ChatGPT
- 接受不完美 期待进步
- 里程碑意义
- 文心一言初体验
- ✔ 文学创作
- ✔ 商业文案创作
- ✔ 数理逻辑推算
- ✔ 中文理解
- ✔ 多模态生成
- 写在最后
何为文心?“文”就是我们中华语言文字中的文,“心”是希望该语言模型可以用心的去理解语言,用心的去服务用户。
在近期全球陷入 ChatGPT 技术狂欢的同时,中国也有了对标 ChatGPT 的大预言模型。随着百度文心一言发布会的召开,我认真了观看了整个过程。作为一款百度十几年研发投入积累所得的产品,作为“中国版 ChatGPT”,我对它有着浓厚的兴趣,且第一时间申请了体验资格,参与到测试当中。
文心一言 VS ChatGPT
最近在网上经常性的看到这么一张图片,就是将文心一言与 ChatGPT 进行对比,而且差距显而易见。此外在某些站点也可以看到文心一言被“群嘲”。
近期全球陷入 ChatGPT 技术狂欢,ChatGPT 作为 OpenAI 开发的人工智能语言模型,由文本生成对话的训练数据驱动,与其他人工智能技术相比,ChatGPT 可以生成更为自然、流畅的语言回答,这确实是它最大的优势之一。而有人就将此优势拿去对比国内新发布的文心一言,矛头直指文心一言的种种不成熟。但我们可能忽略了一点,每个人工智能技术都有其独特的优势和适用场景。比如 AlphaGo 围棋机器学习模型可能在下棋方面表现出色,而像“聊天机器人”这样的技术则更适合于帮助人们进行自然的对话交流。因此将 ChatGPT 与其他人工智能技术进行比较可能需要考虑到多个因素,而不仅仅是它们的语言生成能力。
如果说非要以己之长比其之短,那么在中文与中华文化的理解上,ChatGPT 与文心一言就没得比,相信有很多人在中文语境下体验 ChatGPT 时也体会到过它“人工智障”的时候吧,那这又怎么说?
其实我想说的是每个语言模型都有自己的优势和适用环境,它们的设计目标是一致的,都是为了辅助人、帮助人、为人类提供更好的服务。所以在看待文心一言的问题上,我们不能仅仅将关注焦点聚集在在文心一言的瑕疵和不成熟上,而是应当站在更加长远且更加全面的角度来看待它。
接受不完美 期待进步
很喜欢李彦宏董事长在发布会上讲的那句话:“我们在使用的过程中有时候会感受到惊喜,有时候可能也会发现明显的错误,但有一点是可以肯定的,它的进步速度会非常快。”他本人也指出自己在体验过程当中,文心一言的能力不能叫做完美。
其实没有哪一个技术、哪一款产品是完美的,更何况这是第一代版本,它的发布则可以获得用户的反馈,迭代速度会加快,能力也会不断的成长与提升。即使有不完美,从现在的发展情况来看,文心一言也是国内互联网大厂中唯一成熟的产品,靠文心一言百度就已经证明了其在人工智能领域、在互联网行业当中的地位。
里程碑意义
随着文心一言语言模型的发布,无疑会对国内科技产业的发展产生带动作用,诸多同类型商业化产品也将会出现。其次在发布会上也提到,文心一言是百度十几年的研发投入积累、持续精耕的产物,这体现着百度在 AI 上的长期坚持。
在我看来,文心一言在国内人工智能领域具有里程碑式的意义,这不仅在于技术水平,更在于人工智能发展理念、对待 AI 的理念。当我们能够认识到这一层,就会发现仅仅去关注文心一言产品本身、仅仅拿它与同类型产品相比较就有点舍本求末了。借用网上的一句话:无需完美,已然具备里程碑意义!
文心一言初体验
文心一言的能力定位主要在于五个方面:文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。
✔ 文学创作
从哲学角度续写《流浪地球》,文心一言提出了一些可能的思考方向,且提醒用户注意遵循小说的创作原则和规范。体现出文心一言的总结分析和推理能力,这是基于 5500 亿事实数据训练才得以保证事实性问题的准确性。
✔ 商业文案创作
如果说文学创作体现的是总结分析能力,那么商业文案的创作则是其理解表达、创新创意能力的展现。这种能力我们是没有办法专门去教语言模型的,正如“读书破万卷”,想要“满腹经纶、学识渊博”也得是在大量学习的基础之上,AI 语言模型基于的知识量更是不计其数。
✔ 数理逻辑推算
根据发布会的介绍来看,文心一言大模型训练数据包含万亿级的网页数据、数十亿搜索数据和图片数据、百亿级的语音日均调用数据,以及 5500 亿事实知识积累。所以在梳理逻辑推算方面,它给出答案的同时还能够做到对解题思路的一步步推理。
✔ 中文理解
作为植根于中国市场的语言模型,它对于中文和中华文化的理解能力也是相当高,相较于在中文语境下的 ChatGPT 有时会出现“人工智障”式的表现,文心一言则不会产生类似问题,毕竟百度对于中文语言的处理还是有明显优势的,对于国人的适用性来说,文心一言绝对优于 ChatGPT。
✔ 多模态生成
其多模态主要包括根据文字需求生成图片、创意性的回答图片内容、用语言讲解、生成视频四个方面。但语言和视频这块还不太完善,支持的类型也比较少,体验较差。期待进一步完善。
此外我也对 IT 相关的代码生成、疑难解答等进行了相应的测试,体验良好。
写在最后
综合测试下来,根据以上表现可以说文心一言具备了很多近似人类的理解能力,如表达理解、逻辑推理等,而且它的准确性和流畅性可以说接近人类。其次就是对中文和中国文化的理解,对于我们中国使用场景来说,绝对是优于 ChatGPT 的。当然在使用的过程中难免会感受到些许不足之处,但是我们应该给予的是期待,而不是冷嘲热讽。期待文心一言的飞速进步和完善。