一分钟创建能看、会听、可说的AI数字分身!
随着大模型的发展,AI的智能水平也越来越高,谷歌最新推出 Gemini 模型,该模型具有原生多模态、更复杂推理能力!
Gemini 视频演示:How it’s Made: Interacting with Gemini through multimodal prompting[https://developers.googleblog.com/2023/12/how-its-made-gemini-multimodal-prompting.html]
该模型pro版本可以在bard体验,但也是仅对部分国家和地区开放。创建多模态模型的常规方法是训练不同模态的单独组件,然后将它们组合起来,通过额外的多模态数据进行微调,以提升其效果。
国内我们也可以利用插件来“武装”大模型,以较低成本来打造一个能看、会听、可说的多模态AI应用!比如,利用LinkAI平台,无需任何代码,即可快速打造一个AI数字分身,并可以快速接入微信/公众号/企微/飞书等移动端平台!
平台介绍
LinkAI是一站式的AI应用平台,聚合文本、语音、图像等多模态基础模型,在此基础上提供知识库定制化、联网搜索等增强服务及丰富插件,基于开源生态和开放接口帮助开发者快速完成应用接入,为企业提供一站式服务!
创建应用
点击官网右上角的登录,微信扫码或者手机号进行注册。
然后我们可以看到应用广场,这里显示的是“造梦师”、“文案专家”、“周公解梦”等各种有趣的AI应用,覆盖了日常的方方面面,大多都是通过**应用设定(system prompt)**来创作的,可以在这里体验体验别人的创意,然后我们可以创建自己的AI应用(应用发布到广场来可以赚积分)。
我们点击上图左侧的创建,来到LinkAI控制台,然后点击创建应用,这里我们以创建库里数字分身为例来看看如何打造个人数字分身。
我们选择知识库应用,知识库应用相比轻应用来说,可以上传文档供AI学习,更适合用于打造数字分身。我们填入应用名称和应用描述后,点击AI一键填写,不需要任何基础即可快速完成应用设置。也可以根据需要继续优化应用设定,这个就是所谓的人格角色设定!
在底部点击直接上传文件,可以选择无结构文档和QA问答格式:
- 无结构文档:无需进行任何预处理的原始文档,LinkAI会帮你进行文档拆分和加工,支持 pdf、docx、md、txt 格式的文件。
- QA问答格式: 一问一答形式的语料,需要按照模板 进行预处理,支持 csv 格式。
我们可以直接上传和欲创建的数字分身相关的无结构文档即可,比较省事,后续也可以不断补充优化,采用QA格式效果更好!最后点击创建即可!
使用&探索
在我的应用界面,找到刚刚创建的应用,点击开始对话即可使用
我们可以在右上角选择模型、插件、以及语音对话,这些配置我们可以在应用里进行详细设置:
我们需要什么功能在插件配置中添加相应的能力即可。此外,我们在移动端h5页面使用语音对话体验更好!
至此,一个能看、会听、可对话的AI数字分身创建完成。通过LinkAI平台强大的知识库功能,打造的AI数字分身可以在生活、教育、医疗、亲子等方面发挥极大的作用,带来有趣的体验和效率的提升!
更多高级玩法
我们除了在网页端直接使用外,我们可以通过平台的开源项目ChatGPT-On-WeChat,将应用广场上的和自己创建的应用快速接入到微信/企微/公众号/飞书等移动端平台;还可以通过开放API,将应用嵌入到自己的生态当中,快速高效为自己的产品生态接入AI能力,扩展性极强!
应用接入参考:https://docs.link-ai.tech/platform/link-app
开放API:https://docs.link-ai.tech/api#/
也可以参考往期博客来查看其他功能和接入教程,以及访问个人网站获得更多信息:wangpc.cc