文章目录
- 前言
- 生成式AI的定义
- 生成式 AI应用领域
- AI+办公软件
- AI+创意工具
- AI+企业服务
- AI+网络安全
- AI+IT 运维
- AI+软件开发
- AI+数据智能
- AI+数字代理
- AI+金融
- AI+医疗
- AI+教育
- AI+工业
- AI+汽车
- AI+机器人
- 后记
前言
在当今数据时代,人工智能和云计算已经成为了企业发展和创新的必不可少的工具。亚马逊作为一家在云计算和人工智能领域具有领先地位的公司,在不断地探索如何将这两者进行融合,为用户带来更具价值的创新服务。本文将分析亚马逊云与生成式 AI 的融合,探讨其未来展望和发展趋势,为读者提供对这一领域的深入了解和参考。
生成式AI的定义
生成式AI(Generative AI),也称生成式模型,是一类机器学习模型,可以从输入数据中学习并生成新的数据。这类模型通常通过建立概率分布模型,并使用采样方法来生成新的数据,例如图片、音频、文本等。相比于判别式模型,生成式AI不仅可以对输入数据进行分类和预测,还能够通过学习数据的分布模式生成新的数据。
生成式AI常使用的算法包括生成对抗网络(GAN)、变分自编码器(VAE)、自回归模型(Autoregressive)、生成式对抗网络(GANs)、深度信念网络(DBNs)等。生成式AI在图像处理、自然语言处理、音频处理、视频处理、艺术创作等领域均有广泛的应用。
生成式 AI应用领域
AI+办公软件
办公软件通常包含了文字、表格、演示文稿(PPT)等工具,是本轮生成式 AI 浪潮中产品 逻辑变化最大的细分领域之一。
目前主流的 AI+办公应用可以分为两大类别:一类是办公套件的 AI 助手,主要有微软 Copilot 和谷歌 Duet AI,目前全面嵌入了 Microsoft Office 及 Googleworkspace 办公套件,并已经初步实现商业化;另外一类是单点 AI 工具,通常包括了文本类的 Notion AI、Jasper AI、Copy AI、Anyword,表格类的 SheetAI、演示文稿类的 Tome AI、SlidesAl 等,此外还有许多功能更加细分的产品,比如笔记、思维导图、简历制作,协同办公等工具,目 前常见的 AI+生产力工具已经达到了上百种,这也是 AI+应用中数量最多的一类。具体来看:
文本类:在各类单点工具中,目前文本写作类应用占据了半壁江山,这与语言大模型的 成熟较高有直接关系,自 GPT-3 发布之后,大量的文本类 AI 工具开始涌现,这些应用普遍大多 是基于 GPT 模型,自己再做一些定制性的优化,也有很多是基于 gpt 等模型的 api,通过预先设 置 prompt,来满足一些文案生成的需求。目前头部的应用 Notion AI、Jasper AI、Copy AI、Anyword 等,主打更加全面的文本生成和内容编辑功能,同时 Jasper AI、Copy AI 更侧重于营销工具, 生成广告文案、产品描述、邮件、博客文章、推文,通过内置多达数十种营销模板和文案生成的 功能;
电子表格类:这一领域目前尚未出现大量类似 Notion AI 这类文本工具,主要原因在于电 子表格的核心在于计算,目前主要的创新点是将电子表格合并到文档环境中以及强化电子表格的 代码和自动化计算能力。目前 Excel 的领先地位仍难以被撼动,其最大竞争对手是 Google Sheets, 功能上基本保持一致,主要区别在于在线分发,可以简化协作;
演示文稿类:生成式 AI 能够帮助使用者快速构思创作框架并流畅展开内容创作,这一领 域中 Powerpoint 和 Slides 是最常用的演示文稿工具,新兴工具包括 Gamma AI、ChatBA、Slides AI、Tome AI 等,其中 Gamma AI、Slides AI 强调模板功能,内置多种主题库并提供图文、视频 等创作素材,而 Tome 为 AI 原生应用,能够根据自然语言提示生成整个幻灯片,对各个幻灯片 进行修改或添加新幻灯片。
AI+创意工具
创意工具包括了图片、视频、音频、3D 模型等 AIGC 应用领,在艺术、设计、娱乐、媒体、 电商等领域有非常广泛的应用。在多种模态的生成中,现阶段最具前景的是图片和 3D 模型的生 成。创意工具的核心在于内容的生成,用户会自动选择最优质的内容,因此应用公司必须在底 层模型和算法上具备很强的能力。当前多模态技术还处于早期,市场格局未完全确定,在英伟 达、谷歌、Adobe 等巨头进入同时,包括 Midjourney 等公司同样拥有一席之地。
图片:目前 AIGC 中最热门的方向,2020 年后随着扩散模型、CLIP 等技术的突破,在 图像生成技术上取得了质变,因此文生图也成为了创意工具中数量最多的一个类别,最具代表性 的文生图工具有 DALL-E2、Stable diffusion、Midjourney、Canva Text-to-Image。此外还有图 像编辑工具,主要功能包括去水印、风格迁移、图像修复、换脸等的应用。
视频:视频生成目前在技术上成熟度不高,更多基于图像生成的算法,除了视频生成之 外还包括了视频编辑如画质修复、视频特效、视频换脸、视频剪辑等应用,代表应用有 Deepfakes App、VideoGPT、GliaStudio、Make-A-Video、Imagen video 等。
音频:音频合成在技术和商业化已经非常成熟,近年来大模型和优化算法的成熟能够基 于大量音乐数据集训练和优化算法来创建 AI 虚拟歌手,更加趋近于真人发声效果(如:AI 孙燕 姿),这一领域的相关应用包括 WaveNet、Deep Voice、MusicAutoBot 等。
3D 模型:3D 模型生成还处于早期,其中这一领域关键算法神经辐射场(NeRF)于 2020 年于 ECCV 会议上提出,能够基于 2D 图像中生成 3D 图像或场景,目前已经成为 3D 模型构建 的主流算法,并广泛应用于游戏、数字人、虚拟现实、增强现实、电子商务等领域,未来具备广 阔应用空间,代表应用包括 Magic3D、Luma AI、DreamFusion。
多媒体工具:综合了到图片、视频、3D 模型等多模态生成的多媒体套件产品,代表为 Adobe Firefly。
AI+企业服务
目前生成式 AI 已经与企业服务领域的主要产品 CRM、ERP、财务、HR、OA 实现了不同 程度的结合,短期来看 CRM 等营销侧的产品成熟度最高,且已经初步实现商业化。同时目前 ERP、财务、HR、OA 已经相对应的 AI+产品推出,主要侧重于利用 AI 来实现业务洞察和流程 优化,相关产品功能还尚待完善,且还未进入商业化阶段。
从参与厂商来看,这一领域的主要参 与者仍是各个赛道上的传统玩家,包括 CRM 领域的 Salesforce、ERP 领域的 Sap、Oracle, HRM 领域的 Workday,新进入者较少,同时微软 3 月发布了 CRM 和 ERP 领域的生成式 AI 产 品 Dynamics 365 Copilot,是 AI+企业服务领域的有力竞争者。
CRM:CRM 与生成式 AI 在自动邮件,个性化回复、商机洞察、数据可视化等领域有许 多结合点。全球 CRM 龙头 Salesforce 推出了 CRM+AI 工具 Einstein GPT,并已经成功实现商 业化,生成式 AI 成为驱动 Salesforce 今年 股价上涨的关键因素之一。此外这一领域的其他厂 商包括 Sprinklr(CCaaS)、COMPASS(地产 CRM)、HubSpot (CRM)也推出了相关 AI 产品。
ERP/财务:ERP 系统长期以来一直都是企业的中枢神经系统,集中数据以从财务、人 力资源、采购、资源和供应链等核心职能中获得更好的业务洞察。 ERP+AI 主要体现在在能够 深入挖掘 ERP 中的庞大数据,包括生产、库存、财务和供应链等,来获得更好的业务洞察来优 化企业流程。目前微软发布了 Dynamics 365 Copilot,将 AI 引入了 ERP 产品组合中,而 ERP 巨头包括 Sap、Oracle 也推出了相关 AI 产品。
HRM/OA:与 ERP 类似,主要体现在进行数据挖掘,通过对职业轨迹、证书、学位和技 能等信息的挖掘来实现更有效的人才招聘,创建招聘所需的技能模型、经验模型和候选人档案, 并在招聘之外,优化薪酬管理、绩效管理等业务流程等,目前全球 HRM 龙头 Workday 已经将 相关 AI 功能嵌入人力资源产品中。
AI+网络安全
生成式 AI+安全的最大机会来自于安全运营的自动化程度的提升,类 Security Copilot 的 AI+“安全大脑”将深度改变现有安全管理平台产品形态。
3 月微软发布了首个基于大模型的 AI+ 安全大脑形态 security copilot,此后 Palo Alto Networks,Crowdstrike,Fortinet 等头部安全厂 商均发布了 AI+“安全大脑”产品,其中 Palo Alto Networks 发布了 XSIAM、Crowdstrike 发布 了 Charlotte AI。AI+“安全大脑”所带来的的安全运营能力提升主要体现在两个方面,一是提升 威胁检测,即发现问题的能力,二是提升相应处置,即解决问题的效率。可预见随着技术的不断 成熟,用户对于安全运营自动化的需求也在不断提升,因此相关厂商在整个安全产业中的地位将 逐步提升。在 AI 驱动下,今年头部安全厂商 Palo Alto Networks,Crowdstrike,Fortinet 的股价 均有强劲表现,年初至今涨幅分别达到 74%,53%,25%。
大模型/生成式 AI 对于网络安全行业的影响与其他行业有所不同,AI 不仅仅是对于安全产 品形态本身带来改变(防守侧),而且能够通过大幅降低了安全攻击的门槛,赋能攻击方(攻 击侧),加剧安全威胁,进而带来用户安全预算/行业总需求的提升。
大模型、GPT、生成式 AI 技术将大幅降低黑客攻击的门槛,包括批量钓鱼邮件生成、批量漏洞挖掘、批量恶意代码生成等, 将显著加剧整体威胁态势,特别是自从 ChatGPT 推出以来,通过电子邮件网络钓鱼的数量有显 著增加。同时,监管侧对于文字、图像内容的监管和审查将成为重中之重,内容安全、数据安全、 流量可视等监管侧需求也随之提升。
AI+IT 运维
生成式 AI+IT 运维主要结合点在于智能运维(AIops),提升 IT 运维的自动化和智能化水 平。
2016 年 Gartner 首次提出了 AIOps,通过 AI 赋能 IT 运维,能够基于已有的运维数据(日 志、监控信息、应用信息等),协助运维工程师更快速精准地发现故障、定位故障,并排除故障, 进而提高运维效率,降低运维成本。而大模型/生成式 AI 能够进一步提升 IT 运维的自动化和智能 化水平,体现在其具备更强大的数据分析能力,以及更高效的人机交互模式,目前这一领域的龙 头厂 Servicenow 已经推出生成式 AI+IT 运维的相关产品,并发布了未来生成式 AI 的产品路线路。
目前来看生成式 AI+IT 运维的产品成熟度还不够高,未来还具备很大的提升空间。此外,随着 OpenAI 的生成式 AI 模型的应用范围不断扩大,用户对于了解内部大模型的使用情况以增强大 模型的性能,同时监控 API 的使用情况及 Token 的消耗以控制相关成本的需求也在快速提升。 目前 Datadog 已经推出了监控各种 OpenAI 模型 API 使用模式、成本和性能的应用功能,这一 领域的头部厂商还包括了 AppDynamics、Datadog、Splunk、Dynatrace。
AI+软件开发
生成式 AI 具备很强的代码生成能力,有望重塑软件开发产业格局。
一方面,各类新兴的代码生成工具出现,包括 GPT-4 自身就具备很强的编程能力,同时包 括 Github Copilot X。GPT-4 在编程能力上相较于之前版本有了很大程度的提升,除了代码生成 能力之外,在容错空间更大的重构代码、代码测试以及修改 bug 等环节得到了更频繁的应用, 能够带来研发过程中显著的效率提升。同时包括 Github、HuggingFace、Replit 等开发者社区今 年以来的项目和流量大幅增长,今年 3 月 Github 发布了接入 GPT-4 的新版本编程辅助工具 Github Copilot X,在之前的代码生成等基础功能上增加了语音扩展、智能文档、自动告警、自 动扩写等功能,是市场上最先进的 AI 辅助编程工具。
另一方面;低代码平台(LCAP,Low-CodeApplication Platform)与 AI 的结合能够使开 发人员能够通过少量编程或者无需编程,通过拖放图形界面或自然语言等可视化方式,来实现 快速开发和应用部署。
目前低代码市场的主要参与者,包括微软、Salesforce、ServiceNow 等 企业服务巨头和 OutSystems、Mendix 等第三方低代码厂商,目前微软的 AI+低代码工具凭借自 身在 AI 上的技术储备和产品集成方面的优势,在行业中处于领先地位。此前微软低代码套件 Power Apps 就是 GPT-3 首批商业化应用,让开发人员能够通过自然语言语句简单地生成业务 查询和逻辑,同时 Power Platform Copilot 与其他 Microsoft 产品(例如 Office 365、Dynamics 365 和 Azure)以及第三方应用程序和数据源无缝集成,在整体解决方案上也具备明显优势, 目前微软已经是企业使用率排名第一的低代码平台,此外 Salesforce、ServiceNow 两大企业服 务领域的巨头也具备非常有竞争力的低代码产品,并将 AI+低代码能力其集成到自身的解决方案 之中。此外,OutSystems、Mendix 等头部第三方低代码厂商具备各自的优势,目前均推出了生 成式 AI+低代码产品。
AI+数据智能
生成式 AI 与大模型进一步强化了数据分析和决策智能在各行业的落地。
数据智能本质上还 是以半定制化,即产品+解决方案/咨询服务的方式向用户提供,这一领域的头部厂商为全球大数 据龙头厂商 Palantir,今年推出了面向军队和民用领域的生成式 AI 平台 AIP。同时,全球主流的 综合 IT 服务商和 IT 咨询公司均推出了生成式 AI 相关的产品及解决方案,比如 IBM、埃森哲、 博思艾伦等都是 Palantir 在这一领域的有力竞争者。
其中,今年 5 月 IBM 发布了生成式 AI 平台 Watsonx,并提供以 watsonx 为中心的完整咨询服务,帮助客户构建基础模型、AIOps、DataOps 和 AI 治理机制。同时,埃森哲也在今年推出了基于生成式 AI 的平台 AI Navigator for Enterprise, 能够帮助客户定义业务、做出决策、选择模型及算法,并预构建了 19 个不同行业的模型,来更 好的实现 AI 技术的落地。
此外,国防外包服务商雷神、BAE 以及电信运营商 ATT、NTT 等,结 合自身的禀赋和资源也都推出了相对应的生成式 AI 产品。不同厂商在产品上有各自的侧重点, 比如 IBM 侧重于提供底层模型能力,而埃森哲侧重于咨询服务和行业解决方案,Palantir 则是二 者的结合。总体来看,数据分析和决策智能市场参与的厂商较多,除了头部厂商之外,包括 C3 等许多中小型 AI 厂商都有推出相应生成式 AI 产品。未来在底层模型和算法普惠的趋势下,比拼 的重点将是客户资源以及对垂直行业的深度理解。
AI+数字代理
AI Agent 指在大模型支撑下能够自主理解、规划、执行复杂任务的 AI 系统。
今年 3 到 4 月 的 Camel、AutoGPT、BabyAGI、GPT-Engineer、西部世界小镇等多个 AI Agents 集中发布引 发了 AI Agent 热潮,特别是热度最高 AutoGPT 在完全无需用户提示具体操作的情况下,就能完 成日常的事件分析、营销方案撰写、代码编程、甚至网站创建等复杂任务,在一定程度上展示了 以大模型为基础作为来构建 AI 系统的能力,即大模型不仅限于生成各种文本内容,还能够解决各种通用的问题,并可以应用于各个领域。同时,目前已发布的 AI Agent 仍以第三方厂商为主, 而 OpenAI、Meta、Google 等人工智能巨头也开始在布局这一领域。
至今已发布的 AI Agent 仍 以通用 AI Agent 居多,通用 AI Agent 在使用成本、速度、技术成熟度上仍存在一定的局限,能 力还在不断完善中。而垂直领域的 AI Agent 相较于其他的通用 AI Agent 在结构和功能上更加简 单,速度更快且成本更低,预计将实现更快的落地,比如 8 月初 HyperWrite 开发的 AI Agent 主 要侧重于网页端,功能相较于通用 AI Agent 更为简单,能够完成包括订餐厅、订机票等任务, 其中包括自行查找地址,填写邮编,付款完成订单等操作。
AI+金融
生成式 AI 技术在金融领域的主要应用为数据分析工具,通过对金融大数据的挖掘来实现知 识洞察,典型应用包括证券领域的智能投顾,银行领域的智能风控等。与此同时,金融行业的 特性决定了对比于通用大模型,垂直行业大模型在金融领域有着更加有效的应用,一是由于安 全及隐私保护要求金融数据大多存储在本地,通用大模型在缺乏必要的训练数据,二是金融行 业在风控、精度等方面要求较高,系统又比较复杂,数据实时性的要求很高,通用大模型的金 融常识、安全性和准确性都难以达到要求,因此今年彭博社推出了专为金融行业从头打造的 500 亿参数大语言模型 BloombergGPT,训练数据来自于彭博社的财务数据,涵盖了金融领域的一 系列主题,生成了 7000 多亿个标签的大型训练语料库。BloombergGPT 在金融领域的任务普 遍拥有着超过通用大模型的表现。
AI+医疗
AI+医疗通常应用于医药研发、医院诊疗、医疗器械等场景,其中化合物合成、靶点发现等 为本次生成式 AI 变革的新应用,电子病历、辅助问诊等医院诊疗为 AI 常用场景,CT、MRI 等 医疗器械在生成式 AI 赋能下进一步增强。AI+医疗参与者众多,除了谷歌、微软等科技巨头的 加入,还包括 Sensely、Enlitic 等医疗科技公司、AbSci、Exscientia 生物医药初创企业,以及 赛纽仕等 CXO 企业,市场较为分散。
AI+教育
生成式 AI 在教育领域的应用根据功能的不同分为语言学习、在线课程、学习工具三个层面, 而目前应用最多的是语言学习和学习工具,主要在于具有多语言理解、多轮对话能力的大模型 天然适配语言学习和学习工具场景。同时,教育领域的商业化模式较为成熟,生成式 AI 技术的 注入将为其带来价值量的跃升。
语言学习:语言学习是目前与生成式 AI 最契合的教育场景,技术和商业模式都相对成熟。 通过生成式 AI 的多语言理解和多轮对话的能力,学习者不仅可以以多轮对话的形式进行多语言 交流、听力、写作等语言训练,还可以生成评估报告并对学习者进行纠错。代表性产品有 Duolingo Max、Elsa AI、AI Tutor 等。
学习工具:学习工具在技术上已经具备一定的成熟度,包括拍照搜题、知识检索等场景。 基于生成式 AI 技术,学生一是可以针对难题进行拍照搜题,识别并解析正确答案;二是对于不 懂的知识点,学生可以通过对话、图片识别等形式进行答案的快速检索。目前,主要产品有 Ginny、 PhotoMath、CheggMate、Q-Chat 等。
在线课程:生成式 AI 技术一方面,辅助教师进行课程规划,并自动生成教案以提高备课 效率;另一方面,对学生进行模拟一对一辅导课程,提供个性化的支持。目前产品主要有 Udemy、 Khanmigo、Embibe Lens 等。
AI+工业
由于工业场景较为复杂,各细分领域生产流程、配置、产品类型等差异较大,且生成式 AI 主要基于自然语言进行代码生成、图像生成等功能,因此当前 AI 大模型在工业中的应用仍处于 探索阶段,主要聚焦在研发设计、生产制造、运维管理三个层面。目前,生成式 AI 多用于研发 设计中的创成式设计、草图生成等辅助类设计的应用,以及运维管理中业务流程信息化 CRM、 ERP 等软件,生产制造环节由于生产环境的安全性与稳定性要求较高,生成式 AI 技术应用还不 成熟。从工业大模型参与者来看,研发设计和生产制造仍然是以 Dassault、PTC、SIEMENS、 Autodesk 为代表的工业软件厂商,运维管理则是企业服务相关厂商。
AI+汽车
AI+汽车主要应用于智能座舱与自动驾驶两大领域,其中生成式 AI 技术率先应用于座舱内 部用于人机交互的车载语音助手,以及自动驾驶数据自动标注 、感知规控算法算法的迭代。其 中,智能座舱市场格局较为分散,目前以梅赛德斯奔驰等主机厂,以及 Cerence 等语音开发厂 商为代表的座舱语音助手已经实现了生成式 AI 与汽车的集成;自动驾驶 AI 大模型的研发主要 有主机厂、科技厂商、初创公司,目前以特斯拉为代表,采用基于 Transformer 模型的占用网 络(Occupancy Network)感知算法,实现了感知算法端到端的大模型架构开发。
- 智能座舱:生成式 AI 主要带来了座舱内部人机交互的变革,主要体现在车载语音助手。过 去座舱内的语音交互需要固定顺序的词汇激活系统作出对应指令,而生成式 AI 能够主动识别用 户语言,包括唤醒词在语音指令不同的位置,并根据用户偏好进行反应,大幅增强用户交互体验。 目前,梅赛德斯奔驰预计于今年发布的 MBUX“读心语音助理”的升级版本,并在部分豪华车型 中接入 ChatGPT。而接入 ChatGPT 的 MBUX 具备更快的响应速度,不需要唤醒词,直接下达 指令后 0.5 秒语音助手即刻上线,空调、车窗、娱乐系统只需 1 秒就能执行。
AI+机器人
生成式 AI+机器人将开启“具身智能”时代,根据下游需求的不同,机器人可分为工业机器 人、人形机器人、服务机器人等,其中生成式 AI 对于人机交互能力的提升将率先促进人形机器 人、服务机器人成为“具身智能”的载体,而工业机器人由于工业领域的环境复杂度较高,以 及与人交互需求较低,更多依赖于机器视觉、神经网络等技术的突破。
人形机器人:人形机器人主要以多模态交互为主,在生成式 AI 的赋能下,人形机器人将 从机器人的单一智能升级为融合智能,不仅能够完成上下文理解、语义识别等通用语言任务,以 及拟合抓取、操作、避障、识别等人类生活场景,同时通过预训练大模型可以实现自动化决策。 如,英国机器人厂商 Engineered Arts 推出的人形机器人 Ameca 接入了 GPT-4,语言交流、情 绪表达等能力进一步提升;挪威人形机器人公司 1Xtechnologies 研发的 EVE 实体机器人的部分软件功能由 OpenAI 的 ChatGPT 提供支持,增强 EVE 的自然语言、学习等能力,实现 ChatGPT 的“实体化”。
服务型机器人:服务型机器人主要面向 C 端,具备海量用户数据,同时清洁、外送、聊 天等应用场景复杂度相较人形机器人较低,因此大模型最先应用于服务型机器人,进一步降本增 效,提高工作效率。包括清洁、外送、聊天等服务场景,服务型机器人通过 AI 实现语音、图片 等多模态方式输入,预测并理解不同的场景下用户当下的情感状态,及时作出反应。目前,主要 有 Knightscope 的自主安全机器人、Richtech Robotics 的餐饮机器人。
工业机器人:工业机器人目前主要应用于工厂生产线、物流、仓储等场景。一方面,AI 能够帮助机器人自动进行物体检测、目标识别等交互任务,提升环境交互效率;另一方面,AI 可以协助分析生产数据、产品质量等信息,提供质量控制和改进方案。如,瑞士机器人厂商 ABB 与微软在其工业数字解决方案业务方面进行合作,将 Azure OpenAI 服务集成到 AAB Genix 工 业分析和人工智能套件中,实现代码、图像和文本生成功能。
后记
本文对亚马逊云与生成式 AI 的融合进行了全面综述和深入分析,着重探讨了其背后的技术、应用场景和未来发展趋势。我们可以看到,亚马逊云在人工智能领域的不断探索和创新,为企业和个人用户带来了更多的机会和选择。生成式 AI 的应用也得到了大量的关注和实践探索,为自然语言处理、图像处理和音频处理等领域带来了更加高效和智能的解决方案。同时,云计算的强大能力和灵活性,也为生成式 AI 的发展提供了强有力的支撑和保障。
在未来,我们有理由相信,亚马逊云与生成式 AI 的融合将会进一步加深和拓展,为人们的生产、学习和生活带来更多的便利和创新。我们期待在这一领域的应用和发展中,不断地探索和创新,不断地挖掘和发掘更多的可能性和潜力,为人们的未来带来更加美好的前景和展望。
转载自:https://blog.csdn.net/u014727709/article/details/134683107
欢迎 点赞✍评论⭐收藏,欢迎指正