随着企业不断面临管理复杂多源数据、优化性能、扩展混合/多云环境以及高效运营的挑战,数据策略将更加依赖于能够应对这些挑战的解决方案。

预测的主要趋势:

AI/ML领域:

  1. 计算能力成为新的“石油”:由于GPU需求增长远超行业供应,配置合理的专业计算资源变得稀缺。计算能力如今已成为企业竞争优势的核心要素。预计到2024年,在AI工作负载持续激增的情况下,将有更多创新技术被采用以提升计算效率和扩大规模。同时,TPUs、ASICs、FPGAs和神经形态芯片等专门针对AI的硬件设备将更加普及。
  2. 从试点转向生产阶段的通用AI(GenAI):尽管早期GenAI项目展现出巨大潜力,但由于实际操作经验有限且技术快速迭代,多数企业对于全面部署仍保持谨慎态度。2023年,大部分组织正在进行小规模针对性试验,评估收益与风险。随着预训练模型、云计算和开源工具推动GenAI技术成熟并实现大众化,预计2024年预算分配将更倾向于GenAI领域。
  3. 平衡内部构建与供应商提供的LLMs:为了充分利用大型语言模型(LLMs)的优势,企业需要决定是自建模型、通过API使用闭源模型(如GPT-4),还是微调预训练的开源LLM。到2024年,随着LLMs不断迭代更新,企业将不再希望被锁定在一个特定模型或供应商上,而是选择混合方式,在存在更严格隐私、知识产权所有权及安全要求时,平衡预训练模型与定制内部模型的使用。
  4. 绿色AI理念的推广:随着AI项目的加速应用,越来越多的企业将在2024年认识到其所带来的紧迫可持续性挑战。虽然诸如优化数据架构、减少数据副本和利用可再生能源等技术进步有助于解决这一问题,但仅依靠技术还不够,企业还需实施治理流程和以人为本的价值观,确保AI项目创造商业价值的同时不损害环境。积极拥抱绿色AI原则的企业将在2024年获得竞争优势,并建立公众信任。

数据与分析方面:
5. 克服数据孤岛难题:跨地区、跨云和跨平台的数据孤岛仍是企业面临的挑战,导致大量数据重复和各自为政的管理模式。为了加快洞察速度并扩展数据分析和AI计划,2024年企业将越来越需要管理分布式数据,通过灵活编排、抽象化和虚拟化技术制定统一数据管理策略。

云计算:
6. 2024年,云成本优化将上升至战略层面:除了战术性的成本管理(例如适当规模调整和采用预留实例)之外,企业还将进行更深入的战略评估和优化。这将促使部署在云端的系统现代化并优化成本效益,部分工作负载可能回归本地部署。云投资回报取决于跨越架构设计、成本监控、与云服务提供商谈判以及持续重新评估的整体优化。

混合与多云加速部署:
7. 预计2024年混合云和多云策略的采纳将进一步加速,原因既包括避免单一厂商锁定的战略考量,也因为企业在保持敏感数据本地化的同时,需要利用云服务商提供的可扩展资源。跨区域和跨云服务的无缝集成将成为关键,使企业在不影响数据主权的前提下增强性能、灵活性和效率。

DevOps:
8. DevOps与MLOps的整合以简化AI项目流程:2024年,MLOps将日益与DevOps融合,为AI项目创建更为流畅的工作流。两者结合产生了一系列用于管理和自动化数据、代码和模型的流程和工具,从而提高机器学习平台的效率。这种趋势由简化模型交付至生产的流程驱动,旨在缩短从开发到价值体现的时间。

存储领域:
9. 从专用存储向针对AI平台优化的商品化存储转变:随着AI工作负载的增长,高速和吞吐量优化的高性能计算存储得到了广泛应用。但在2024年,预计将出现向商品化存储的转变。云端对象存储、NVMe闪存和其他存储解决方案将针对成本效益高的可扩展性进行优化。高昂且复杂的专用存储将逐渐让位于适应AI需求的灵活、低成本、易于管理的商品化存储方案,使得更多组织能使用经济高效的解决方案存储和处理大规模数据密集型工作负载。