




存储是人工智能成功的隐形驱动力
AI 的成长离不开数据,正如引擎离不开燃料。越多的数据、越长的留存时间,越能让模型更聪明、更精准、更可信。而支撑这一切的,正是高效、可扩展的存储基础设施。
AI 数据“洪流”正在到来
希捷委托研究机构Recon Analytics 对全球 10 个国家与地区的 1062 位 IT 决策者展开调研,发现一个惊人趋势:预计截至2028 年,人工智能将推动数据存储需求呈指数级增长。
在以云存储为主要存储方式的企业中,61% 的受访者表示,未来三年内公司的云存储容量需提升 100% 以上,即实现容量翻倍。
AI 的发展不再只是“算力的竞争”,而是“数据力”的比拼。每一个模型训练、每一次推理输出,都会生成海量中间数据。没有足够的存储能力,AI 的潜力就无法被真正释放。
随着人工智能应用催生前所未有的数据量,企业存储的数据越多,越能有效验证人工智能是否按预期运行。借助行为数据(如训练数据集、模型检查点、提示词及输出结果),企业可深入审查算法,进一步理解并优化人工智能决策流程。若缺乏数据中心的规模与效率,人工智能的潜力将大打折扣——毕竟,存储与检索海量数据集的能力是人工智能成功的核心所在。
数据留得越久,AI 越“聪明”
推动人工智能成功的不仅是存储容量,数据存储时长同样关键。
在已应用人工智能技术的企业受访者中,90% 认为延长数据留存时间有助于提升人工智能成果质量。
优化算法:历史数据可不断反馈模型,支持持续训练与微调;
保护知识产权:保留模型训练过程,可在法律和合规场景中追溯结果来源;
发现新洞察:未来的算法可能从今天的“旧数据”中挖出新价值。
可信AI,从“可靠存储”开始
AI 的崛起,也让“可信赖”成为一个高频词。
但要让AI 值得信赖,首先要让它的数据可信。相关调查结果还显示,基础设施决策者认为,延长数据留存时间对建立信任至关重要 —— 信任是人工智能洞察的重要根基,缺乏信任,人工智能洞察便毫无价值。
在当前已应用人工智能的企业受访者中,88% 认为采用可信人工智能会增加对更多数据的长期存储需求。
希捷对可信人工智能的定义为:数据工作流程与模型采用可靠输入、生成可靠洞察的人工智能。构建可信人工智能,需依赖符合以下标准的数据:
高质量且精准
合法性、所有权和来源明确
存储安全且受保护
算法对数据的转换过程可解释、可追溯
数据处理输出结果稳定且可靠
可扩展的存储基础设施对于构建“可信赖 AI”至关重要,这样可确保 AI 系统所依赖的大量数据得到妥善管理、存储和保护。
检查点:让AI训练有迹可循
在构建可信人工智能的过程中,80% 的受访者强调了检查点的重要性。
检查点指在人工智能模型训练期间,按特定短时间间隔保存模型状态的过程。人工智能模型需通过迭代过程在海量数据集上完成训练,训练时长从几分钟到数月不等,具体取决于模型复杂度、数据集规模及可用计算能力。训练过程中,模型会接收数据、调整参数,并逐步掌握根据所处理信息预测结果的能力。
检查点好比训练过程中多个时间节点上模型当前状态(包括数据、参数及设置)的“快照”。这些 “快照” 每隔 1 分钟至数分钟便会保存到存储设备中,使开发人员能记录模型的训练进展,避免因意外中断导致重要工作成果丢失。
调查显示,存储容量达100PB 及以上的企业,会以每日至每周为周期保存并备份检查点,其中 87% 的企业会将检查点存储在云端,或采用硬盘(HDD)与固态硬盘(SDD)结合的存储方式。
存储:人工智能成功的核心驱动力
在有关人工智能应用的讨论中,计算能力和能源是热门话题,但Recon Analytics 的调查强调,存储才是关键驱动力。
Recon 公司创始人兼首席分析师Roger Entner对调查结论解读如下:“调查结果总体表明,数据存储需求即将迎来激增,硬盘将成为这一趋势受益者。考虑到受访企业负责人计划将越来越多的人工智能生成数据存储在云端,云服务行业显然已做好准备,有望迎来第二轮增长浪潮。”
要想在下一波AI 浪潮中脱颖而出,企业需要提前布局:
构建可扩展、可靠的存储架构;
制定清晰的数据留存策略;
打造可信赖的数据基础,为未来AI 发展打下根基。
毕竟,在AI 的世界里,谁掌握了数据,谁就掌握了未来。