
延伸阅读,点击链接了解 Akamai Cloud Computing
在众多新兴AI公司、模型和应用的浪潮中,有个趋势愈发清晰:AI的重点正在从训练转向推理。彭博社预测,到2032年,AI推理市场规模将增至1.3万亿美元,这一观点也得到了很多最新报告的支持。市场的这一变化表明,2025年将成为加速分布式AI推理发展的关键一年。
“持续改进”和“不断适应”的往复循环
尽管在打造强大AI模型的过程中,训练工作仍将发挥关键作用,但未来的重点将会是推理:即部署这些模型,进而为企业和消费者提供实时、可行的见解和结果。同时,通过从边缘设备将动态数据回馈至训练过程,推动模型持续改进与适应,形成一个不断优化的循环。
AI推理的应用方式
AI推理是人工智能从“画在纸上的饼”转变为实际应用并产生现实影响的关键环节。Akamai的客户正在多个行业和应用场景中利用AI推理,包括:
智慧城市:优化交通流量以减少拥堵并提升安全性,通过智能监控改善公共安全。
自动驾驶车辆:实现瞬时决策,促进高效的车队编排。
工业物联网与制造业:实施预测性维护以防止停机,通过实时视频分析提升质量控制。
智能零售:提供个性化购物体验,并通过智能结账和库存管理优化运营。
医疗与远程医疗:实时监测患者健康状况,通过图像处理加速医学诊断,支持先进的可穿戴设备。
媒体娱乐:定制个性化内容,实现实时视频转码和直播增强。
这些示例只是客户借助AI推理所能实现的广泛应用的冰山一角。随着边缘计算不断发展,预计将在各个行业看到更多创新性的应用。
AI推理的常见挑战
这种创新也带来了一些常见挑战,包括延迟、成本和可扩展性。多年来,Akamai始终致力于解决这些问题。
将大量通用且性能过剩的GPU集中在数据中心的方式,已无法满足大众对高效AI推理的规模化和响应速度的需求。我们需要采用全新范式,使推理架构更贴近用户,也就是要通过分布式云模型来实现。
通过分布式云模型实现AI推理
在采用分布式云模型提供AI推理时,需要考虑一些独特因素,包括:
延迟与响应速度:在集中式云数据中心之间传输数据会影响用户体验,并可能导致业务机会流失。去中心化的分布式架构则可提升推理响应速度。
资源约束:边缘设备在功耗、存储和计算能力方面存在限制。因此无比要通过部署轻量化、更高效的AI模型来实现强大的性能。
安全与数据隐私:本地数据处理可减少数据在传输过程中的暴露,从而增强安全性。这对医疗、金融和政府等需遵守严格数据本地化和隐私法规的行业尤为重要。
可扩展性与分布式架构:随着托管AI应用的分布式位置数量增加,跨网络管理和更新AI模型的复杂性也随之上升。因此,必须要能提供可扩展的模型部署和维护解决方案。
带宽与成本效益:去中心化AI推理可大幅减少传输至集中式云服务器的数据量,不仅能缓解网络拥堵,还能显著降低数据传输和存储成本。
这些因素是在分布式、去中心化云基础设施上部署AI时的关键考量,所有希望高效利用AI的企业都应重点关注。

Akamai强大生态系统带来卓越的性能和可扩展性
Akamai致力于构建全球分布的云。我们的全球基础设施经过近30年发展,已容纳超过25个核心计算区域、快速扩展的分布式计算位置,以及超过4000个边缘节点。这一强大生态系统已经为满足企业在当前和未来AI推理需求做好了准备。
我们意识到,尽管客户对高性能有很高需求,但他们也越来越担心传统云服务商常见的高额成本超支。Akamai云旨在解决这一日益增长的问题。
我们并没有沿袭传统做法囤积昂贵的通用GPU,这些GPU对AI推理任务来说往往过于强大。相反,我们为客户提供了一种平衡的GPU替代方案:Nvidia RTX 4000 Ada系列GPU。这些GPU兼具性能和成本效益,非常适合AI推理、运行小型语言模型以及处理像媒体转码这样的专用工作负载。
强大但不失成本效益的方法
这种方法使我们能将卓越的AI能力更贴近用户,同时保持对客户的成本效益。我们的测试显示,在运行生成式AI类Stable Diffusion模型时,与传统公有云服务商提供的同类GPU替代方案相比,我们的成本节省幅度超过了80%。
相信这种方法能带来最强大且兼具成本效益的结果,并能够推动新的AI应用场景继续发展。
分布式推理是使用AI的全新构想
随着AI的实用性不断提升,Akamai认为:分布式推理不仅仅是技术的进步,更是对AI使用方式的根本性重新构想。从集中的资源密集型计算转向更高效的分布式边缘计算,这一转变已经在不知不觉中开始了。
Akamai不仅在观察这一变革,也在积极塑造这场变革。通过将遍布全球的分布式网络、战略性的云计算投资(包括围绕推理工作进行优化的GPU)以及对性能和成本效益的深刻理解等因素紧密结合在一起,Akamai正专注于帮助企业释放AI推理的真正潜力。
很多企业也已经意识到,对于采用AI推理这件事,真正的问题已经不再是“是否”,而是“如何”。边缘不再仅仅是数据的目的地,而是正成为AI提供最具影响力、实时见解的主要领域。欢迎进入计算的下一世代。