MLGO微算法科技发布多用户协同推理批处理优化系统,重构AI推理服务效率与能耗新标准
在人工智能(AI)与移动计算深度融合的背景下,边缘计算逐步成为新一代智能服务基础架构的核心。在这一浪潮中,微算法科技(NASDAQ:MLGO)推出一种具有批处理功能的边缘服务器实现多用户协同推理技术,这项技术不仅提供了面向多用户、能耗敏感型设备的高效协同推理解决方案,还通过创新的批处理调度与任务划分算法,打破传统推理模式的限制,显著提升GPU资源利用率与系统整体吞吐能力。
在当前边缘智能化的大趋势下,移动终端设备的AI应用越来越丰富,从智能安防、增强现实,到车载AI助手,几乎无处不在。然而,这些终端设备往往受限于能耗与计算能力,难以独立高效完成深度神经网络(DNN)推理任务。尤其是在并发任务数量剧增的场景中,单设备完成所有计算将造成电量快速消耗和响应速度下降。因此,推理任务卸载成为缓解这些瓶颈的重要方向。将深度学习模型的推理阶段卸载至配备GPU的边缘服务器,不仅能释放终端计算资源,还可在保持较低延迟的同时提供近实时服务。
但传统卸载方案通常针对单用户场景,未充分考虑多个用户共享边缘服务器资源时的任务调度与负载均衡问题。在真实世界中,边缘服务器往往要同时响应数十、甚至数百个终端设备的推理请求。在这种多用户同时在线的场景下,如何高效地调度任务,最大限度地提升GPU并行计算能力,并在保障各用户延迟需求的同时最小化整体能耗,成为亟需解决的问题。
因此,微算法科技(NASDAQ:MLGO)提出了一种创新架构:将用户推理任务进一步拆分为多个细粒度的子任务,并利用GPU的批处理能力对多个用户的相同类型子任务进行统一聚合处理。这一思路源自于对GPU执行特性和神经网络推理结构的深入分析。在DNN模型中,推理通常由若干层组成,不同用户即便使用不同模型,也常存在可重用的结构(如卷积层、全连接层等),因此可以通过统一调度与分组机制,对同类任务进行并发批处理,从而提高资源利用率。
在系统设计方面,微算法科技研发团队引入独立划分与相同子任务聚合算法(Independent Partition and Same Subtask Aggregation,IP-SSA)技术。该算法的核心理念是:对于具有相同边缘推理延迟与相同服务级别协议的多用户群体,可将每个用户的推理任务独立划分为子任务,并将相同类别的子任务聚合在一个批次中处理。通过严格的理论推导,研究团队证明了这一策略在延迟恒定约束条件下是最优的。也就是说,在限定的响应时间内,IP-SSA 能够最小化总能耗并提升系统吞吐率,从而为批处理系统提供坚实的理论支撑。
然而,真实应用中用户请求的时延容忍度通常存在差异,特别是在服务等级协议(SLA)各异的情况下,这种差异可能导致传统聚合策略效率下降。为解决该挑战,微算法科技(NASDAQ:MLGO)进一步提出了最优分组算法(Optimal Grouping,OG)。OG算法通过对用户任务的延迟上限、任务计算强度和资源可用性建模,动态调整任务分组方式,确保在多样化时延约束下,任务依旧能高效进行批处理。这一算法不仅保留了IP-SSA的高并发调度能力,还能灵活适应不同的服务场景。

为适应动态场景下任务到达的不确定性,微算法科技(NASDAQ:MLGO)还在系统中引入了强化学习模型进行调度决策。通过训练深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)代理,系统能够在运行中自适应学习最优调度策略。具体来说,当预测模型无法精确获得未来任务分布时,DDPG代理根据当前状态选择是否使用OG算法进行任务分组,或选择直接按照任务类型即时调度。此机制大幅提升了系统的鲁棒性与在线部署适应能力。
微算法科技该系统的核心包括三大模块:任务划分模块、任务聚合与分组模块,以及调度策略优化模块。任务划分模块将原始DNN模型转换为可卸载的子任务图,并结合端设备的功耗模型进行代价建模;任务聚合与分组模块利用IP-SSA和OG策略,根据任务特征和延迟需求进行批处理组织;而调度策略优化模块则通过强化学习驱动的控制器进行在线调度,从而在实际运行中持续优化资源利用与服务质量。
系统在多个边缘计算实验平台上进行了测试,分别对图像识别与目标检测实验,覆盖智能摄像头、移动终端、智能车载设备等典型场景。结果表明,与传统推理卸载系统相比,该系统在保持推理精度的前提下,实现了平均47.8%的能耗下降,并提升了42.5%的任务吞吐量。在多用户并发数大于50的场景中,系统仍能维持稳定的延迟控制能力,有效避免了因GPU任务拥塞带来的性能下降。
此外,微算法科技该系统支持多种部署模型,包括本地私有边缘云、区域型MEC(移动边缘计算)平台、以及融合5G网络的边缘服务节点。这种灵活部署能力,使其可广泛应用于智能制造、智能城市、智慧医疗等对响应时间与能效有严格要求的行业中。
微算法科技(NASDAQ:MLGO)计划将该系统进一步扩展为通用的AI卸载平台,支持多模态数据协同推理任务(如图像、语音、文本融合分析),并与边缘数据缓存系统集成,实现“感知—分析—执行”一体化AI服务。此外,系统的调度核心也将在联邦学习与安全多方计算框架下进行强化,以适应更高等级的隐私保护和数据隔离需求。
作为边缘AI领域的重要突破,微算法科技这项具有批处理功能的边缘服务器实现多用户协同推理技术,不仅是算法与系统工程的深度融合,更为边缘智能生态带来一套系统化的性能优化方案。在全球AI应用场景爆发增长的今天,这项技术将引领新一代边缘智能基础设施的建设潮流,为构建更加绿色、高效、智能的计算未来提供坚实支撑。
相关阅读
- 东芝携150年创新积淀八赴进博,以科技赋能可持续未来
- 第二十七届高交会3E亚洲消费电子展将举行 奥尼电子携多款智能终端新品亮相
- 亿邦智库×SHOPLINE发布《未来电商报告:品牌独立站五步升级锁定未来确定性增长》
- 第二十七届高交会3E亚洲消费电子展将举行 LIPO李白将发布全球最轻智能眼镜
- “巨星狗”商业化再下一城!巨星传奇“IP+机器人+AI”模式获市场验证
- 赋能精准营销:智推时代GEO服务行业的成功实践
- AI数字厨电增长高达55%,老板电器以技术突破引领厨房数字化纵深发展
- 杭州微念联手先农坛举办秋收米粉文化节 一场“食农教育”的活动
- 业绩稳增+多维破局,老板电器三季度打开增长新空间
- 科大讯飞“AI+轻办公”产品全新升级
推荐阅读
快讯 更多
- 07-09 13:16 | 三重焕新,启航未来——Pivotal中文品牌发布暨乔迁新址、新官网上线
- 04-10 11:21 | 为“首发经济”注入创新动力,CMEF见证宽腾医学影像技术革新
- 02-20 18:53 | 手机也要上HBM芯片?三星计划推出移动版HBM,预计首款产品2028年上市
- 12-30 16:40 | 国产首款DDR5内存问世!价格战开启,复制长江存储击败三星路径!
- 12-30 16:36 | 华为手机回归第一年:全年销量或超4000万台 有望凭借Mate 70在高端市场击败苹果
- 11-26 18:19 | 众兴菌业拟与涟水县人民政府签订《招商引资合同书》 拟投资设立涟水食用菌产业园项目
- 11-26 18:16 | 美芝股份中选vivo全球AI研发中心-精装工程采购项目(标段二)
- 11-26 18:14 | 健之佳拟用不超1亿回购公司股份 维护公司价值及股东权益
- 11-26 09:53 | 格灵深瞳收购深圳市国科亿道科技有限公司部分股权并增资5000万
- 11-26 09:37 | 炜冈科技拟以1.49亿购买衡所华威9.33%股权 华海诚科拟发行可转债收购炜冈科技所持衡所华威股权
