云天励飞DeepEdge10适配DeepSeek开源周“首个大招”:FlashMLA
2月24日,DeepSeek"开源周"正式启动,并发布首个代码库FlashMLA,引发全球关注。
FlashMLA是针对英伟达Hopper GPU优化的高效MLA解码内核,专为可变长度序列优化设计,是DeepSeek高效使用算力的核心程序模块。FlashMLA通过MLA解码优化与分页KV缓存技术,显著提升硬件利用率,加速大语言模型解码过程,有效提高响应速度与吞吐量,适用于各种实时对话生成场景。
云天励飞芯片团队在FlashMLA开源后,迅速完成了DeepEdge10平台与FlashMLA的适配工作。在适配过程中,云天励飞采用了Op fusion tiling、Online softmax、Double buffer、细粒度存算并行等先进技术,并基于自研的Triton-like编程语言快速开发验证了高效的FlashMLA算子。通过一系列优化,不仅显著提升了计算效率,还大幅降低了显存占用,充分展现了DeepEdge10平台“算力积木”芯片架构的卓越优势,以及其与DeepSeek生态的高度契合性。
今日,云天励飞已将相关代码提交至开源平台Gitee,为开源AI贡献了重要的技术力量。
DeepEdge10系列芯片是专门针对大模型时代打造的芯片,支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各类不同架构的主流模型;基于自主可控的先进国产工艺打造,采用独特的“算力积木”架构,可灵活满足智慧城市、智慧交通、智能制造、智慧仓储、机器人、边缘智算中心等不同场景对算力的需求,为大模型推理提供强大动力。
目前,DeepEdge10芯片平台已成功适配DeepSeek R1系列模型及国产鸿蒙操作系统。未来,云天励飞将持续加大研发力度,推动芯片在国产化领域取得更大突破,为国产AI生态建设贡献更多力量。
相关阅读
- 阿迪达斯「先锋运动」秋冬系列发布:先锋装备系统再进化,「先锋攻壳」革新城市机能范式
- 抖音洁面赛道迎10亿级爆发,韩束双单品霸榜引领行业升级
- 色彩绘齐鲁:搜罗山东海岛、山野与古城的四季风光
- 从粮油到网红零食,从进口精品到非遗手作:深圳礼品展打造2025年食品福利一站式采购平台
- 并购创造价值,首届并购嘉年华将于9月12日在沪开幕
- 官宣!海尔欧洲牵手两大冠军足球俱乐部
- 宜品集团斩获三大荣誉,以实力推动奶粉行业发展
- WAIC 2025盛大开幕,宜人智科秀出AI硬实力
- 春沐源科技农业CEO赖赣峰出席亚洲国际果蔬展圆桌会议 阐述现代科技农业发展新理念
- 深度解读格力电器2025半年报:破除低端内卷的战略定力
推荐阅读
快讯 更多
- 07-09 13:16 | 三重焕新,启航未来——Pivotal中文品牌发布暨乔迁新址、新官网上线
- 04-10 11:21 | 为“首发经济”注入创新动力,CMEF见证宽腾医学影像技术革新
- 02-20 18:53 | 手机也要上HBM芯片?三星计划推出移动版HBM,预计首款产品2028年上市
- 12-30 16:40 | 国产首款DDR5内存问世!价格战开启,复制长江存储击败三星路径!
- 12-30 16:36 | 华为手机回归第一年:全年销量或超4000万台 有望凭借Mate 70在高端市场击败苹果
- 11-26 18:19 | 众兴菌业拟与涟水县人民政府签订《招商引资合同书》 拟投资设立涟水食用菌产业园项目
- 11-26 18:16 | 美芝股份中选vivo全球AI研发中心-精装工程采购项目(标段二)
- 11-26 18:14 | 健之佳拟用不超1亿回购公司股份 维护公司价值及股东权益
- 11-26 09:53 | 格灵深瞳收购深圳市国科亿道科技有限公司部分股权并增资5000万
- 11-26 09:37 | 炜冈科技拟以1.49亿购买衡所华威9.33%股权 华海诚科拟发行可转债收购炜冈科技所持衡所华威股权