首页 > 原创知识 > 原创知识 > 深挖苹果AI报告:端侧内存占用少37.5%、云端创新PT-MoE架构

深挖苹果AI报告:端侧内存占用少37.5%、云端创新PT-MoE架构

发布时间:2025-07-22 12:06:23来源: 18844129908
7 月 22 日消息,科技媒体 9to5Mac 昨日(7 月 21 日)发布博文,挖掘苹果新技术报告论文,探究其 AI 模型的训练、优化及评估过程,并揭示了诸多幕后技术细节。
 
这份报告全称为《Apple Intelligence Foundation Language Models – Tech Report 2025》,详尽描述了苹果在多个 AI 方面的处理,涵盖模型架构、数据来源、预训练、后训练、工具开发、优化措施以及性能基准等。
 
 
 
该媒体解读该技术报告,挖掘了 4 个值得关注的要点:
 
端侧模型双区块设计
 
此前消息显示,苹果的 AI 模型将采用端侧 + 云端组合方式,端侧模型规模大约为 30 亿(3B)个参数。
 
根据最新公布的技术报告,苹果端侧 AI 模型分为 2 个区块(Blocks),其中第 1 个区块包含大约 62.5% 的 transformer 层,而第 2 个区块包含大约 37.5% 的 transformer 层,但移除了键(Key)和值(Value)的映射。
 
苹果表示这种分割方式,在不影响模型的总体性能和输出质量的情况下,让模型在缓存时,减少了约 37.5% 的内存需求,同时输出第一个 tokens 的时间也缩短了 37.5%。
 
 
 
云端模型采用创新架构
 
对于服务器端模型,苹果开发了一种专门为其私有云计算平台量身定制的架构,名为 Parallel-Track Mixture-of-Experts(PT-MoE)。
 
简单来说,混合专家(Mixture of Experts)模式意味着,不是依赖单一的大型 AI 模型,而是将其拆分为多个较小的子网络(或称为专家),只有在任务与它们的专长相关时才会激活这些子网络。
 
因此,如果输入提示与烹饪相关,只会激活烹饪领域的专家,而其他专家则保持休眠状态。这样,虽然整体模型依然庞大,但其模块化的设计使得模型能够更快、更精确地响应。
 
 
 
苹果构建了一种名为 Parallel Track Transformer 的新型 Transformer,并利用混合专家(MoE)层对其进行扩展。听起来可能很复杂,但关键在于:
 
传统的 Transformer 模型会通过一个层的堆栈依次处理 tokens,而苹果的设计则是将模型分为多个并行的轨道。每个轨道独立处理 tokens,并在某些点进行同步。
 
在每个轨道内,苹果将每个其他常规 Transformer 层替换为 MoE 层,每个标记只激活几个专家,而其他专家保持空闲。由于每个轨道都有自己的本地专家,模型避免了在整个系统中协调时的处理瓶颈。
 
再加上一个平衡本地上下文与整体理解(称为交织全局和本地关注层)的巧妙设计,最终形成了一个模块化、高效、可扩展的模型,速度更快、更精简,同时保持了高度的智能。
 
苹果大幅提升多语言支持
 
Apple 智能最初推出时最受诟病的问题之一(现在依然存在),是英语之外的语言支持有限。随着新模型的发布,苹果扩展了语言支持范围,并在报告中详细介绍了实现这一目标的步骤。
 

原创知识更多>>

魏牌7965台,哈弗60330台,长城汽车4月销量有啥看点? 上汽大通孙浩:MPV王者领跑全球,极致品质为核心 奇瑞商用车4月销量10384辆 同比增长40% 皮卡销量2300辆 北京国际车展|双线并进全面焕新,奥迪能否实现新一轮突破? 4月份,奇瑞新能源汽车销量100276台,同比增长63.8%;海外出口177573台,同比大增102.4% 对话宝马中国CTO:大圆柱真量产?宁德时代亿纬锂能怎么配? 新款别克世纪,依然是最懂高净值人群的超豪华MPV 虽然问道V9价格很亲民,但对于其市场表现,我为啥仍不看好? 35.98万起!第二代腾势D9全面升级,重塑高端MPV格局 上汽大众ID. ERA 9X爆单背后:信任比流量更珍贵 埃安N60用实打实的价格与产品力践行“Easy Life”的松弛感 smart 精灵6号18.99万元起预,精灵2号概念车首发亮相 新能源竞赛换挡时刻,谁是“央企新势力”压舱石? 埃安AION N60正式上市 限时焕新价10.68万起,全系标配激光雷达 长安凯程Robovan亮相:无人物流车终于从“概念”走向“赚钱” 限时换新价6.98万元起,长城欧拉5多动力版本上市 自主品牌全面焕新,广汽集团发布五款新车 加速向智能电动转型捷达品牌全面焕新,首款纯电轿车M6下半年上市 2026北京车展正式开幕,广汽昊铂S600在车展上开启盲订 2026北京车展,宝马展示全新宝马iX3长轴距版、i3长轴距版以及新款宝马7系/i7 2000万的仰望誰买走了?当东方工艺在车展打败西方设计 小马智行重构万亿级出行与物流生态:2027版Robotaxi成本低于23万,首发L4级无人轻卡 奕境品牌首款车型奕境X9亮相 预计下半年上市 北京车展直击:东风登场,展车+技术全亮相 首款纯电轿车的名字——捷达M6 2026北京汽车展览 | 预售价区间20.99-25.99万元 新款领克10/领克10+开启预售 2026北京汽车展览 | 捷途旅行者PLUS C-DM/山海L10悉数亮相 北京汽车展览 | 长安蓝鲸超擎双车炸场,HEV正式进入“七万时代” 全新宝马七系领衔十六款首秀,新世代技术驱动中国跃迁 2026北京车展首秀 | 日产两款全新SUV概念车全球首秀 预计将于年内量产