麦克雷 Mavom.cn

标题: 苹果M1使用了Arm自定义指令集?开发者逆向惊奇发现:?苹果M1未公开的秘密... [打印本页]

作者: v83674462 时间: 昨天 11:51
标题: 苹果M1使用了Arm自定义指令集?开发者逆向惊奇发现:?苹果M1未公开的秘密...
苹果M1使用了Arm自定义指令集?开发者逆向惊奇发现:?苹果M1未公开的秘密...

作者: s65812530 时间: 昨天 11:52
苹果M1确实使用了未公开的矩阵协处理器（AMX），但未采用Arm官方定义的自定义指令集，而是通过协处理器架构实现紧密集成。 以下从技术背景、协处理器与加速器的区别、AMX的发现过程及性能优势等方面展开分析：
一、技术背景：矩阵运算与专用硬件需求矩阵是数字的二维表格，广泛应用于图像处理、机器学习、语音识别等领域。例如，机器学习中的神经网络训练依赖大量矩阵乘法运算，而传统CPU通过增加核心数量难以满足其高性能需求。为此，芯片厂商通常通过添加专用硬件（如协处理器或加速器）提升矩阵运算效率。
苹果M1的片上系统（SoC）已包含神经引擎（Neural Engine），用于加速机器学习任务中的矩阵运算。但开发者Dougall Johnson通过逆向工程发现，M1还隐藏了一个名为AMX的矩阵协处理器，其设计目标与神经引擎不同，且未在官方文档中公开。
(, 下载次数: 0)
图：苹果M1芯片架构示意图（AMX协处理器未在官方标注中显示）二、协处理器与加速器的核心区别

数据交互方式

加速器

协处理器

集成度与灵活性

性能场景

三、AMX的发现过程与逆向工程开发者Dougall Johnson通过以下步骤发现AMX：

分析苹果矩阵运算库

逆向工程指令流

验证性能优势

四、苹果未公开AMX的原因

ARM生态限制

垂直整合优势

性能竞争壁垒

五、AMX的性能优势与实际应用

性能对比

NodLabs测试

能效比

应用场景

机器学习

多媒体处理

科学计算

六、技术延伸：AMX与SIMD向量引擎的区别

设计定位

SIMD（如Neon）

AMX

硬件实现

总结苹果M1通过隐藏的AMX矩阵协处理器，在未违反ARM生态规则的前提下，实现了对矩阵运算的高效加速。其协处理器架构与神经引擎形成互补，覆盖了从小规模到大规模的矩阵任务需求。苹果的垂直整合策略不仅提升了性能，还通过隐藏硬件细节维持了软件生态的稳定性。这一设计为ARM架构在机器学习领域的竞争提供了新思路，也凸显了定制化硬件在专用计算任务中的价值。

欢迎光临麦克雷 Mavom.cn (http://www.mavom.cn/)