找回密码
 立即注册
  • QQ空间
  • 回复
  • 收藏

关于M1Pro、M1Max内存和SOC设计的一些问题

M1Pro集成了16C GPU,用的是256bit LPDDR5,带宽200G/s,M1 Max集成了32C GPU用的是512bit LPDDR5,带宽400G/s。不知道这种设计是不是个很好的选择,但成本肯定很高,这种设计最大的缺点是为了性能牺牲了成本。
M1Pro、M1Max使用规格这么高的内存主要是是为了GPU,还有神经网络、视频处理单元等专用模块。M1Pro的GPU性能差不多是移动版3050Ti水平(内存带宽192G/s),M1Max性能接近移动版3080水平(内存带宽448G/s),用这么好的内存确实有必要。

关于M1Pro、M1Max内存和SOC设计的一些问题-1.jpg

关于M1Pro、M1Max内存和SOC设计的一些问题-2.jpg

使用256bit、512bit的LPDDR5内存,成本一定很高,因为SOC内部的内存控制器会变得很大,而且位宽这么高的LPDDR5功耗还会低吗?
GDDR6对于M1Pro、M1Max是个很好的选择吗?理论上128bit 1500Mhz GDDR6带宽大约192G/s,256bit 1750Mhz GDDR6带宽大约448G/s。但使用GDDR6有几个问题,一是GDDR6的功耗会比相同性能的LPDDR5高多少,二是相同带宽的GDDR6控制器面积相对LPDDR5是大还是小,三是使用GDDR6最高能堆多大内存,128bit能堆到32G,256bit能堆到64G吗,四是GDDR6内存颗粒相对同性能的LPDDR5贵多少?
内存延迟这个问题不需要考虑。在L2、L3足够大的情况下,内存延迟带来的影响可以忽略不计。就算L2、L3不大,内存延迟带来的影响也很小,对大多数应用影响都很小,大多数人感觉不出来60ns和140ns的区别。不管是256bit 、512bit的LPDDR5,还是同样性能的GDDR6,内存延迟都很高,但都可以被高带宽和大缓存弥补。PS5使用GDDR6当内存,延迟高达140ns多(可以看R7 4700S的评测),但玩3A游戏却没什么影响(极客湾那个视频主要是劝退,4700S玩游戏不行主要是PCIE2.0*4的锅)。
回复

使用道具 举报

大神点评(14)

zjfxihsc55 2021-10-20 14:20:43 显示全部楼层
关于M1Pro、M1Max内存和SOC设计的一些问题-1.jpg

LP5省电。
回复 支持 反对

使用道具 举报

bqnpiurt63 2021-10-20 14:21:29 显示全部楼层
gddr功耗太高了
回复 支持 反对

使用道具 举报

hosing 2021-10-20 14:22:05 显示全部楼层
关于M1Pro、M1Max内存和SOC设计的一些问题-1.png 苹果要是在乎成本就不会做这么大芯片了
回复 支持 反对

使用道具 举报

Conradvit 2021-10-20 14:22:54 显示全部楼层
延迟对高帧率游戏有影响,ps5的游戏帧数最高也就120,影响不明显。
回复 支持 反对

使用道具 举报

艾的民 2021-10-20 14:23:44 显示全部楼层
关于M1Pro、M1Max内存和SOC设计的一些问题-1.jpg

对M1Pro和M1Max各部分面积进行粗略的统计
回复 支持 反对

使用道具 举报

1751773939 2021-10-20 14:24:42 显示全部楼层
成本再高也比intel便宜吧
关于M1Pro、M1Max内存和SOC设计的一些问题-1.jpg
回复 支持 反对

使用道具 举报

YTXCC 2021-10-20 14:25:36 显示全部楼层
其实觉得苹果应该将M1Pro和M1Max的GPU、NPU、视频处理单元独立出去,做成独立显卡(暂且叫M1A,M1 accelerate CARD),其他的做成M1X SOC。
M1X,CPU和M1Pro和M1Max相同,8P+2E,内存使用128bit LPDDR5,8核GPU+16M SLC(和M1相同)。由于规模更小,电源、总线、片上互联等部件的晶体管数量要少得多。这样的话,大约200亿晶体管,甚至还不到。
M1A Pro,32核GPU,2个ProRes视频处理单元(和M1Max相同),32核NPU,256bit 1750Mhz GDDR6(448G/s),估计不超过350亿晶体管。有独显就不需要SLC这玩意了,256bit GDDR6面积应该比512bit LPDDR5小得多。
M1A,16核GPU,1个ProRes视频处理单元,16核NPU,128bit 1500Mhz GDDR6(192G/s),估计不超过175亿晶体管。
SOC面积太大了,成本会暴增,而且总线、片上互联、电源、SLC、内存控制器等模块的面积会特别大。
回复 支持 反对

使用道具 举报

Ashleyfund 2021-10-20 14:25:58 显示全部楼层
功耗再高也总比发烧到沸点的gddr6x强
关于M1Pro、M1Max内存和SOC设计的一些问题-1.png
回复 支持 反对

使用道具 举报

Thomasoi 2021-10-20 14:26:58 显示全部楼层
好家伙,x86.下四倍的内存带宽,但是同样的内存延迟也四倍了…还是得看软硬结合的优化的,x86这样的话几乎没法用,
回复 支持 反对

使用道具 举报

艾的民 2021-10-20 14:27:26 显示全部楼层
高成本需要高售价和高销量来对冲,苹果能做到,所以成本对苹果不是太大问题。
nvidia没好的cpu,intel的gpu雷声大雨点小且之前的名声比较差,能集成好cpu和gpu的有近几年的amd。但amd只卖芯片不做产品,除非有大公司定制,否测做了强cpu和gpu的芯片卖不出去浪费钱。苹果这种实力强大、垂直整合、体量大的公司最适合做这样的芯片,自产自销、销量大、品牌强,没有过多的顾虑。ps5其实不是太好的对比例子,主要用来玩游戏,macbook pro还用来剪视频、办公,对省电的要求也更高些。主机厂商和游戏公司深度合作,针对硬件的优化更深入。
m1max最让人心动的还是超强和超高能效的cpu,桌面顶级性能,功耗低很多。
回复 支持 反对

使用道具 举报

mflower 2021-10-20 14:28:16 显示全部楼层
请问一下 400gb/s的带宽 是必须上64g内存版本的才有吗?
回复 支持 反对

使用道具 举报

艾的民 2021-10-20 14:28:26 显示全部楼层
单颗LPDDR5是64bit,单颗8g,8颗就能512bit,不过这玩意要求soc的内存控制器要非常牛逼,LPDDR5本身是不贵的,成本还是在soc上面,
回复 支持 反对

使用道具 举报

pon@nod_sJPKJ 2021-10-20 14:29:11 显示全部楼层
400G带宽和cpu共享的,比pc端显卡同带宽还是差一点
回复 支持 反对

使用道具 举报

9444影院ww3 2021-10-20 14:29:23 显示全部楼层
学习了
回复 支持 反对

使用道具 举报

说点什么

您需要登录后才可以回帖 登录 | 立即注册
HOT • 推荐