麦克雷 Mavom.cn

标题: 关于M1Pro、M1Max内存和SOC设计的一些问题 [打印本页]

作者: redagypevurry    时间: 2021-10-20 14:20
标题: 关于M1Pro、M1Max内存和SOC设计的一些问题
M1Pro集成了16C GPU,用的是256bit LPDDR5,带宽200G/s,M1 Max集成了32C GPU用的是512bit LPDDR5,带宽400G/s。不知道这种设计是不是个很好的选择,但成本肯定很高,这种设计最大的缺点是为了性能牺牲了成本。
M1Pro、M1Max使用规格这么高的内存主要是是为了GPU,还有神经网络、视频处理单元等专用模块。M1Pro的GPU性能差不多是移动版3050Ti水平(内存带宽192G/s),M1Max性能接近移动版3080水平(内存带宽448G/s),用这么好的内存确实有必要。

(, 下载次数: 10)

(, 下载次数: 18)

使用256bit、512bit的LPDDR5内存,成本一定很高,因为SOC内部的内存控制器会变得很大,而且位宽这么高的LPDDR5功耗还会低吗?
GDDR6对于M1Pro、M1Max是个很好的选择吗?理论上128bit 1500Mhz GDDR6带宽大约192G/s,256bit 1750Mhz GDDR6带宽大约448G/s。但使用GDDR6有几个问题,一是GDDR6的功耗会比相同性能的LPDDR5高多少,二是相同带宽的GDDR6控制器面积相对LPDDR5是大还是小,三是使用GDDR6最高能堆多大内存,128bit能堆到32G,256bit能堆到64G吗,四是GDDR6内存颗粒相对同性能的LPDDR5贵多少?
内存延迟这个问题不需要考虑。在L2、L3足够大的情况下,内存延迟带来的影响可以忽略不计。就算L2、L3不大,内存延迟带来的影响也很小,对大多数应用影响都很小,大多数人感觉不出来60ns和140ns的区别。不管是256bit 、512bit的LPDDR5,还是同样性能的GDDR6,内存延迟都很高,但都可以被高带宽和大缓存弥补。PS5使用GDDR6当内存,延迟高达140ns多(可以看R7 4700S的评测),但玩3A游戏却没什么影响(极客湾那个视频主要是劝退,4700S玩游戏不行主要是PCIE2.0*4的锅)。
作者: zjfxihsc55    时间: 2021-10-20 14:20
(, 下载次数: 14)

LP5省电。
作者: bqnpiurt63    时间: 2021-10-20 14:21
gddr功耗太高了
作者: hosing    时间: 2021-10-20 14:22
(, 下载次数: 9) 苹果要是在乎成本就不会做这么大芯片了
作者: Conradvit    时间: 2021-10-20 14:22
延迟对高帧率游戏有影响,ps5的游戏帧数最高也就120,影响不明显。
作者: 艾的民    时间: 2021-10-20 14:23
(, 下载次数: 17)

对M1Pro和M1Max各部分面积进行粗略的统计
作者: 1751773939    时间: 2021-10-20 14:24
成本再高也比intel便宜吧
(, 下载次数: 9)
作者: YTXCC    时间: 2021-10-20 14:25
其实觉得苹果应该将M1Pro和M1Max的GPU、NPU、视频处理单元独立出去,做成独立显卡(暂且叫M1A,M1 accelerate CARD),其他的做成M1X SOC。
M1X,CPU和M1Pro和M1Max相同,8P+2E,内存使用128bit LPDDR5,8核GPU+16M SLC(和M1相同)。由于规模更小,电源、总线、片上互联等部件的晶体管数量要少得多。这样的话,大约200亿晶体管,甚至还不到。
M1A Pro,32核GPU,2个ProRes视频处理单元(和M1Max相同),32核NPU,256bit 1750Mhz GDDR6(448G/s),估计不超过350亿晶体管。有独显就不需要SLC这玩意了,256bit GDDR6面积应该比512bit LPDDR5小得多。
M1A,16核GPU,1个ProRes视频处理单元,16核NPU,128bit 1500Mhz GDDR6(192G/s),估计不超过175亿晶体管。
SOC面积太大了,成本会暴增,而且总线、片上互联、电源、SLC、内存控制器等模块的面积会特别大。
作者: Ashleyfund    时间: 2021-10-20 14:25
功耗再高也总比发烧到沸点的gddr6x强
(, 下载次数: 9)
作者: Thomasoi    时间: 2021-10-20 14:26
好家伙,x86.下四倍的内存带宽,但是同样的内存延迟也四倍了…还是得看软硬结合的优化的,x86这样的话几乎没法用,
作者: 艾的民    时间: 2021-10-20 14:27
高成本需要高售价和高销量来对冲,苹果能做到,所以成本对苹果不是太大问题。
nvidia没好的cpu,intel的gpu雷声大雨点小且之前的名声比较差,能集成好cpu和gpu的有近几年的amd。但amd只卖芯片不做产品,除非有大公司定制,否测做了强cpu和gpu的芯片卖不出去浪费钱。苹果这种实力强大、垂直整合、体量大的公司最适合做这样的芯片,自产自销、销量大、品牌强,没有过多的顾虑。ps5其实不是太好的对比例子,主要用来玩游戏,macbook pro还用来剪视频、办公,对省电的要求也更高些。主机厂商和游戏公司深度合作,针对硬件的优化更深入。
m1max最让人心动的还是超强和超高能效的cpu,桌面顶级性能,功耗低很多。
作者: mflower    时间: 2021-10-20 14:28
请问一下 400gb/s的带宽 是必须上64g内存版本的才有吗?
作者: 艾的民    时间: 2021-10-20 14:28
单颗LPDDR5是64bit,单颗8g,8颗就能512bit,不过这玩意要求soc的内存控制器要非常牛逼,LPDDR5本身是不贵的,成本还是在soc上面,
作者: pon@nod_sJPKJ    时间: 2021-10-20 14:29
400G带宽和cpu共享的,比pc端显卡同带宽还是差一点
作者: 9444影院ww3    时间: 2021-10-20 14:29
学习了




欢迎光临 麦克雷 Mavom.cn (http://www.mavom.cn/) Powered by Discuz! X3.5