麦克雷 Mavom.cn

标题: M1 Max 机器学习性能不如预期 [打印本页]

作者: yJkQiBVt    时间: 2021-12-23 16:44
标题: M1 Max 机器学习性能不如预期
测试了一下apple的tensorflow效果,具体参考了Apple的教程。
developer apple com metal tensorflow plugin
具体配置是 14寸 MBP M1 Max 32c GPU 32GB内存
以下测试就是图一乐
作者: jtpingouro2    时间: 2021-12-23 16:45
(, 下载次数: 0)

测试是训练ResNet50,batch_size是128
在测试中的吞吐量是114 samples每秒
作者: Robertcip    时间: 2021-12-23 16:45
真搞机器学习不用nv就是找罪受,小众的一堆问题还要造轮子
作者: polit-sovet_hon    时间: 2021-12-23 16:46
补图
(, 下载次数: 0)
作者: e72756536    时间: 2021-12-23 16:46
cpu和gpu在训练中的占用率
CPU:60%左右
GPU:接近100%

(, 下载次数: 0)
作者: songkeke    时间: 2021-12-23 16:47
内存占用量接近20G
这说明苹果的UMA可以让GPU利用更多的空间来载入大模型
(, 下载次数: 0)
作者: tamixf4    时间: 2021-12-23 16:47
很好奇这速度能怎么样,cnn rnn gan之类的每代n卡都各有侧重,不知道m1 max咋样
作者: ZCXVZ    时间: 2021-12-23 16:48
功耗
GPU 平均 21w
CPU 平均 5.8w
package 平均45w
(, 下载次数: 0)
作者: u58454844    时间: 2021-12-23 16:48
对比原来repo中3090的成绩是1000Sample/sec功耗360w还是差了不少,相当于1/10的功耗跑了1/10的成绩
作者: 益达    时间: 2021-12-23 16:49
m1系列机器学习根本不太行吧,我记得TensorFlow metal,GPU跑满了速度比纯CPU慢很多,是存在bug的,tf根本识别不了他的显存大小。mbp只能跑个demo验证一下。
作者: Earnestbuby    时间: 2021-12-23 16:50
个人感觉还是cuda加速强很多,苹果的ml compute架构还是发展初期,很难完全利用起metal加速的全部效能。不过比起之前的mbp已经有很大的提升了,最关键的是显存够用,不用像服务器上2080ti那可怜的显存一样还需要抢。
作者: 艾的民    时间: 2021-12-23 16:51
还有Python3.9 arm版,性能也不是很好,跟转译也拉不开差距。真香的只有Java系,fabric我现在还不会安装到M1Mac上,自己编译问题不少
作者: 山东生活网    时间: 2021-12-23 16:51
M1就不行了呀!
作者: EdwardOdof    时间: 2021-12-23 16:52
个人认为做机器学习没有必要m1 max,不过我可能需要一些很系统的测试,一个月后出一篇完整的调研评测
(, 下载次数: 0)
作者: ohmygodplzno    时间: 2021-12-23 16:53
推断只能用CoreML而且只有FP16
(, 下载次数: 0)




欢迎光临 麦克雷 Mavom.cn (http://www.mavom.cn/) Powered by Discuz! X3.5