麦克雷 Mavom.cn

标题: 浅谈一下Nuvia Oyron [打印本页]

作者: rowenags2 时间: 昨天 17:28
标题: 浅谈一下Nuvia Oyron
前端这块。BPU基本完全照抄，按理来说1k-entry L0 BTB配3-6k-entry的L1 BTB，就会有更好的表现，哎我们高通有自己的想法，直接2048-entry的L0 BTB，一旦溢出就得奔L1i去了。为什么是L1i，coupled design小子。直接把latency拉大，增大bubble。predictor更乐，直接全部照抄，size，feature也抄。抄也不看看生态，IJP在Apple那可能不咋重要，但是在安卓，windows这块，28%的Branch Miss都源于IJP，你高通拿着砍的只有2个table的ITTAGE，过了2 Target Number就出现performance的严重下滑。RAS还行吧，手机电脑16-32entry就够，Oyron给48entry。哦对，抄了这坨Apple的BTB design，fetch size上限就是16wide，成功锁死上线，f**k good job。
next，ROB，我们都知道ROB是register搭的，big capacity是会影响area，power的，然后给650entry。给大ROB有个前提是Branch Miss要低，不然一次清空有你好受的。当然大的ROB肯定对性能有帮助，不要看Firestorm 330entry，Donan-P 400entry，人家玩的是Coalesced ROB。1条能合并7条instructions。
想到啥再写啥吧，奉劝股东们，认清现实。我自己也写了文章，放在酷安，有兴趣可以看看（不要脸的推销文章是屑）
(, 下载次数: 0)
(, 下载次数: 0)
(, 下载次数: 0)

作者: rowenags2 时间: 昨天 17:28
嗷，想到了，很重要的LSU，2ld/st+2ld+2std，这玩意并行度堪比X3，哎，你Nuvia可是挖了Apple开山的LSU RTL，就这表现证明什么，u-arch design靠的是团队，个人能力再强，团队不行照样白搭。
(, 下载次数: 0)

作者: Leonardtuck 时间: 昨天 17:28
(, 下载次数: 0)

作者: GabrielMes 时间: 昨天 17:29
所以酷安链接呢
(, 下载次数: 0)

作者: rowenags2 时间: 昨天 17:30
坏了，忘给酷安链接了https://www.coolapk.com/feed/56991470?shareKey=MGIyNDM3OGViYjUyNjY3N2YyN2Y~&shareUid=17115577&shareFrom=com.coolapk.app_5.3.5

作者: Daotetaira 时间: 昨天 17:30
睡不着完全睡不着一点
(, 下载次数: 0)

作者: jtpingouro2 时间: 昨天 17:31
其实全英文更通顺
(, 下载次数: 0)

作者: MaxwellCig 时间: 昨天 17:31
毕竟参与了苹果架构设计，照抄赶紧做完也无可厚非吧
(, 下载次数: 0)

作者: yangyurainbow 时间: 昨天 17:31
哈？单级BTB？

作者: bobbyux11 时间: 昨天 17:32
(, 下载次数: 0)

作者: o49552572 时间: 昨天 17:33
这些问题，高通自己知道吗，8g4或下一代xe会改进吗
(, 下载次数: 0) 8g4还有几个月时间发布有没有改进空间还是已经盖棺定论

作者: HeatherbinI 时间: 昨天 17:34
(, 下载次数: 0)

作者: 艾的民 时间: 昨天 17:34
我再说一次，人家本来就是m1的主架构师，抄都来了，

作者: 艾的民 时间: 昨天 17:34
小学文化13还认为所谓的“主架构师”参与了所有模块，并且离职了还能随便拿来用，当了区区2年主架构师就想拦下所有功劳，还真这么厉害怎么Oryon垃圾到用了N4P+136G带宽连4年前PPT下限都没达到
(, 下载次数: 0)

作者: tdtqnafh44 时间: 昨天 17:35
(, 下载次数: 0)

欢迎光临麦克雷 Mavom.cn (http://www.mavom.cn/)