当初 RTX 5090D 出来后大家都发现它的游戏性能丝毫不亚于 RTX 5090,原因就是对于很多游戏来说,在极高画质设置下,性能基本卡在渲染着色单元、内存带宽上,Tensor Core 削减的性能此时很难体现。
即使是在生成式 AI 应用例如 ComfyUI、生成式聊天对话中,性能瓶颈也往往卡在内存带宽上,我应该最先提出这个问题的。
不过经过我的大量测试,也发现了一些可能会卡在 Tensor Core 性能的应用场景,例如 ComfyUI 里跑 Flux.1 Dev NF…。
上一篇 : count(*) count(1)哪个更快?
下一篇 : 为什么bilibili后端要用go来写?
你手机中最舍不得卸载的APP是什么?...
为什么现在知乎有一种j***a运行速度很慢,很吃***的论调?...
如果 Rust 在 90 年代就被发明出来,那么会对软件行业造成怎样的影响?...
jwt的设计合理吗?...