据Linux补丁追踪平台Coelacanth-Dream爆料,AMD正通过指令级深度优化,特别是Dual Issue VALU与FMA指令的协同,有望在特定工作负载中实现GPU性能翻倍。
Dual Issue VALU并非全新概念,RDNA 3与RDNA 4已具备双ALU通道设计,理论上每时钟周期可执行两条指令。
但此前的架构在编译器层面难以有效对代码进行分组,导致硬件潜力无法完全释放。
而RDNA 5通过引入关键的FMA,允许编译器更轻松地将复杂的算术操作配对并发送至计算单元,使得双通道并行效率达到理想状态,从而令FP32计算能力在理论上实现翻倍。
这对游戏玩家与AI应用均有影响,在标准光栅化游戏中,更高效的指令调度将转化为更高且更稳定的帧率。
在神经网络与AI工作负载领域,FMA指令的优化同样至关重要,可增强AMD下一代AI驱动的超分辨率技术(如FSR Diamond)和插帧功能。
文章来源:快科技
据Linux补丁追踪平台Coelacanth-Dream爆料,AMD正通过指令级深度优化,特别是Dual Issue VALU与FMA指令的协同,有望在特定工作负载中实现GPU性能翻倍。
Dual Issue VALU并非全新概念,RDNA 3与RDNA 4已具备双ALU通道设计,理论上每时钟周期可执行两条指令。
但此前的架构在编译器层面难以有效对代码进行分组,导致硬件潜力无法完全释放。
而RDNA 5通过引入关键的FMA,允许编译器更轻松地将复杂的算术操作配对并发送至计算单元,使得双通道并行效率达到理想状态,从而令FP32计算能力在理论上实现翻倍。
这对游戏玩家与AI应用均有影响,在标准光栅化游戏中,更高效的指令调度将转化为更高且更稳定的帧率。
在神经网络与AI工作负载领域,FMA指令的优化同样至关重要,可增强AMD下一代AI驱动的超分辨率技术(如FSR Diamond)和插帧功能。
史上速度最快SSD!美光量产全球首款PCIe Gen6固态硬盘9650:读取速度达28GB/s
2026-02-14
微星卡皇RTX 5090 Lightning Z被卖到超66000元!比MSRP建议售价高了四五倍
2026-02-13
进度超预期 日本自研2nm工艺明年量产:29年直奔1.4nm
2026-02-13