123,123

<tbody id="kms00"></tbody>

<tbody id="kms00"></tbody>

<fieldset id="kms00"></fieldset>

<blockquote id="kms00"><cite id="kms00"></cite></blockquote>

<menu id="kms00"></menu><source id="kms00"></source>

當前位置： OFweek 人工智能網 > 正文

AMD RX 7900 XT Linux AI性能體驗

2024-04-15 13:38

一、ROCm：一個可移植、高性能的GPU計算平臺

隨著AI時代的來臨，顯卡的作用不再僅僅只局限于游戲，特別是在Stable Diffusion火爆全網之后，越來越多的玩家將顯卡當成AIGC生產力工具。

只不過，Stable Diffusion的早期版本對AMD顯卡支持不太友好，給大家造成了只有N卡才適合玩AI的錯覺。

可能很多同學不知道的是，AMD的Radeon GPU也是能夠做深度學習的，而且性能也并不差。

去年12月份，AMD推出的ROCm 6.0開發(fā)平臺進一步優(yōu)化了RX 7000系列顯卡的AI性能，特別是Stable Diffusion的出圖效率更是獲得了翻倍提升。

這里先解釋一下什么是AMD ROCm！

ROCm （Radeon Open Compute Platform ）是 AMD 基于開源項目的 GPU計算生態(tài)系統(tǒng)，類似于 NVIDIA 的 CUDA。

ROCm 支持多種編程語言、編譯器、庫和工具，以加速科學計算、自動駕駛、人工智能和機器學習等領域的應用。

ROCm還支持多種加速器廠商和架構，提供了開放的可移植性和互操作性。

目前深度學習開發(fā)一般都是使用Python，而大數據平臺往往都會部署在Linux操作系統(tǒng)之上。因此，AMD ROCm目前主要精力放在Linux系統(tǒng)上，Windows端則還有待完善。

得益于雙發(fā)射設計的流處理器單元，RX 7900 XT僅憑5376個流處理器就達到了52TFOPS的單精度浮點運算性能，而擁有10240個流處理器的RTX 4080 Super浮點性能同樣則是55TFOPS。

至于RX 7900 XTX，其單精度浮點性能則接近60TFOPS。

Stable Diffusion主要依賴GPU的單精度浮點性能以及顯存容量與帶寬，這兩方面RX 7900 XT都不遜于RTX 4080 SUPER，甚至顯存容量還更大一些。

現在有了AMD ROCm 6.0的加持，終于可以發(fā)揮出這張頂級顯卡強大的AI算力。

二、Stable Diffusion出圖速度對比：Linux系統(tǒng)下出圖效率近乎翻倍

測試平臺如下：

本次我們主要對比RX 7900 XT/XTX在Ubuntu與windows系統(tǒng)下的出圖效率，看看AMD ROCm到底能帶來多大提升。

1、RX 7900 XT對比測試

首先是Windows 11系統(tǒng)，打開Stable Diffusion之后，我們設置DPN++ 2M Karras采樣、迭代步數50、Euler a采樣、1024x768分辨率、CFG為7、總批次10，單批數量1。

在Windows系統(tǒng)下，RX 7900 XT基于DirectML加速模式生成10張圖共計耗時9分51秒，也就是591秒。

進入Ubuntu 22.04.3 LTS系統(tǒng)，設置好ROCm之后，同樣的參數與模型生成10張圖只用掉了5分05秒，即305秒。

對比之下，在Ubuntu 22.04.3 LTS系統(tǒng)下，RX 7900 XT的出圖效率相比Windows系統(tǒng)高了足足94%。

2、RX 7900 XTX對比測試

使用同樣的參數來測試RX 7900 XTX顯卡。

在Windows系統(tǒng)下，RX 7900 XTX基于DirectML加速模式生成10張圖總計耗時9分18秒，也就是558秒。

進入Ubuntu 22.04.3 LTS系統(tǒng)，設置好ROCm之后，同樣的參數與模型生成10張圖只用掉了4分45秒，即285秒。

在Ubuntu 22.04.3 LTS系統(tǒng)下，RX 7900 XTX的出圖效率相比Windows系統(tǒng)領先了96%，也就是近乎翻倍的性能提升。

三、小結：高性價比的AIGC顯卡

目前一張非公RX 7900 XT售價在5299元左右，對位的非公RTX 4080 Super售價則是8599元，N卡貴了60%。其實在游戲性能方面，這兩款顯卡并沒有太大差距。

現在AMD也意識到了AI應用對于GPU的重要性，加大了對AMD ROCm平臺的投入，經過不斷的更新，如今AMD ROCm 6.0在AI算力方面的提升早已超出了大多數玩家的認知。

在我們的測試中，RX 7900 XT在Linux系統(tǒng)下使用Stable Diffusion ROCm 6.0版時，其出圖效率幾乎是Windows系統(tǒng)的2倍。再加上55TFOPS的單精度浮點運算性能以及20GB GDDR6X超大容量顯存，對于有較高專業(yè)AIGC應用需求的專業(yè)用戶而言，在有限的預算下，RX 7900 XT可以說是非常適合的選擇。

當然，也希望AMD能夠繼續(xù)優(yōu)化ROCm在Windows系統(tǒng)下的性能表現，讓更多的AMD用戶能擁有屬于自己的高性價比AIGC顯卡。

原文標題 : ROCm加持出圖效率翻倍！AMD RX 7900 XT Linux AI性能體驗

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

4日10日
立即報名>> 維科杯· OFweek 2025中國機器人行業(yè)年度評選
4日10日
立即報名>> OFweek 2026（第十五屆）中國機器人產業(yè)大會
精彩回顧
立即查看>> 【線下會議】OFweek 2025（第十屆）物聯(lián)網產業(yè)大會
精彩回顧
立即查看>> 12月16-17日 AMD 嵌入式峰會
精彩回顧
立即查看>> 恩智浦創(chuàng)新技術峰會
精彩回顧
立即查看>> 【評選】維科杯·OFweek 2025（第十屆）物聯(lián)網行業(yè)年度評選

一周熱點月點擊榜

企業(yè)服務廣告服務獵頭服務薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級銷售經理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結構工程師廣東省/深圳市

掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容

文章糾錯

x

_*文字標題：

_*糾錯內容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網安備 44030502002758號

感谢您访问我们的网站，您可能还对以下资源感兴趣：

久久人妻av无码中文字幕

m3u8午夜福利一区二区三区久久久精产国品一产二产三产区中文字幕在线一级av片久久精品国产亚洲AV电影网