Видеокарты Radeon Pro на Эльбрусе

Материал из ALT Linux Wiki

Представлена статья с анализом состояния доступности видеокарт семейства Radeon Pro и их поддержки на системах с процессором "Эльбрус" с прицелом на многоместные системы; написана в конце осени 2021 года одним вдумчивым человеком и публикуется с его разрешения с минимальными викификацией и изъятиями.

Ситуация с AMD-шными видеокартами

Radeon R5 230 есть только no-name от новоявленных китайских марок Afox и Ninja (Sinotex) — вроде ничем не хуже прежних моделей от Asus, Gigabyte, Sapphire. Однако, как мы уже убеждались, сама по себе эта модель GPU (R5 230) ведёт себя странно в сценарии с несколькими видеокартами.

Radeon R7 240 остались только в модификациях с претензией на геймерство, при этом цены порой доходят до уровня современных геймерских видеокарт — от 6–7 до 14 тыс. руб. При этом их в магазинах можно найти лишь штучно. [1]

Radeon R7 250 и R7 350, внезапно появившиеся под тем же марками типа Ninja, на поверку могут оказаться вовсе не R7 250, а R5 240, к примеру, судя по их PCI DEV_ID. Насчёт того, что у них реально с количеством ядер и частотой — не знаю, не бенчил, но очень смущает тот факт, что драйверы для Windows их не признают — ни старые (Catalyst ≈ radeon, если это на самом деле R5 240), ни новые (Adrenalin ≈ amdgpu, если это действительно настоящие R7 250), и что вместо референсных разъёмов HDMI + DVI-I напаяны HDMI + VGA.

Radeon RX 550 … 590 — минимум двухслотовые, всегда высокие (не знаю, в какой параллельной вселенной [коллега] видел низкопрофильные 550[2]), встречаются всё реже и стоят всё дороже. Старшие модели требуют подвода доп. питания.

Radeon RX Vega 56 … 64, Radeon VII — никогда не видел в продаже, только слышал про Вегу, что [он же] её как-то успел купить и успешно протестировать.

Radeon RX 5300 … 5700, RX 6600 … 6900 — требуют ядра 5.9 (5.11?) и выше[3], расходятся как горячие пирожки, несмотря на высокую стоимость, — а стоимость такая высокая, потому что даже самая младшая модель RX 5300 — это довольно мощная штука, покруче GeForce GTX 1650 будет, и соответственно обязательно нуждается в подводе дополнительного питания (что для нас — шоу-стоппер).

Сводка по наличию в магазинах на конец августа 2021 года

приводится как иллюстративный материал

   Модель  Поколение    Nix Reg Xcm DNS OLT Ctl
   R5 220    TS2                 1       1
   R5 230    TS2         2               4
   R7 240    GCN1        1       1       1   1
   R7 250*   GCN1        1       1       1
   R7 350*   GCN1        1       1       1
   --------[ граница поддерживаемых моделей в Linux 4.9 ]--------
   RX 550    GCN4                1   3
   RX 560    GCN4                        1
   RX 570    GCN4                        1
   RX 580    GCN4                        2
   RX 640m   GCN4                        1
   WX 3100   GCN4                        1
   WX 3200   GCN4        1               3   2
   WX 5100   GCN4                1       1
   WX 5500   GCN4                        1
   --------[ граница поддерживаемых моделей в Linux 5.4 ]--------
   RX 5700   RDNA1                       1
   RX 6600   RDNA2                       7   9
   RX 6700   RDNA2           1   3   4   6   5
   RX 6900   RDNA2           7   1   6  10   7
   Модель  Поколение    Nix Reg Xcm DNS OLT Ctl
   * Про модели-оборотни «R7 250» и «R7 350» см. выше.
   Ху из ху: en.wikipedia.org/wiki/List_of_AMD_graphics_processing_units

И это полный список всех продаваемых моделей — не выборочный. То есть других моделей, кроме этих, даже в фильтрах магазинов не предусмотрено.

Овраги

Чтобы было чем набивать «Горынычей», я решил посмотреть в сторону Radeon Pro — это те же в сущности Radeon (например, младшие WX 2100 … 3200 — как RX 550/X), только умещающиеся в формате 1S·LP и не требующие подвода доп. питания. У них встроенный лимит потребления от материнки на уровне 25 … 35 Вт, поэтому они не сильно греются и не шумят. В то же время это и ограничивающий фактор, так как запитать от мат. платы 6–7 таких видеокарт (150–245 Вт) вряд ли получится, ведь сам разъём ATX-24 в теории рассчитан на 288 Вт, но в реале можно рассчитывать скорее на 180 Вт, судя по аксессуарам для майнеров, а из этого бюджета питается ещё и центральный процессор частично, и КПИ, и, что немаловажно, оперативная память (например, замена 4×8GB на 4×16GB DDR3 дала прибавку 20 Вт, то есть полные 64 Гбайт на сокет требуют 40 Вт питания).

1. AMD  Radeon Pro WX 2100 2GB (100-506001)
2. Dell Radeon Pro WX 2100 2GB (490-BDZR)
-------------------------------------------
3. HP   Radeon Pro WX 3100 4GB (2TF08AA)
-------------------------------------------
4. AMD  Radeon Pro WX 3200 4GB (100-506115)
5. Dell Radeon Pro WX 3200 4GB (490-BFQR)
6. HP   Radeon Pro WX 3200 4GB (6YT68AA)

Изначально мы себе приобрели вариант 1 на пробу, сейчас из [компании-партнёра] привезли ещё по паре моделей 2 и 6. На основании изученных образцов (увы, официальной информации на этот счёт нет, и фотографий тоже) получается:

  • AMD даёт обе планки (LP и FH) и преобразователь miniDP/DVI-D;
  • Dell даёт лишь установленную планку (нужна другая — берите другой артикул;
    конкретно 490-BDZR — это FH) и два одинаковых переходника miniDP/DP;
  • HP даёт обе планки (LP и FH) и два одинаковых переходника miniDP/DP.

При этом WX 2100 и WX 3100 имеют три выхода: 2×miniDP + 1×DP, а WX 3200 — четыре, все miniDP, поэтому обойтись без переходников (точнее, это маленькие кабели-переходники) можно и нужно, сразу применяя кабели-переходники miniDP/DP от видеокарты к монитору, потому что опыт с применением длинных кабелей для «Горыныча» лишний раз продемонстрировал, что чем меньше переходников и разъёмов, тем меньше потерь и тем больше вероятность успешной работы.

Проведённое тестирование двухместной рабочей станции на базе материнской платы MBE8C-PC ТВГИ.469555.318-01 вер. 1 под управлением Альт Рабочая станция 9.2 показало, что под нагрузкой типа glmark2 (обычно самый прожорливый из бенчей) каждая карта WX 2100 способна добавить по 50 Вт, а WX 3100 — 56–72 Вт, если считать потребление от розетки, в которое включается также ещё и потребление центрального процессора (glmark2 процессорозависим, хоть и далеко не на 100 % — обычно ест 25 % в сумме от всех ядер , переходя на 100%-ное поглощение одного ядра в некоторых сценах), и накладные расходы блока питания.

Истинный же пик чистого потребления самой видеокарты от материнской платы, получается, всё-таки равен заложенному в аппаратуру пределу 25 и 35 Вт — выше этого (в пределах погрешности) карта сама будет оттормаживаться: максимум, что я наблюдал через sensors — это 25,01 и 35,12 Вт или типа того.

Если же заботиться об энергоэкономичности на холостом ходу, то тут мощные карты ничем не хуже, а то и лучше маломощных: 6,5 и 8,5 Вт против 8 у R5 230 и R7 240 (под нагрузкой у оных — 10–20 Вт) с учётом потребления от розетки или 2–4 Вт в чистом виде.

Результаты тестирования

К сожалению, никаких других графических тестов, кроме glmark2, в Альте 9.2 я не нашёл. Был ещё bfgminer, правда, но он падал (SIGSEGV), а по прошлому опыту мне показалось, что энергопотребление он провоцирует не самое большое, как и vkmark, и clpeak. Поэтому чисто соревновательные бенчмарки я проводил уже на ОС Эльбрус 6.2 в одноместном режиме:

┌──────────┬───────────┬─────────┬─────────┬─────────┬───────┐
│ Тест     │  Вариант  │ Единицы │ WX 2100 │ WX 3200 │ Крат. │
├──────────┼───────────┼─────────┼─────────┼─────────┼───────┤
│ номинал  │  single   │ GFLOPS  │ 1250    │ 1660    │ 133 % │
│          │  double   │ GFLOPS  │   78    │  104    │ 133 % │
├──────────┼───────────┼─────────┼─────────┼─────────┼───────┤
│ CLpeak   │  single   │ GFLOPS  │ 1204.39 │ 1600.82 │ 133 % │
│          │  double   │ GFLOPS  │   77.66 │  103.15 │ 133 % │
│          │  integer  │ GIOPS   │  245.33 │  329.12 │ 134 % │
├──────────┼───────────┼─────────┼─────────┼─────────┼───────┤
│ BFGminer │  SHA256   │ Mhash/s │  338.2  │  456.8  │ 135 % │
│          │  Scrypt   │ khash/s │   47.1  │   50.7  │ 107 % │
├──────────┼───────────┼─────────┼─────────┼─────────┼───────┤
│ GLmark2  │  800×600  │   FPS   │   3306  │   3494  │ 106 % │
│          │ 1920×1080 │   FPS   │   2455  │   3340  │ 136 % │
├──────────┼───────────┼─────────┼─────────┼─────────┼───────┤
│ VkMark   │  800×600  │   FPS   │   5088  │   6576  │ 129 % │
│          │ 1920×1080 │   FPS   │   2423  │   3993  │ 162 % │
├──────────┼───────────┼─────────┼─────────┼─────────┼───────┤
│ мощность │ GPU only  │    Вт   │     25  │     35  │ 140 % │
│          │ GPU+CPU+… │    Вт   │  50–54  │  68–72  │ 135 % │
└──────────┴───────────┴─────────┴─────────┴─────────┴───────┘

Примечания

  1. конец 2022 года: как минимум в DNS образовались R7 240 в свои четыре тыщи
  2. возможно, в китайпосылторге
  3. RX 6500 XT на 5.10 не работает, на 5.15 -- работает