Performance de rendu GPU, Multi-GPU & CPU + GPU – Techgage



[ad_1]

Ces derniers temps, la situation en matière de jeux de Radeon était peut-être calme, mais ce n’est guère le cas avec le poste de travail. Dans ce pays, l’équipe semble vouloir non seulement s’assurer que les solutions Radeon Pros et ProRender de la société sont aussi performantes que possible, mais aussi que les gens sachent au départ qu’ils existent et savent ce qu’ils peuvent faire.

Je donne les accessoires AMD pour ses efforts ici. Je suis quelques utilisateurs de Radeon Pro sur Twitter et je reçois régulièrement des exemples remarquables de ce qui peut être fait avec ProRender. Je n’ai même pas besoin de chercher ce genre de choses – c’est là, à prendre, parce que les personnes à l’origine des technologies sont si fières de ce qui se passe.

Quand j’étais chez SIGGRAPH en août, j’avais pris le soin de demander à tous les designers avec lesquels je suis entré en contact s’ils avaient déjà utilisé ProRender. Malheureusement, le nombre de personnes qui m’ont dit ne jamais en avoir entendu parler était presque décevant. Il est clair que ProRender s’est affiné au cours de sa courte période et qu’il vaut la peine de l’utiliser, mais il s’agit d’un marché extrêmement difficile à craquer. Avec un développement constant et une nature open-source, je vois que les choses s'améliorent beaucoup avec le temps.

AMD Radeon ProRender dans 3ds Max 2019
AMD Radeon ProRender dans Autodesk 3ds Max

Cela dit, j'ai examiné en profondeur ce que ProRender pouvait faire dans 3ds Max en avril. Pas même un mois complet plus tard, la société a publié une nouvelle version du plugin qui a permis d’améliorer considérablement les performances. Peu de temps après cette, une autre version riche en fonctionnalités est sortie – celle-ci supportant le rendu hétérogène (CPU + GPU). Après avoir testé le rendu hétérogène (quel mot amusant!) Dans V-Ray du Chaos Group, je peux dire que les gains peuvent parfois être (légitimement) stupéfiants. Tant qu'un processeur costaud est le complément du GPU, au moins. Et en supposant que le rendu fait bien son travail.

Pour ce look performance, je vais tester cinq cartes Radeon Pro et quatre Quadro pour la station de travail. Pour le jeu, AMD en a deux, et NVIDIA en compte trois, la troisième étant la toute nouvelle Turing. à base de RTX 2080 Ti. L’objectif ici n’est pas d’inclure uniquement les cartes de poste de travail appropriées, mais également la meilleure carte de jeu disponible chez chaque fournisseur pour voir comment les choses se passent. Avec NVIDIA, le TITAN Xp est utilisé en plus du 1080 Ti, car il offre des optimisations de poste de travail supplémentaires que l’on ne retrouve pas ailleurs dans la pile GeForce.

Voici une vue d'ensemble de la composition graphique actuelle des deux sociétés (GPU testés en italique):

Gamme de processeurs graphiques Radeon Pro Workstation d’AMD
Les noyaux MHz de base Peak FP32 Mémoire Bande passante TDP Prix
SSG 4096 1440 12.3 TFLOPS 16 GB 8 484 Go / s 260W 6999 $
WX 9100 4096 1200 12.3 TFLOPS 16 GB 8 484 Go / s 230W 1399 $
WX 8200 3584 1200 10.8 TFLOPS 8 Go 8 512 Go / s 230W 999 $
Pro Duo 2304 x2 1243 5.7 TFLOPS 32 Go 3 448 Go / s 250W 449 $
WX 7100 2304 1188 5.73 TFLOPS 8 Go 3 224 Go / s 130W 549 $
WX 5100 1792 713 3.89 TFLOPS 8 Go 3 160 Go / s 75W 359 $
WX 4100 1024 1125 2,46 TFLOPS 4 GO 3 96 Go / s 50W 259 $
WX 3100 512 925 1,25 TFLOPS 4 GO 3 96 Go / s 50W 169 $
WX 2100 512 925 1,25 TFLOPS 2 Go 3 56 Go / s 50W 129 $
Remarques
La gamme de GPU Radeon Gaming d’AMD
Les noyaux MHz de base Peak FP32 Mémoire Bande passante TDP Prix
Vega 64 4096 1247 10.2 TFLOPS 8 Go 4 484 Go / s 295W 499 $
Vega 56 3584 1156 8.28 TFLOPS 8 Go 4 410 Go / s 210W 449 $
RX 580 2304 1257 5.79 TFLOPS 8 Go 3 256 Go / s 185W 229 $
RX 570 2048 1168 4.78 TFLOPS 8 Go 3 224 Go / s 150W 179 $
RX 560 896 1175 1.95 TFLOPS 4 GO 3 112 Go / s 80W 119 $
RX 550 640 1100 1.13 TFLOPS 2 Go 3 112 Go / s 50W 99 $
Remarques
Gamme de processeurs graphiques Quadro Workstation de NVIDIA
Les noyaux MHz de base Peak FP32 Mémoire Bande passante TDP Prix
GV100 5120 1200 14.9 TFLOPS 32 Go 8 870 Go / s 185W 8 999 $
RTX 8000 4608 1440 16.3 TFLOPS 48 Go 5 624 Go / s ??? w 10 000 $
RTX 6000 4608 1440 16.3 TFLOPS 24 Go 5 624 Go / s 295W 6 300 $
RTX 5000 3072 1350 11.2 TFLOPS 16 GB 5 870 Go / s 265W 2 300 $
TITAN V 5120 1200 14.9 TFLOPS 12 Go 4 653 Go / s 250W 2 999 $
P6000 3840 1417 11.8 TFLOPS 24 Go 6 432 Go / s 250W 4 999 $
P5000 2560 1607 8.9 TFLOPS 16 GB 6 288 Go / s 180W $ 1,999
P4000 1792 1227 5.3 TFLOPS 8 Go 3 243 Go / s 105W 799 $
P2000 1024 1370 3.0 TFLOPS 5 Go 3 140 Go / s 75W 399 $
Remarques
Gamme de GPU GeForce Gaming de NVIDIA
Les noyaux MHz de base Peak FP32 Mémoire Bande passante TDP Prix
RTX 2080 Ti 4352 1350 13.4 TFLOPS 11 Go 1 616 Go / s 250W 999 $
RTX 2080 2944 1515 10.0 TFLOPS 8 Go 1 448 Go / s 215W 699 $
RTX 2070 2304 1410 7.4 TFLOPS 8 Go 1 448 Go / s 175W 499 $
TITAN Xp 3840 1480 12.1 TFLOPS 12 Go 2 548 Go / s 250W 1 199 $
GTX 1080 Ti 3584 1480 11.3 TFLOPS 11 Go 2 484 Go / s 250W 699 $
GTX 1080 2560 1607 8.8 TFLOPS 8 Go 2 320 Go / s 180W 499 $
GTX 1070 Ti 2432 1607 8.1 TFLOPS 8 Go 3 256 Go / s 180W 449 $
GTX 1070 1920 1506 6.4 TFLOPS 8 Go 3 256 Go / s 150W 379 $
GTX 1060 1280 1700 4.3 TFLOPS 6 Go 3 192 Go / s 120W 299 $
GTX 1050 Ti 768 1392 2.1 TFLOPS 4 Go 3 112 Go / s 75W 139 $
GTX 1050 640 1455 1.8 TFLOPS 2 Go 3 112 Go / s 75W 109 $
Remarques

Et voici le PC utilisé pour les tests:

Il n’ya pas grand-chose d’autre à noter à part le fait que la dernière version du 3ds Max 2019 d’Autodesk a été utilisée, ainsi que le moteur de rendu Radeon ProRender 2.3.379 d’AMD. Voici quelques notes sur notre système d'exploitation et notre configuration de test:

  • Windows et les logiciels installés sont mis à jour (et Windows Update est ensuite suspendu).
  • Tous les tests sont effectués à l'aide d'une résolution de bureau 4K (3840 × 2160) et d'une résolution de rendu 1920 × 1080.
  • G-SYNC, FreeSync, 3D et les délais d’écran sont désactivés.
  • Fonctionnalités Windows désactivées: Cortana, Pare-feu, Defender, Recherche, Journal des événements.
  • La plupart des logiciels pré-installés de Windows Store sont désinstallés, tout comme OneDrive.
  • Le profil de puissance Ultimate Performance est utilisé.
  • Tous les services non essentiels sont désactivés dans l’onglet «Démarrage» du gestionnaire de tâches.
  • Le mode sombre de Windows est activé (vous savez maintenant qu’il existe!).
  • La configuration EFI est la valeur par défaut, car la mémoire utilise par défaut les paramètres XMP.

Passons maintenant à la raison pour laquelle cet article existe:

Test de performance Radeon ProRender

AMD Radeon ProRender - Scène de véhicule
Performances du processeur graphique AMD Radeon ProRender

Il y a beaucoup de choses à disséquer ici, alors commençons par le haut.

De toute évidence, NVIDIA a tout un atout pour ses cartes graphiques Turing RTX GeForce. La 2080 Ti domine tout le reste du graphique – même la configuration à deux GPU. Techniquement, cela ne devrait pas être le cas, et j’ai l’impression que ce ne serait pas le cas si ProRender utilisait les cartes NVIDIA un peu plus efficacement. Il se peut également que le pilote de NVIDIA ne dispose pas des optimisations ProRender; Je ne suis pas trop sûr. Quoi qu’il en soit, avec la position de NVIDIA dans ce tableau, ce n’est pas comme si nous étions retardés par rapport à la concurrence.

Même si TITAN Xp est un peu plus rapide qu’un WX 9100 sur le front FP32, deux des cartes les plus performantes d’AMD risquent de surpasser deux TITAN Xps, ProRender étant optimisé (sans surprise) sur Radeon Pro. La situation n’est cependant pas du tout «mauvaise» du côté de NVIDIA. Retour en avril, double TITAN Xps effectué pire qu’un simple TITAN Xp, il est donc évident que des progrès importants ont été accomplis pour améliorer cette situation.

En fin de compte, NVIDIA fait la loi, accaparant les cinq premières places. La Radeon RX Vega 64 occupe la sixième place et améliore légèrement la WX 8200. Le nouveau WX 8200 fonctionne presque de la même façon que le Vega 56 et, ici, il n’est pas trop loin derrière le Vega 64.

Pour des raisons de sécurité, aucune des cartes WX basées sur Polaris, ni la Quadro P2000, n’est en aucun cas «idéale» pour le travail de ProRender. 644 secondes peuvent ne pas sembler si mauvaises pour le rendu GT-R, mais vous devez savoir que nos tests ne sont pas effectués avec une qualité de niveau production. Si vous voulez vous en approcher, vous pouvez multiplier l’un quelconque de ces résultats par 25 (pour 2 500 itérations) afin de vous donner une meilleure idée de la durée de rendu réaliste. Cela prendrait environ 268 minutes avec un WX 7100, environ 136 minutes avec un Vega 64 ou environ 52 minutes avec 2080 Ti.

J'ai déjà mentionné que ProRender prend désormais en charge le rendu hétérogène. Je ne pouvais donc pas m'attaquer aux performances et prétendre qu'elles n'existaient pas. Lorsque j'ai testé la fonctionnalité pour la première fois il y a quelques mois, la performance était pire que lorsque je n'utilisais que le processeur graphique. Avance rapide jusqu'à aujourd'hui et la situation semble s'être améliorée – au moins un peu.

AMD Radeon ProRender - Performances de rendu hétérogènes

Avec le processeur introduit dans le processus de rendu, certains emplacements changent un peu. La 2080 Ti passe de la première à la deuxième place, dépassée par la double TITAN Xps. La Quadro P6000 a également réussi à surperformer le TITAN Xp – une autre inversion par rapport au graphique d'origine.

Compte tenu de l’évolution de la mise à l’échelle après l’ajout de la CPU, il est difficile de comprendre Pourquoi ça se passe. Le TITAN Xps dual est-il devenu plus efficace avec un rendu hétérogène? Pourquoi un GPU comme le 2080 Ti a-t-il vu une performance considérablement réduite dans le rendu GT-R?

Voici une comparaison directe entre GPU et CPU + GPU:

AMD Radeon ProRender - Rendu hétérogène vs performances de rendu GPU

Certains défauts de test peuvent être constatés, tels que la manière dont la 2080 Ti a réussi à obtenir de meilleures performances une fois le rendu hétérogène activé. Pendant ce temps, les performances du TITAN Xp ont à peine changé, mais les performances du TITAN Xp x2 se sont améliorées de manière assez significative.

Dans l’ensemble, ProRender ne semble pas aimer les GPU NVIDIA, mais ce n’est pas nécessairement une faute du rendu. Il se peut que NVIDIA puisse elle-même optimiser les performances du pilote. Je ne suis pas sûr que la société se préoccupe même des performances de ProRender à l’heure actuelle. Ce n’est pas que la société ait beaucoup à faire, puisque ses GPU dominent l’ensemble de ces charts.

En regardant le graphique de bas en haut, il devient clair que plus le GPU est costaud, plus l’ajout d’un processeur est petit. Ce n’est pas le cas de tous les moteurs de rendu, et les performances modifiées dépendront bien sûr du choix du processeur. Nos 18 cœurs pourraient afficher des gains dans des domaines où les 8700K ne le seraient pas.

De manière pratique, j'ai décidé de tester le 8700K avec un RTX 2070, car ce PC était proche.

Lors de ce test, le RTX 2070 a réussi à rendre le projet en 2m 52s, alors que le rendu hétérogène prenait 3m 25s, soit environ 19% de plus. Il est clair que ce type de rendu n’est pas optimisé pour NVIDIA, mais bien pour AMD. Encore une fois, je ne sais pas pourquoi c’est si pauvre pour NVIDIA, mais cela va probablement s’améliorer à l’avenir.

Je déteste apporter un autre rendu dans cette discussion, mais pour souligner les différences d’échelle de performance, je dois le faire. Voici les résultats du test de la même fonctionnalité avec V-Ray plus tôt cette année (avec la version bêta, rien de moins):

Mise à l'échelle du rendu hétérogène V-Ray 4 du Chaos Group

Dans le même système, le WX 3100 était 219% plus rapide avec le rendu CPU + GPU qu’avec le rendu GPU. En V-Ray, le P2000 s'est avéré 448% plus rapide avec uniquement CPU + GPU sur GPU. Serait-ce la différence entre un moteur de rendu développé dès le départ avec prise en charge du processeur et un moteur construit dès le départ avec un seul support GPU? Probablement, mais cela ne doit pas discréditer les efforts d’AMD. J’ai déjà constaté une amélioration majeure au cours des six derniers mois et rien ne laisse penser que les choses ne vont pas continuer à s’améliorer.

Dernières pensées

Lorsque j’ai réfléchi au moyen de tester ProRender dans une suite de tests mise à jour, j’ai pensé que j’aimerais donner un peu d’amour à Maya d’Autodesk, car j’utilise 3ds Max dans de nombreux autres endroits. Je ne connais pas Max, mais je le suis encore moins avec Maya et, malheureusement, maux de tête après maux de tête m'ont empêché de faire des tests avec cela.

Pour une raison quelconque, ProRender dans Maya n'enregistre pas la plupart des paramètres de rendu, ce qui signifie que je ne peux pas très bien automatiser l'analyse comparative à moins de vouloir utiliser les paramètres (très médiocres) par défaut. Je ne parviens pas non plus à effectuer le rendu à partir de la ligne de commande et à ce que le temps de rendu soit imprimé sur l'image générée. Lorsque Maya met plusieurs secondes à se charger, vous ne pouvez pas enregistrer le temps que prend tout le processus.

Néanmoins, ProRender n’est pas identique dans toutes les suites de conception, mais il est bien connu de l’une à l’autre. 3ds Max n'a aucun problème à enregistrer les paramètres ProRender dans le fichier de projet lui-même. Dans Maya, vous devez exporter manuellement les paramètres pour pouvoir les réimporter ultérieurement. C'est maladroit.

AMD Radeon Pro WX 8200
Radeon Pro WX 8200 d’AMD

Je n’ai pas décidé de parler un peu plus de cette histoire parce que j’y ai passé plus de douze heures, mais parce que je suis enthousiasmé par tous les éloges que je tire de ProRender depuis sa sortie, il devrait être clair qu’il reste encore quelques niggles. Avec un rendu hétérogène, les cartes NVIDIA ne présentent pas beaucoup d’avantages (bien que ce soit l’inverse pour V-Ray, ou même pour les cartes Radeon), et puis il ya des problèmes étranges tels que la non-sauvegarde de vos paramètres.

L’objet de cet article a été entièrement tourné vers la performance, et comme il s’agissait d’un look performance, Probablement bien. Cependant, ProRender ne se limite pas à ses performances. C’est pourquoi il est gratuit, ouvert et basé physiquement. Ce moteur de rendu OpenCL ne s’applique pas uniquement à Windows, mais également à Mac OS et Linux. Les suites actuellement prises en charge incluent 3ds Max, Maya, SolidWorks et même Blender. Avec Blender et ProRender, vous disposez d’une solution PBR 100% gratuite et à source ouverte. C’est génial.

Comme je l’ai dit à quelques reprises, ProRender continue de s’améliorer avec le temps. Ceci est le troisième regard dédié Techgage a eu de ProRender cette année, et avec l'amélioration constante apportée, il semble probable qu'un autre regard sur la performance est seulement quelques mois.

[ad_2]
Source link