Am nevoie de un GPU pentru difuzie stabilă?
Contents
Vom ajunge la alte numere teoretice de performanță de calcul într -o clipă, dar din nou considerăm RTX 2080 TI și RTX 3070 TI ca exemplu. Nucleele de tensiune 2080 TI nu acceptă sparsitatea și au până la 108 TFLOPS de calcul FP16. . Faptul că 2080 TI bate 3070 Ti indică clar sparsitatea nu este un factor. Aceeași logică se aplică și altor comparații precum 2060 și 3050, sau 2070 Super și 3060 TI.
Am nevoie de un GPU pentru difuzie stabilă?
Vă întrebați dacă aveți nevoie de un GPU pentru o difuzie stabilă? Ai ajuns la locul potrivit.
Difuzia stabilă este, fără îndoială, un instrument rapid și intuitiv de generare a artei AI precum Dall-E și Midjourney. Rezultatele sale sunt impresionante, deci are milioane de utilizatori în acest moment. . .
. .
Deal exclusiv 10.000 credite bonus gratuite
Conținut AI la marcă oriunde creați. . Un instrument AI, toate cele mai bune modele.
Experimentați întreaga putere a unui generator de conținut AI care oferă rezultate premium în câteva secunde. . Înscrieți -vă la un proces gratuit.
Doar 0 $.00015 pe cuvânt!
Detector AI Winston
Winston AI: Cel mai de încredere detector AI. Winston AI este instrumentul de detectare a conținutului AI pentru industrie pentru a ajuta la verificarea conținutului AI generat cu ChatGPT, GPT-4, Bard, Bing Chat, Claude și multe alte LLMS. Citeşte mai mult
Doar 0 $.01 la 100 de cuvinte
Originalitate AI Detector
Originalitate..Pe parcursul unui set de date de testare de 1200 de eșantioane de date, a obținut o precizie de 96%, în timp ce cel mai apropiat concurent a obținut doar 35%. . Detectează prin e -mailuri, documente Google și site -uri web.
. PC-ul Ghidului este suportat de cititor. . Află mai multe
? Sau se poate înlocui pe celălalt? .
?
. Pentru un minimum, uitați-vă la modelele NVIDIA de 8-10 GB. Mai mult, asigurați -vă că aveți 16 GB RAM pentru PC în sistemul PC pentru a evita orice instabilitate.
GPU va rula difuzie stabilă fără a se confrunta cu probleme precum o viteză de răspuns mai lentă. . În ceea ce privește utilizarea GPU, vă sugerăm modelele NVIDIA RTX 4080 și 4090 cu 16 sau 24 GB VRAM pentru cele mai bune rezultate. .
?
Da, puteți rula difuzie stabilă pe GPU -uri AMD, în afară de modelele din seria Nvidia. . .
Întrebări frecvente
?
. . Orice model înainte nu este pentru cele mai bune rezultate. .
. . . Deși există câteva modalități de a -l rula fără GPU, nu sunt atât de fiabile pe cât ar părea. .
. . .
Difuzie stabilă Benchmarked: care GPU rulează AI cel mai rapid (actualizat)
Inteligența artificială și învățarea profundă sunt în permanență în titluri în aceste zile, fie că este vorba de chatgpt care generează sfaturi slabe, mașini cu autovehicule, artiști acuzați că au folosit AI, sfaturi medicale de la AI și multe altele. Majoritatea acestor instrumente se bazează pe servere complexe cu o mulțime de hardware pentru antrenament, dar utilizarea rețelei instruite prin inferență se poate face pe computerul dvs., folosind placa sa grafică. ?
Am redactat difuzia stabilă, un popular creator de imagini AI, pe cele mai recente GPU -uri NVIDIA, AMD și chiar Intel pentru a vedea cum se stivuiesc. ! . . .
. . .. . Obținerea GPU -urilor ARC a Intel a fost ceva mai dificilă, din cauza lipsei de sprijin, dar difuzia stabilă OpenVino ne -a oferit unele .
. . . Rezultatele RTX 40 din seria 40 au fost mai mici inițial, dar George SV8ARJ a oferit această soluție, în cazul în care înlocuirea Pytorch Cuda DLLS a dat un impuls sănătos performanței.
. .. .
. Da din cap….1 pe 1111 automat). .
. , mult . . . Iată setările pertinente:
100
Clasificator Ghid gratuit:
.
Algoritmul de eșantionare:
Unele variante Euler (ancestral pe 1111 automat, rechin euler discret pe AMD)
. .
. .
. . .
. . . . Să vorbim un pic mai mult despre discrepanțe.
Optimizări adecvate ar putea dubla performanța pe cardurile RX 6000 din seria. .AI spune că ar fi trebuit să ajusteze modele pentru ADNA 2 în zilele următoare, moment în care poziția generală ar trebui să înceapă să se coreleze mai bine cu performanța teoretică. .AI, am făcut, de asemenea, unele teste a unor GPU -uri Nvidia folosind acel proiect, iar cu modelele Vulkan, cardurile Nvidia au fost substanțial mai lente decât cu construcția automată 1111 (15…..
. .De 7 ori performanța, chiar dacă reducem penuria. În practică, 4090 în acest moment este cu aproximativ 50% mai rapid decât XTX cu versiunile pe care le -am folosit (și care scade la doar 13% dacă omitem rezultatul XFORMERS cu precizie mai mică). .
GPU -urile ARC ale Intel oferă în prezent rezultate foarte dezamăgitoare, mai ales că acceptă operațiuni FP16 XMX (Matrix) care ar trebui să livreze până la 4x debitul ca calcule FP32 obișnuite. Bănuim că proiectul actual de difuzie stabilă OpenVino pe care l -am folosit lasă, de asemenea, mult loc pentru îmbunătățiri. ..
. S-a subperformele din seria RX 6000, iar GPU-urile arc arată în general slab. .
De asemenea, am efectuat câteva teste pe GPU-urile vechi, în special Arhitectura Turing Nvidia (RTX 20- și GTX 16 Seria) și RX 5000 de la AMD RX 5000. . .
. . Mai important, aceste numere sugerează că optimizările „sparsity” ale Nvidia în arhitectura ampere nu sunt deloc utilizate – sau poate că nu sunt pur și simplu aplicabile.
. Nucleele de tensiune 2080 TI nu acceptă sparsitatea și au până la 108 TFLOPS de calcul FP16. . . Aceeași logică se aplică și altor comparații precum 2060 și 3050, sau 2070 Super și 3060 TI.
. . Pe hârtie, cardul XT ar trebui să fie cu 22% mai rapid. Cu toate acestea, în testarea noastră, este cu 37% mai rapid. Oricum ar fi, niciunul dintre cei mai vechi GPU -uri NAVI 10 nu este deosebit de performant în repetările noastre inițiale de difuzie stabilă.
. Dacă folosim Shader Performance cu FP16 (Turing are dublul randamentului pe codul shader FP16), decalajul se restrânge la doar un deficit de 22%. .
. De asemenea, nu este clar dacă aceste proiecte folosesc pe deplin lucruri precum nucleele tensiunii Nvidia sau miezurile XMX ale Intel. Ca atare, ne -am gândit că ar fi interesant să ne uităm la performanța teoretică maximă (TFLOPS) de la diferitele GPU -uri. . .
Aceste nuclee de tensiune de pe Nvidia împachetează clar un pumn (barele gri/negre sunt fără sparsitate) și, evident, testarea noastră de difuzie stabilă nu se potrivește exact cu aceste cifre – nici măcar nu sunt aproape. De exemplu, pe hârtie RTX 4090 (folosind FP16) este cu până la 106% mai rapid decât RTX 3090 Ti, în timp ce în testele noastre a fost cu 43% mai rapid fără XFORMERS și cu 50% mai rapid cu XFormers. .
Între timp, uită -te la GPU -urile ARC. . În practică, GPU -urile ARC nu sunt nicăieri în apropierea acestor mărci. . .
Raporturile interne de pe arc arată corect. . .
. Va trebui să vedem dacă modelele din seria 6000 reglată închide golurile, în timp ce din cap.. .
Iată o privire diferită asupra performanței teoretice FP16, de data aceasta concentrându -se doar pe ceea ce pot face diferitele GPU -uri prin intermediul calculelor shader. Arhitecturile AMPERE și ADA NVIDIA rulează FP16 cu aceeași viteză ca FP32, deoarece presupunerea este FP16 poate fi codificată pentru a utiliza nucleele de tensiune. .
În mod clar, această a doua privire la calculul FP16 nu se potrivește cu performanța noastră reală mai bună decât graficul cu nucleele Tensor și Matrix, dar poate există o complexitate suplimentară în configurarea calculelor matricei și, astfel, performanța completă necesită. ceva în plus. Ceea ce ne aduce într -o ultimă diagramă.
Acest grafic final arată rezultatele testării noastre cu rezoluție mai mare. . .
. . .
.
În cele din urmă, aceasta este în cel mai bun caz o imagine în timp de performanță de difuzie stabilă. . .
Stai la capăt
. Vom trimite știri de ultimă oră și recenzii aprofundate despre CPU, GPU, AI, hardware-ul producătorului și mai mult direct la căsuța de e-mail.
Prin trimiterea informațiilor dvs. sunteți de acord cu termenii și condițiile și politica de confidențialitate și aveți vârsta de 16 ani sau peste.
Jarred Walton este un redactor senior la Tom’s Hardware concentrându -se pe tot ceea ce GPU. Lucrează ca jurnalist tehnologic din 2004, scriind pentru AnandTech, PC Maximum și PC Gamer. De la primul S3 Virge „3D Deceleratoare” la GPU -urile de astăzi, Jarred ține pasul cu toate cele mai recente tendințe grafice și este cea care să întrebe despre performanța jocului.