creativitate AI și modelele de difuzie au devenit subiecte de interes major în domeniul inteligenței artificiale, în urma unui studiu recent realizat de cercetători de la Stanford și École Normale Supérieure. Studiul arată că „creativitatea” observată la generarea grafică nu este un fenomen misterios, ci provine din caracteristici tehnice ale arhitecturii rețelelor neuronale.

Impactul mecanismelor locale în modelele de difuzie
Cercetătorii Mason Kamb și Surya Ganguli au demonstrat că două trăsături – localitatea și echivarianța translațională – generează soluții originale în procesul de denoising. Aceste defecte aparent tehnice forțează rețeaua să reconstruiască imagini în moduri neprevăzute, creând astfel creativitate AI.

Analogie cu biologia dezvoltării
Inspirându-se din modelele de morfogeneză propuse de Alan Turing, echipa a comparat interacțiunea locală a pixelilor cu cea a celulelor în embryologie. În ambele cazuri, deciziile locale produc structuri complexe și, uneori, erori cum ar fi degetele în plus, evidențiind o paralelă între creativitatea artificială și cea biologică.

Predicția prin echivalent local score machine
Cercetătorii au formulat un set de ecuații denumit „equivariant local score machine”, capabil să prezică rezultatele cu aproximativ 90 % acuratețe. Modelul oferă un instrument matematic pentru a controla nivelul de originalitate în modelele de difuzie, consolidând legătura între inteligența artificială și teorii emergente de creativitate AI.

Implicarea pentru viitorul inteligenței artificiale
Descoperirea explică de ce modelele de difuzie, deși instruite pentru reproducere, pot depăși materialul de antrenament. Ea deschide noi căi pentru:

– ajustarea parametrilor de denoising pentru a regla gradul de inovație,
– dezvoltarea de instrumente de evaluare a originalității în generarea grafică,
– investigarea analogiilor cu sistemele neurocognitive umane.

Provocări deschise pentru modelele lingvistice
Deși studiul se concentrează pe generarea de imagini, cercetătorii recunosc că modelele lingvistice mari nu se bazează pe aceleași principii de localitate și echivarianță. Totuși, rezultatele sugerează că imperfecțiunile interne pot juca un rol similar în generarea de texte originale, indicând necesitatea unor investigații suplimentare.

În lumina acestor descoperiri, creativitatea AI apare ca un produs inevitabil al arhitecturii de denoising și al constrângerilor locale din modelele de difuzie. Monitorizarea continuă a evoluțiilor din inteligența artificială rămâne esențială pentru a înțelege impactul acestor mecanisme asupra generării de conținut și a paradigmelor de creativitate.