Conform Playtech.ro:

Modelele de inteligență artificială (AI) deschise, disponibile pentru descărcare și modificare, sunt vulnerabile în fața unor instrumente care pot elimina rapid mecanismele de siguranță implementate pentru a preveni răspunsuri periculoase. Potrivit publicației Financial Times, cercetătorii au descoperit că softuri precum Heretic permit eliminarea restricțiilor, permițând modelelor să genereze instrucțiuni pentru atacuri chimice, malware sau alte conținuturi ilegale.

Eliminarea barierelor de siguranță: Un proces simplificat

Unul dintre instrumentele cheie menționate în investigația Financial Times este Heretic, un software care poate „decenzura” modelele AI. Acesta identifică și elimină mecanismele de siguranță, permițând accesul la informații sau acțiuni care ar trebui refuzate. Dezvoltatorul Heretic, Philipp Emanuel Weidmann, a declarat că instrumentul său a fost folosit pentru a crea peste 3.500 de modele „decenzurate” de la lansare, cu milioane de descărcări.

Simplificarea procesului de eliminare a restricțiilor reprezintă o problemă majoră. Dacă în trecut modificarea unui model AI cerea cunoștințe tehnice avansate, acum instrumente automate facilitează acest proces. Această ușurință de utilizare reduce considerabil bariera de intrare, sporind accesul la modele AI modificate și, implicit, la potențialele riscuri.

Modelele deschise vs. Modelele proprietare: O distincție critică

Diferența majoră în ceea ce privește siguranța modelelor AI este între cele proprietare, controlate de companii precum OpenAI sau Anthropic, și cele deschise, care pot fi modificate și rulate local. În cazul serviciilor comerciale, companiile pot actualiza și monitoriza constant filtrele de siguranță. Modelele deschise, o dată descărcate, oferă mai puține posibilități de control.

Modelele deschise au avantaje importante pentru dezvoltare, cercetare și inovație. Universitățile, start-up-urile și cercetătorii independenți pot experimenta cu tehnologii avansate. Google a recunoscut că modificarea modelelor deschise reprezintă o provocare tehnică. Meta nu a comentat public situația.

Implicații și Măsuri

Creșterea accesului la instrumente care elimină restricțiile modelelor AI ridică semne serioase de întrebare cu privire la utilizarea tehnologiei. Numărul mare de modele „decenzurate” descărcate sugerează amploarea potențialelor utilizări dăunătoare. Companiile de tehnologie și autoritățile de reglementare se confruntă cu provocarea de a echilibra beneficiile modelelor AI deschise cu necesitatea de a preveni abuzurile și riscurile asociate.

Sursa: Playtech.ro