Gemini 2.5 Pro Computer Use, modelul recent lansat de DeepMind, permite AI‑ului să navigheze pe internet ca un utilizator uman. Dintr-o simplă instrucțiune scrisă, Gemini 2.5 poate deschide pagini, apăsa butoane, completa formulare și finaliza achiziții online. Acest pas marchează prima versiune de AI capabilă să execute acţiuni în browser în mod autonom.

Acţiune autonomă în browser
Gemini 2.5 Pro Computer Use adaugă la capacităţile de generare text abilitatea de a interacţiona direct cu elementele vizuale ale unei pagini. Modelul recunoaşte butoane, câmpuri de text şi linkuri, apoi efectuează clicuri şi introducere de date fără intervenţia utilizatorului. Astfel, AI‑ul poate îndeplini sarcini repetitive în timp real.

Integrarea cu Chrome și Google Search
Prin integrarea nativă cu Chrome, Gemini 2.5 Pro Computer Use accesează rapid conţinutul paginilor şi poate răspunde în funcţie de contextul găsit. Integrarea cu Google Search permite modelului să lanseze căutări, să selecteze rezultatele relevante şi să navigheze spre site‑uri de e‑commerce. Această legătură reduce latenţa şi creşte precizia execuţiilor.

Colaborarea strategică cu Browserbase
Google a realizat parteneriatul cu Browserbase pentru a oferi un mediu „headless” în care Gemini 2.5 Pro Computer Use poate acţiona. Browserbase furnizează un browser virtual monitorizat în timp real, astfel încât fiecare mişcare a AI‑ului poate fi urmărită şi controlată de dezvoltatori. Colaborarea asigură transparenţă şi siguranţă în execuţia sarcinilor.

Capabilităţi principale ale Gemini 2.5 Pro Computer Use
– Achiziţii online de produse, bilete sau servicii;
– Completarea automată a formularelor administrative;
– Compararea preţurilor pe multiple platforme;
– Extracţia şi analiza datelor în timp real pentru cercetări complexe.

Implicarea în fluxuri de lucru digitale
Gemini 2.5 Pro Computer Use este testat în cadrul programelor pilot cu companii care doresc să automatizeze procesele digitale. Modelul poate gestiona campanii de marketing, monitoriza oferte şi trimite e‑mailuri personalizate, eliminând necesitatea intervenţiei manuale pe platforme web. Implementarea se face prin API‑uri care se conectează la sistemele interne ale clienţilor.

Securitate, autonomie şi etică
Google afirmă că Gemini 2.5 Pro Computer Use include mecanisme de limitare a acţiunilor riscante și că toate interacţiunile sunt înregistrate. Experţii din domeniu subliniază totuşi necesitatea unei supravegheri stricte, având în vedere potenţialul de manipulare a datelor personale sau de executare neautorizată a comenzii pe site‑uri. Rămâne esenţială dezvoltarea de politici clare pentru utilizarea agenţilor AI autonomi.

Gemini 2.5 Pro Computer Use aduce AI‑ului capacitatea de a acţiona în mediul digital, transformând modul în care se automatizează sarcinile online. Evoluţia rapidă a acestor tehnologii impune o informare continuă și monitorizarea atentă a impactului asupra securităţii și eticii în utilizarea lor.