AI Google Kini Punya 'Mata' dan 'Jari': Gemini 2.5 Computer Use Bisa Klik, Ketik, dan Gulir Persis Manusia!

Google baru aja merilis model AI terbarunya bernama Gemini 2.5 Computer Use, dan kemampuan barunya ini bikin banyak orang tercengang. Soalnya, AI ini tak hanya bisa ngomong atau nulis kayak chatbot biasa, tapi juga bisa klik, ketik, dan gulir di layar komputer atau HP Android persis seperti manusia yang lagi pakai perangkatnya sendiri.

Bisa Navigasi Antarmuka Layaknya Manusia

Gemini 2.5 Computer Use dibangun di atas model Gemini 2.5 Pro, yang terkenal karena kemampuan visual dan logikanya yang kuat. Dengan model ini, Google ingin menghadirkan “asisten AI” yang benar-benar bisa mengoperasikan aplikasi atau situs web langsung lewat antarmuka pengguna (UI).

Artinya, AI ini bisa melakukan hal-hal seperti membuka browser, mengetik teks, menggeser halaman, bahkan melakukan drag and drop objek di layar.

Totalnya, saat ini ada 13 jenis aksi yang bisa dilakukan AI tersebut.

Belum Bisa Kendalikan Komputer Sepenuhnya

Menariknya, Google membatasi ruang gerak AI ini hanya di browser dan antarmuka Android. Jadi, belum sampai ke level “menguasai seluruh komputer” seperti eksperimen yang dilakukan OpenAI atau Anthropic. Menurut Google, sistem ini memang belum dioptimalkan untuk kontrol penuh sistem operasi desktop, tapi sudah cukup tangguh untuk menjalankan berbagai tugas berbasis web dengan cepat dan akurat.

Diklaim Unggul dari Kompetitor

Dalam pengujian internal, Gemini 2.5 Computer Use disebut lebih akurat dan lebih cepat dibanding pesaing seperti Claude Sonnet 4.5 dari Anthropic dan Computer-Using Agent dari OpenAI. Google mengklaim, AI-nya lebih stabil ketika harus melakukan tugas-tugas yang rumit di browser, seperti mencari informasi, mengisi formulir, atau menavigasi situs dengan banyak elemen interaktif.

Sudah Diterapkan di Layanan Google

Model ini juga sudah diam-diam disematkan di beberapa proyek internal Google, seperti Project Mariner dan AI Mode di Google Search. Selain itu, Google juga membuka akses API Gemini 2.5 Computer Use lewat Google AI Studio dan Vertex AI, jadi pengembang bisa langsung coba integrasikan ke aplikasi mereka.

Dengan kemampuan seperti ini, tampaknya Google sedang benar-benar mempersiapkan masa depan di mana AI tidak terbatas pada berpikir, melainkan juga bertindak layaknya manusia di depan komputer.