Google DeepMind, yapay zeka dünyasının yeni modelini duyurdu. Gemini 2.5 Computer Use adı verilen yeni model, bilgisayar arayüzlerini bir insan gibi kullanabiliyor. Form doldurmak, sayfalarda gezinmek ve uygulamalarda işlem yapmak yeni modelin yaptığı işlemlerden sadece birkaçı. Tanıtım sonrasında yeni dönem olarak tanımlanan Gemini 2.5 Computer Use büyük ilgi görmeye de başladı. Kullanıcı arayüzlerini tanıyan ve bu sayede işlem yapma yeteneğine sahip olan yapay zeka, sitelerde oturum açma gibi ileri seviye işlemlerde dahi başarılı sonuçlar vermiş durumda. Sistem, Google AI Studio ve Vertex AI üzerinden kullanılabiliyor.
Gemini 2.5 Computer Use Nasıl Çalışıyor?
Model, kullanıcının komutunu, ekran görüntüsünü ve geçmiş işlemleri analiz ederek işlemleri bir bir yerine getiriyor. Yazma, tıklama ve kaydırma gibi temel fonksiyonları bulunan modelde, her bir işlem alınan ekran görüntüsü ile kullanıcıya sunuluyor. Sistemsel bir engel olmadığı takdirde ya da güvenlik sistemleri tarafından engellenmediği sürece Gemini 2.5 Computer Use çalışmasını kullanıcı komutlarıyla sürdürebiliyor. Üstelik model, önceki modellere göre çok daha yetenekli olmasının yanı sıra performansıyla da fark atıyor. Yeni model ile yapılan testlerde %70’in üzerinde doğruluk oranına ve 225 saniyenin altında gecikme süresine ulaşıldığı belirtildi. Bu da hem hız hem de kalite açısından Gemini 2.5 Computer Use modelini zirveye taşıyor.
Yeni sistemde üstelik güvenlik de ihmal edilmemiş. Modelin kötü amaçlarla kullanılmasını engellemek adına güvenlik denetim servisi ile önlem alınıyor. Tıbbi veya finansal işlemler gibi kritik işlemlerde ek onay zorunluluğu bulunuyor. İşte yeni modelle ilgili paylaşılan ilk video;