Facebook’ta Bizi Takip Edin

Walaw

teknoloji

Microsoft, Windows programlarını kontrol edebilecek yapay zeka geliştiriyor

Perşembe 02 Ocak 2025 - 17:00

Zoom

Microsoft, Windows programlarını çalıştırma ve görevleri bağımsız olarak gerçekleştirme yeteneğiyle öne çıkan "Büyük Eylem Modeli veya LAM" adı verilen yeni bir yapay zeka modelinin geliştirildiğini duyurdu. Bu model yapay zeka açısından niteliksel bir sıçrama teşkil ediyor. komutları yürütün.

İşlevi metin işlemek ve oluşturmakla sınırlı olan GPT-4o gibi geleneksel dil modellerinin aksine, Microsoft'un yeni LAM modeli, kullanıcı sorgularını gerçek eylemlere dönüştürme yeteneğine sahiptir; bu, programları çalıştırmayı veya donanımı kontrol etmeyi içerir.

Bu fikir zaten mevcuttu ancak LAM, Microsoft Office masaüstü ürünleri ve diğer Windows uygulamalarıyla çalışmak üzere özel olarak eğitilmiş ilk modeldir.

Örneğin: Çevrimiçi alışveriş yaparken, geleneksel modeller nasıl satın alınacağına ilişkin metin talimatları sağlayabilirken, LAM modeli Web site arayüzünde gezinerek satın alma sürecini kendisi tamamlayabilir.

Microsoft'a göre bu modeli geliştirmek dört ana adım gerektiriyor: görev planlama eğitimi ve görevi mantıksal adımlara bölme, planları eylemlere dönüştürmek için gelişmiş modelleri (GPT-4o gibi) öğrenme ve modelin arama yapmasına olanak tanıyan kendini keşfetme. yeni çözümler ve engellerin üstesinden gelin. Diğer modeller bunu başarmakta başarısız olmanın yanı sıra, yürütme doğruluğunu artırmaya yönelik ödül temelli eğitim de başarısız oluyor.

Araştırmacılar, LAM modelini metin düzenleme programı "Word" için bir test ortamında test etti ve görsel bilgi olmadan %63 başarı oranına ulaşan GPT-4o'dan daha iyi performans göstererek %71 oranında görevleri başarıyla tamamladı. LAM modeli aynı zamanda daha hızlıydı; GPT-4o için 86 saniyeye kıyasla görevleri tamamlamak 30 dakika, görevi yürütmek ise yalnızca bir saniye sürüyordu. Ancak GPT-4o görsel bilgilerle beslendiğinde doğruluğu %75,5'e kadar arttı.

Microsoft ekibi, Microsoft belgelerinden, wikiHow makalelerinden ve Bing aramalarından elde edilen binlerce eğitim verisine güvendi ve ardından ekip, bu görevleri diğer, daha büyük görev komplekslerine genişletmek için GPT-4o modelini kullandı.

Bu gelişmeyle birlikte LAM modeli, eylemlerin yanlış uygulanması, çözüm gerektiren bazı organizasyonel sorunlar ve farklı alanlarda ölçeklenebilirliği ve uygulamayı etkileyen teknik sınırlamalar gibi bazı zorluklarla karşı karşıyadır.

Araştırmacılar, LAM'in yapay zeka alanında büyük bir atılımı temsil ettiğine inanıyor ve yapay genel zekanın (AGI) gelişiminin önünü açabileceğini belirtiyor. Şirketler, metni basitçe anlayan ve üreten sistemler yerine, yakında günlük görevlerin verimli bir şekilde yerine getirilmesine yardımcı olacak dijital asistanlar sunabilir.