Apple her ne kadar üretken YZ rüzgarına geç tutulmuş benzer biçimde görünse de, “bağlamsal anlayış”la ilgili yeni bir araştırma Siri’nin ChatGPT’den oldukca daha iyi olmasını sağlayabilir.
Teknoloji devi, ChatGPT’nin yükselişi ve arkasından Google, Microsoft ve Meta benzer biçimde rakiplerinin üretken YZ vasıta ve özelliklerinin piyasaya çıkışı esnasında kuşku çekici şekilde sessizliğini korudu. Sadece Apple araştırmacıları, Apple fanatiklerinin beklediği türde bir üretken YZ güncellemesini Siri’ye kazandıracak yeni bir model üretmiş olabilir.
Araştırmacıların yayınladığı makalede “İnsan hitabı tipik olarak, bağlam göz önüne alındığında anlamı (öteki insanoğlu için) açık olan ‘onlar’ yada ‘şu’ benzer biçimde belirsiz referanslar içeriyor” deniyor. Yazı, “sesli asistanlarda gerçek anlamda organik bir konuşma deneyimi” elde etmek amacıyla, büyük dil modellerinin (LLM’ler) ekran, konuşma ve arka plan referansları (mesela, arka planda çalışan uygulamalar yada özellikler) söz mevzusu olduğunda bağlamı devamlı anlayamaması sorununu ele alan ReALM (Dil Modellemesi Olarak Referans Çözünürlüğü) adlı bir model öneriyor.
Her ne kadar ChatGPT bazı türde bağlamları anlamada oldukça iyi olsa da, araştırmacılara bakılırsa ReALM, GPT-3.5 ve GPT-4’ten (ChatGPT’nin parasız ve ücretli versiyonlarını güçlendiren modeller) tüm bağlam testlerinde oldukca daha yüksek performans gösteriyor. Peki bu model Siri için ne ifade ediyor, gelin bir bakalım:
1. Ekranda bağlam ipuçları
Apple araştırmacılar ReALM’i ekranda görünen web sayfaları, şahıs detayları benzer biçimde içeriklerle eğitti. Bu sayede model, ekran görüntülerindeki metinleri (mesela adresler ve banka hesap detayları benzer biçimde) anlama kabiliyeti kazanmıştır. Her ne kadar GPT-4 de görselleri anlıyor olsa da, model ekran görüntüleriyle eğitilmiş değil. Makaleye bakılırsa ReALM, Apple kullanıcılarının Siri’ye sorabileceği ekrandaki detayları anlama mevzusunda daha başarıya ulaşmış.
2. Konuşma ve arka plan anlayabilme
Konuşmaya dayalı referanslar, konuşmayla ilgili olan, sadece istemde açıkça belirtilmemiş olabilecek bir şey anlamına geliyor. ReALM’i işletme listeleri benzer biçimde verilerle eğitmekle model, “en alttakini ara” benzer biçimde ekranda görüntülenen yakındaki eczanelerden en alttakini arayabiliyor. Normalde bunun için “Listelenen eczanelerden en alttakini ara” benzer biçimde daha nokta atışı bir istemde bulunmak gerekiyor.
ReALM bunun haricinde “arka plandaki durumları” da algılayabiliyor. Doğrusu kullanıcının o anda ekranda görmediği ya da etkileşime girmediği özellikler de ReALM’in kapsamında olabiliyor. Doğrusu siz arkadaşınızla Whatsapp’ta konuşurken, YZ asistanınız arkada çalan şarkı ya da çalan alarmın da bilincinde oluyor ve bunlara müdahale edebiliyor.
3. Tamamen cihazınızda bulunacak
Büyük dil modelleri (LLM’ler) çoğu zaman oldukca fazla işlem gücü istediği için, çoğunlukla bulut tabanlı olarak çalışıyorlar. Sadece ReALM tasarlanırken, sizin cihazınız üstünde emek harcaması düşünülerek tasarlanmış. ReALM aslen daha minik bir LLM, yalnız “bilhassa ve yalnız referans çözümleme görevi için ayarlanmış”. Apple sattığı cihazlarda gizliliğe verdiği öneme büyük vurgu yapıyor. Hal bu şekilde olunca Siri’nin üretken YZ versiyonunun da aygıt üstünde çalışıyor olması da markanın vizyonuna uygun görünüyor. Bununla beraber YZ kabiliyetlerine haiz cihazlar için de büyük bir çağ atlanmış olacak.
Apple, YZ planları hakkında hep ağzını sıkı tutuyor. Sadece firmanın CEO’su Tim Cook daha ilkin yapmış olduğu bir açıklamada 2024 yılı sonuna doğru bir büyük YZ duyurusu yapacaklarını söylemişti. Bu yüzden tüm gözler Apple’ın 10 Haziran’da düzenleyeceği WWDC 2024 etkinliğinde olacak.
Cecily Mauran’ın haberini Özgür Yıldız Türkçeleştirdi.