Kendi Kendine Konuşma Yapay Zekanın Öğrenme Kapasitesini Artırıyor

Bilim
Self-Talk Boosts AI Learning
OIST araştırmacıları, 'içsel konuşma' modellemesi ve kısa süreli bellek mimarisinin, yapay zekanın çok daha az veriyle genelleme yapmasına ve çoklu görevleri yerine getirmesine yardımcı olduğunu gösterdi; sonuçlar, fizikteki öğrenmeye dair matematiksel kavramlar ve fiziksel robotik ile ilişkilendiriliyor.

Makinelere mırıldanmayı öğreten laboratuvar

Bu hafta, Okinawa Bilim ve Teknoloji Enstitüsü'ndeki (OIST) araştırmacılar basit ama çarpıcı bir fikir paylaştılar: Yapay ajanlar, "kendi kendilerine konuşmak" üzere eğitildiklerinde daha iyi genelleme yapmayı öğreniyorlar. 22 Aralık 2025'te Neural Computation dergisinde yayımlanan çalışma, modele birden fazla kısa süreli bellek yuvası sağlayan bir çalışma belleği mimarisiyle birlikte, ekibin bir tür programlanmış "içsel konuşma" veya kendi kendine mırıldanma olarak tanımladığı, öz-yönelimli bir sözel prova sinyali eklemenin; çoklu görev ve aşamalı örüntü üretimi gerektiren zorlu görevlerde performansı artırdığını gösteriyor.

Deney nasıl kurgulandı

Araştırmacılar, aktif çıkarım (active inference) çerçevelerini kullanarak hesaplamalı simülasyonlar yürüttüler. Kısa süreli bellek için çeşitli mimarileri karşılaştırdılar ve ajanın içsel belirteçler (token) yaymasını gerektiren bir hedefin eklenmesinin —yani modelin belirli bir sayıda kendi kendine "mırıldanmaya" zorlanmasının— öğrenme sonuçlarını değiştirip değiştirmediğini test ettiler. Birden fazla geçici bellek yuvasına sahip sistemler, aktarım ve çoklu görevlerde daha basit bellek şemalarından daha iyi performans gösterdi. Daha da önemlisi, bu bellek yapısının üzerine içsel konuşma hedefleri eklendiğinde, görev değiştirme ve çok adımlı dizi tamamlama yetenekleri daha da gelişti.

OIST, yöntemi içerikten bağımsız (content-agnostic) olarak nitelendiriyor: İçsel konuşmanın insan terimleriyle anlamsal olarak anlamlı olması gerekmiyor; bunun yerine içsel dinamikleri yapılandıran bir prova ve kontrol sinyali görevi görüyor. Bu durum, standart derin öğrenme modellerinin genellikle eğitim örneklerinin ötesinde genelleme yapmakta zorlandığı düşük veri rejimlerinde yaklaşımı özellikle değerli kılıyor.

Kendi kendine yüksek sesle konuşmak neden işe yarar

Bu etkinin arkasında birbirini tamamlayan iki sezgi bulunuyor. Birincisi, kısa süreli bellek yuvaları sisteme ara sonuçlar ve talimatlar için geçici kaplar sunarak, daha uzun bir hesaplama devam ederken sistemin birden fazla geçici bilgiyi tutmasına olanak tanıyor. İkincisi, içsel konuşma sinyali içsel bir iskelet sağlıyor: Ara adımların provasını yapmak veya onları yeniden kodlamak, görev değiştirirken veya bir dizi çok sayıda adım içerdiğinde öğrenicinin bilgiyi korumasına ve yeniden kullanmasına yardımcı oluyor.

Makine öğrenimi perspektifinden bakıldığında bu durum, ajanın içsel durum uzayına yapı kazandırılması ve böylece hesaplama sürecinde aşamalı ve tekrarlanabilir bir şekilde ilerleyebilmesi olarak görülebilir. Araştırmacılar, bu tür yapılandırılmış öz-etkileşimin, esneklik sağlamak için devasa eğitim veri setlerine veya kaba kuvvetle model ölçeklendirmeye kıyasla düşük maliyetli bir alternatif olduğunu savunuyorlar.

Beklenmedik yerlerdeki matematiksel yankılar

Diğer iki güncel araştırma dizisi, OIST'in sonuçlarını daha geniş bir kavramsal çerçeveye oturtmaya yardımcı oluyor. University of Pennsylvania'daki mühendisler, köpüklerdeki kabarcıkların içsel yeniden yapılanmasının, modern derin ağların eğitim manzaralarında nasıl yol aldığıyla örtüşen bir matematiği takip ettiğini gösterdi. Eski metaforlar kabarcıkları cam gibi vadilerde hapsolmuş olarak ele alırken, yeni analizler hem köpüklerin hem de eğitilmiş yapay zeka parametrelerinin dar optimum noktalara batmak yerine geniş, düz bölgelerde gezindiğini görüyor. Modellerin genelleme yapmasını sağlayan şey bu sürekli yeniden yapılanmadır: Manzaranın daha düz kısımlarında kalmak, çözümleri yeni girdilere karşı dayanıklı kılar.

Çalışmalar birlikte okunduğunda ortak bir matematiksel sezgiye işaret ediyor: İster fiziksel bir maddedeki kabarcıklar ister bir sinirsel kontrolcü içindeki değişkenler olsun, esnek ve prova edilebilir içsel dinamikleri koruyan sistemler, kırılgan aşırı öğrenmeden (overfitting) kaçınıyor ve uyum sağlayabilir kalıyor. OIST'in içsel konuşması, bir yapay zekanın içsel yörüngesini bu daha geniş, genelleştirilebilir vadilerde tutmasını sağlayan pratik bir mekanizma olabilir.

Bedenlenme ve sosyal sinyaller: robotik ve duyuşsal yapay zeka ile bağlantılar

İçsel konuşma bu trendlerle doğal bir uyum içindedir. İçsel adımların provasını yapan bedenlenmiş (embodied) bir ajan —yani sadece dış dünyayı modellemekle kalmayıp aynı zamanda kısa bir içsel planı koruyan ve bunu seslendiren bir robot— motor dizilerini (dudak senkronizasyonu veya manipülasyon) daha iyi koordine edebilir, insan ortaklarının ipuçlarını yorumlayabilir ve kendi kararlarını insan dostu terimlerle açıklayabilir. İçsel öz-modellerin dışsal algıyla bu şekilde katmanlandırılması, sağlam insan-döngüde (human-in-the-loop) Ar-Ge ve uzmanların örtük hedefleri hakkında akıl yürüten makineler gibi, yapay zekayı dar eğitim dağılımlarının dışında güvenilir kılmayı amaçlayan çabaların da merkezinde yer alıyor.

Vaatler ve sınırlar

OIST sonuçları gelecek vaat ediyor ancak henüz ön hazırlık aşamasında. Rapor edilen deneyler hesaplamalı simülasyonlardır; modellerin hala sensörlerin arızalandığı, gecikmelerin yaşandığı ve hedeflerin öngörülemez şekilde değiştiği gürültülü, dinamik, gerçek dünya ortamlarında doğrulanması gerekiyor. Ekip bunu açıkça kabul ediyor ve bir sonraki adımlarının, doğadaki gelişimsel öğrenmeyi taklit etmek için "ortamı biraz daha karıştırmak" olacağını belirtiyor. İçsel konuşmanın simüle edilmiş belirteçlerden sağlam fiziksel davranışlara ölçeklenip ölçeklenemeyeceği konusundaki asıl test, ev veya tarım ortamlarında robotlarla yapılacak bedenlenmiş denemeler olacak.

Kavramsal ve etik mülahazalar da mevcut. Bilim insanları antropomorfik (insan biçimci) kısaltmalardan kaçınmalıdır: Bir modelin "içsel konuşması" öznel bir düşünce değil, mühendislik ürünü bir prova sinyalidir. Yine de bu etiket, kamuoyu algısı açısından önem taşıyor. Öz-yönelimli dil üreten veya içsel adımları anlatan sistemler, bilinçli ajanlar olarak karıştırılabilir. Bu durum şeffaflık gerekliliklerini artırıyor: Tasarımcılar içsel bir konuşma kanalının ne yaptığını, nasıl başarısız olabileceğini ve çekişmeli girdilerle zorlanıp zorlanamayacağını veya manipüle edilip edilemeyeceğini açıkça belgelemelidir.

Neden önemli

Eğer içsel konuşma ve hafif çalışma belleği mimarileri, mütevazı verilerle genelleme ve çoklu görev yeteneğini güvenilir bir şekilde artırıyorsa, pratik sonuçları oldukça geniştir. Anında uyum sağlaması gereken yapay zeka sistemleri —görevleri bir arada yürüten ev robotları, değişen mahsullere yanıt veren tarım dronları veya kısıtlı deneysel verilerle çalışan laboratuvar asistanları— etiketli eğitim setlerinde üstel bir büyüme olmadan daha verimli, daha güvenli ve daha yararlı hale gelebilir. Dahası bu fikir, malzeme bilimi ve robotik alanlarında yeni ortaya çıkan matematiksel ve bedenlenmiş öğrenme perspektifleriyle örtüşerek verimli disiplinlerarası yollar sunuyor.

Bilişsel temelli bir hile olarak başlayan şey —makineye prova yapmayı öğretmek— dolayısıyla daha derin bir mühendislik ilkesine işaret ediyor olabilir: Ajanların katı bir şekilde aşırı optimizasyon yapması yerine esnek bir şekilde yeniden yapılanmasına olanak tanıyan içsel bir yapı inşa etmek. Gerçek ortamlardaki gelecek deneyler simülasyonları doğrularsa, "kendi kendine konuşmak" sağlam ve insan odaklı yapay zeka mimari araç setinde standart bir araç haline gelebilir.

Kaynaklar

  • Neural Computation (araştırma makalesi: Working Memory and Self-Directed Inner Speech Enhance Multitask Generalization in Active Inference)
  • Okinawa Institute of Science and Technology (OIST) basın materyalleri
  • Proceedings of the National Academy of Sciences (viskoz olgunlaşan köpüklerde yavaş gevşeme ve manzara odaklı dinamikler üzerine köpük çalışması)
  • University of Pennsylvania School of Engineering and Applied Science
  • Science Robotics (robot dudak senkronizasyonu araştırması)
  • Columbia Engineering (Creative Machines Lab)
  • Japan Advanced Institute of Science and Technology (JAIST) — çok modlu sosyal sinyal araştırması
  • ELLIS Institute Finland / Aalto University (insan-yapay zeka ekipleri ve dağılım dışı sağlamlık üzerine araştırma)
James Lawson

James Lawson

Investigative science and tech reporter focusing on AI, space industry and quantum breakthroughs

University College London (UCL) • United Kingdom

Readers

Readers Questions Answered

Q Kendi kendine konuşma yaklaşımının temelindeki fikir nedir ve bunun öğrenme üzerindeki etkisi nasıldır?
A Temel fikir: Yapay ajanlara, birden fazla kısa süreli bellek yuvası sağlayan bir çalışma belleği mimarisiyle donatılmışken, dahili bir sözel prova sinyali veya içsel konuşma yayarak 'kendi kendilerine konuşmaları' öğretilir. Bu kurulum bir araya getirildiğinde, özellikle geleneksel modellerin eğitim örneklerinin ötesine geçmekte genellikle başarısız olduğu düşük veri rejimlerinde genelleme ve çoklu görev performansını iyileştirir.
Q Bu fikri test etmek için çalışma nasıl yürütüldü?
A Araştırmacılar, aktif çıkarım çerçevelerini kullanarak hesaplamalı simülasyonlar yürüttüler, birkaç kısa süreli bellek mimarisini karşılaştırdılar ve dahili bir belirteç hedefi eklemenin (ajanı dahili mırıldanmalar çıkarmaya zorlamanın) öğrenme çıktılarını değiştirip değiştirmediğini test ettiler. Birden fazla geçici bellek yuvasına sahip sistemler, aktarım ve çoklu görevlerde daha basit belleklerden daha iyi performans gösterdi ve içsel konuşma hedefleri, görev değiştirme ile çok adımlı dizi tamamlamayı daha da güçlendirdi.
Q İçsel konuşmayı bellekle birleştirmenin yapay zeka için daha geniş kapsamlı etkileri nelerdir?
A Makine öğrenimi perspektifinden bakıldığında içsel konuşma, içsel dinamikleri yapılandıran bir iskele görevi görerek denetleyicinin hesaplama sürecinde aşamalı ve tekrarlanabilir adımlarla ilerlemesine yardımcı olur. Bu yaklaşım, esneklik ve genelleme için büyük veri setlerine veya kaba kuvvet ölçeklendirmesine (brute-force scaling) ucuz bir alternatif sunar; somutlaştırılmış robotik, insan-YZ iş birliği ve dar eğitim dağılımlarının ötesindeki dayanıklılıkla potansiyel ilgisi vardır.
Q Bu araştırma dizisinin kısıtlamaları ve önerilen sonraki adımları nelerdir?
A Kısıtlamalar arasında, sonuçların hesaplamalı simülasyonlardan gelmesi ve sensörlerin arızalandığı veya hedeflerin değiştiği gürültülü, dinamik gerçek dünya ortamlarında doğrulanması gerekliliği yer almaktadır. Araştırmacılar, ölçeklenebilirliği test etmek için ev tipi veya tarım robotlarıyla somutlaştırılmış denemeler planlarken, içsel konuşmanın öznel bir düşünceden ziyade tasarlanmış bir prova sinyali olarak şeffaf bir şekilde etiketlenmesini vurguluyorlar.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!