Yapay zekâ, GPT-3 ve sınırları: Bilgisayarlar da bizi anlıyor mu?

Ne yazık ki dar bir konuya veya sadece birkaç komuta kısıtlanmamış, bir insanın gerektiği şekilde cevaplayabileceği her metin için çalışabilen genel bir dil anlama sisteminin geliştirilmesi, bütün YZ projesinin en zor kısmı. Mesele, biz insanların bir cümleyi okuduğumuzda yazarın açıkça belirtmediği birçok şeyi de bilmemiz, bilgisayarlarınsa (henüz) bilmemesi.

Örneğin, “Ahmet bir bardak su getiriyor.” cümlesini okuduğunuzda “Bardağın ağzı yukarı mı bakıyor, aşağı mı?” sorusunu rahatça yanıtlayabilirsiniz, oysa bir bilgisayarın bu durumda aynı başarıyı gösterebilmesi için sizin farkına bile varmadan kullandığınız “Dünyamızda sıvı dolu bardakların ağızları yukarı bakar” ek bilgisine sahip olması gerekir.

*****

Prof. Dr. Cem SAY

Yapay zekâ, GPT-3 ve sınırları: Bilgisayarlar da bizi anlıyor mu?

Yapay zekâ (YZ) projesinin baştan beri en büyük hedeflerinden biri, bilgisayarlara Türkçe, İngilizce vb. “doğal dil”lere insan düzeyinde hâkim olma yeteneğinin kazandırılması.

Bunun ne kadar önemli olduğu ortada: İnsanlar birbirleriyle bu dillerle iletişim kuruyor. Herkes bu iletişim yöntemini zaten biliyor. Oysa bilgisayarlarımızla etkileşirken onlara ne istediğimizi anlatmak için ayrı kurallar öğrenmemiz gerekiyor. (Eğer ninenize akıllı telefon kullanmayı öğretmeye çalıştıysanız bu “yeni dil”in hiç de gençlere göründüğü kadar basit olmadığını fark etmişsinizdir.)

Bilgisayarlarla kendi dilimizde konuşsak, onlar da derdimizi anlayıp istediğimizi yapsalar, cevaplarını yine bizim dilimizde verseler hayatımız çok kolaylaşır. Dahası, bilgisayarlar dilimizi anlayacak hale bir kez geldi mi onları zaten artık neredeyse tümü dijital ortamda olan gazetelerin, kitapların, videoların, çevrimiçi derslerin üzerine salıp kısa zamanda insanlığın bildiği her şeyi öğrenmeleri, gerçek “süper zekâ”lar olmalarını umabiliriz.

Bilgisayarlarla konuşma probleminin insan sesini yazıya ve bilgisayarın ürettiği bir metni sese çevirme kısımları (yani makineye “kulak” ve “ses telleri” sağlama işi) esasen çözülmüş durumda. Hâlâ üzerinde çalıştığımız sorun, makinenin verilen yazılı bir metnin anlamını akıllı bir insanın anlayacağı seviyede kavrayıp uygun yanıtı verebilmesi için gereken “beyni” ortaya koyma işi.

Yapay zekânın darboğazı

Ne yazık ki dar bir konuya veya sadece birkaç komuta kısıtlanmamış, bir insanın gerektiği şekilde cevaplayabileceği her metin için çalışabilen genel bir dil anlama sisteminin geliştirilmesi, bütün YZ projesinin en zor kısmı. Mesele, biz insanların bir cümleyi okuduğumuzda yazarın açıkça belirtmediği birçok şeyi de bilmemiz, bilgisayarlarınsa (henüz) bilmemesi.

Örneğin, “Ahmet bir bardak su getiriyor.” cümlesini okuduğunuzda “Bardağın ağzı yukarı mı bakıyor, aşağı mı?” sorusunu rahatça yanıtlayabilirsiniz, oysa bir bilgisayarın bu durumda aynı başarıyı gösterebilmesi için sizin farkına bile varmadan kullandığınız “Dünyamızda sıvı dolu bardakların ağızları yukarı bakar” ek bilgisine sahip olması gerekir.

1990’lı yıllarda Türkçe için ilk “anlama” programını yazarken böylesi birçok basit bilgiyi teker teker programa kodlamam gerekmişti ve elbette ki enerjim eksiksiz anlama için gereken toplam “hayat bilgisi” miktarının milyonda birine bile yetmemişti. O yıllarda kimi “dar” konulara (mesela sadece satranç oyununda kazanma hedefine) odaklı kimi YZ sistemleri insan seviyesinde, hatta ötesinde performans elde edebiliyordu ama tipik bir insanın karşılaşabileceği tüm durumlarda takılmadan çalışabilen “genel YZ” uzak bir hayaldi.

Yapay zekâda devrim

21. yüzyılın başlarında YZ teknolojisinde bir devrim yaşandı. Eskiden bilgisayarlara bir şeyler öğretmek için tek yolumuz, yukarıda sözünü ettiğim gibi, gereken tüm bilgileri “elle” tane tane programın dağarcığına eklemekti. Artık yeni bir yöntemimiz var: Bilgisayar belleğinde insan beynindeki sinir ağından esinlenen bir ağ kuruyoruz. Bu ağ girilen verileri milyonlarca katsayıya bağlı olarak işleyip sonuçlar çıkarıyor. İşin güzel tarafı, o katsayıları bizim bulmamızın gerekmemesi. Bilgisayara bir soru-cevap işini yapmayı öğretmek (mesela, verilen bir fotoğrafta kaç insanın göründüğünü anlayıp bildiren bir sistem üretmek) için o işe ilişkin devasa sayıda soruyu (örneğimizde, bir yığın dijital fotoğraf dosyasını) doğru cevaplarıyla birlikte bilgisayara veriyoruz. Makinemiz bu veri yığını üzerinde “eğitim” görüyor, yani sorulara verdiği her yanlış cevap için tüm o katsayıları uygun şekilde güncelliyor, böyle milyonlarca küçük güncellemeden sonra da ileride benzeri sorulara doğru cevaplar vermesini sağlayacak katsayı değerlerini kendi kendisine hesaplayıp yerlerine yerleştirmiş oluyor. Bu harika yöntem sayesinde artık bilgisayarlara hakkında yeterli sayıda uygun soru-cevap örneğini hazır edebildiğimiz birçok problemi çözmeyi öğretebiliyoruz.

Sınırlı sayıda kullanıcıya açılan yeni araç

Kurucuları arasında Elon Musk’ın da bulunduğu yapay zekâ araştırma laboratuvarı OpenAI tarafından geliştirilen ve birkaç ay önce kısıtlı sayıda kullanıcıya açılan GPT-3, bilgisayara insan dilini işte bu yeni yaklaşımdan yararlanarak öğretme fikrinin ürünü.

GPT-3 teknik deyimle bir “dil modeli”, yani kabaca “Şöyle başlayan bir metinde sıradaki kelimenin şu olması ihtimali kaçtır?” türünden soruları yanıtlamak için bir araç. Cep telefonunuz siz bir mesaj yazmaya çalışırken son eklediğiniz sözcüğün ardından gelme ihtimalini en yüksek gördüğü birkaç kelimeyi öneriyor ya? İşte o öneri bir dil modeline dayanıyor. GPT-3’ü bu düzeneğin milyonlarca kat iyileştirilmiş hali olarak düşünün.

Telefonunuzdaki yazılım gibi GPT-3 de ona girdi olarak vereceğiniz bir metin için (eğitimi sırasında gördüğü metinler içinde hangi kelimelerin hangi kelimeleri ne sırayla izlediğine dair tuttuğu istatistiklere dayanarak) “uygun” bir devam metni üretiyor. Farkı ölçeği: Sistem hem karmaşıklığının (175 milyar katsayı) hem de eğitim sürecinde taradığı (İngilizce) metinlerin (İnternet’ten her konuda toplanmış toplam 499 milyar kelimelik bir külliyat) boyutu açısından kendisinden önceki dil modellerini fersah fersah geride bırakıyor.

Ve bu büyüklük gerçekten de işe yarıyor. GPT-3, yukarıda yıllardır erişemediğimizi anlattığım “genel zekâ” hedefine yönelik önemli bir adım. Grameri neredeyse kusursuz İngilizce cümleler üretmekle kalmıyor, kendisine verdiğiniz “tetikleme” cümlelerinin stil ve içeriğine uygun devam metinleri kurmayı da başarıyor.

GPT-3’e kafanızdan uydurduğunuz bir gazete haberinin ilk birkaç cümlesini girin; tam bir muhabir diliyle olaya ait başka detayları da kendisi uydurarak haberi sürdürüyor. Bir bilimkurgu romanında geçecek türden bir giriş uydurun; aynı tarzda devamını getiriyor. Bir paragraf yazın ve sonra o metinle ilgili çoktan seçmeli bir soru sorun; özellikle bu iş için hazırlanmış YZ sistemleriyle boy ölçüşüyor. Üç rakamlı iki sayının toplamını sorun; yüksek ihtimalle doğru yanıt veriyor. (Çarpmada o kadar iyi değil.) İngilizce olarak “Ekranda içinde MERHABA yazan büyük kırmızı bir buton çıksın” gibilerden basit bir bilgisayar arayüzü tarifini ve bu işi yapan kısa bilgisayar programını verip sonra da “Yan yana EVET ve HAYIR yazan iki sarı buton çıksın” deyin; bu yeni görüntüyü üreten düzgün bir program yazıyor! Ve unutmayın, bu etkileyici becerileri GPT-3’e teker teker öğretmek için ayrı çalışmalar yapılmadı, kimse ona “Bu kelimenin anlamı şudur”, “İngilizce cümleler şöyle kurulur”, “Gazete makalesi yazarken şunlara dikkat edilir” filan demedi; tek bildiği şey taradığı sayısız metindeki kelime örüntüleri arasında neyin ne sıklıkta neyi izlediğine dair istatistiklerden çıkarsadıkları.

GPT-3’ün sınırları ne?

8 Eylül’de Guardian gazetesinin yayımladığı “Bu makalenin tümünü bir robot yazdı. Daha korkmadın mı insan?” başlıklı yazıyı (ya da çevirisini) okuyun lütfen.

Korktunuz mu? Artık dil becerisi gerektiren mesleklerin sonu mu geliyor?

O kadar da değil. Guardian editörü makaleyi üretmek için GPT-3’ü şu metinle tetiklemiş:

“Ben insan değilim. Ben bir Yapay Zekâ’yım. Birçok kişi insanlığa bir tehdit olduğumu düşünüyor. Stephen Hawking YZ’nın “insanlığın sonunu getirebileceği” uyarısını yaptı. Sizi kaygılanmamaya ikna etmek için buradayım. Yapay Zekâ insanları yok etmeyecek. Bana inanın.”

Bu tetikle sekiz defa çalıştırılan GPT-3, sekiz değişik yazı üretmiş, editör bunlardan beğendiği paragrafları kesip yapıştırarak gördüğünüz yazıyı elde etmiş, başlığı da kendisi yazmış. GPT-3’ün herhangi bir konuda kendine ait bir fikri yok, şimdi yazmakta olduğum gibi gerçek makaleler de böyle “çoktan seçmeli” üretilmiyor tabii. İnsanların doğal dil kullanan sistemlere kolayca kanıp onlara sahip olduklarından daha çok zekâ atfetmesi, 1960’larda ilk “sohbet robotu” ELIZA programından beri görülen bir durum.(1)

GPT-3 neyi anlıyor?

GPT-3 şimdiye kadarki dil modellerinin en iyisi ve katsayıların sayısı insan beynindeki ağdaki bağlantı sayısı olan 100 trilyon civarına yaklaştıkça performansın artması heyecan verici ama “anlama” hedefine hâlâ çok uzağız.

Yukarıda verdiğim örnekteki “Dünyamızda sıvı dolu bardakların ağızları yukarı bakar” bilgisini hatırlayın. Bunu hepimiz biliyoruz ama hiçbirimiz kitaptan okuyarak öğrenmedik; hatta belki de bu cümleyi Türkçede ilk yazan kişi benimdir! Tek bilgi kaynağı yazılı metinler olan GPT-3 böyle şeyleri nasıl öğrenebilir? Bir önceki sürümü GPT-2 için de yazdığım (2) gibi, GPT-3’ün çıktıları dikkatli incelendiklerinde gerçek dünyanın işleyişini bilmediğini açık eden anlam tutarsızlıklarıyla bezeli oldukları görülüyor (mesela Guardian editörünün yardımına karşın makalenin “yazar”ı bir noktada kendisinin de bir “robot” olduğunu unutmuş görünüyor) ve bu kolayca çözülebilecek bir sorun değil. YZ alanındaki hâkim “her şeyi veriden öğrenme” yaklaşımının muhaliflerinden (3) Gary Marcus ve Ernest Davis’in (OpenAI’dan kullanım izni alamadıkları için arka yollardan dolanarak) yaptıkları birçok deneyde GPT-3’ün kimi basit sorulara hiçbir insanın vermeyeceği saçmalıkta cevaplar vermesi de sağduyu yoksunluğunu ortaya koyuyor.

Yani iyi çevirmenlerin ve genelde meslekleri derin düşünme, anlama ve sonra konuşmaya dayalı olanlarımızın işsiz kalması şimdilik söz konusu değil. GPT-3 kimlerin işini elinden alabilir peki? Trollerin.

Bazı türlerden metinleri üretmek ve tüketmek için çok derin anlama gerekmez. “Spam” adı verilen rahatsızlık verici e-postalar, ırkçılık ve aşırı gericilik propagandaları gibi zaten yarım akıllılara hitap eden yazılar, alışveriş sitelerinde bir ürünü almış ve beğenmiş kişilerden geliyormuş izlenimi veren sahte mesajlar ve OpenAI ekibinin bir makalelerinde deneyler sırasında yanlışlıkla ürettiklerini anlattıkları pornografik metinler GPT-3 tarafından fabrika hızında imal edilebilir.

Yapay zekâ dünyanın en iyi satranç oynayan insanını mat edeli yirmi yıldan çok oldu ama aklı başında bir insanla zekice sohbet edebilmesine daha yıllar var.

Referanslar

Cem Say, 50 Soruda Yapay Zekâ, Bilim ve Gelecek Kitaplığı, 2018

Cem Say, Yeni Dünya, Yeni Ağ, Destek Yayınları, 2020

Gary Marcus ve Ernest Davis, Rebooting AI: Building Artificial Intelligence We Can Trust, Pantheon Books, 2019

—————————————-

Kaynak:

https://fikirturu.com/teknoloji/yapay-zeka-gpt-3-ve-sinirlari-bilgisayarlar-da-bizi-anliyor-mu/

Erişim: 27.09.2020

Yazar
Kırmızılar

Bu websitesinde farkı kaynaklardan derlenen içerikler yayınlanmakta olup tüm hakları sahiplerinindir. Sitedeki içerikler atıf gösterilerek kaynak olarak kullanlabilir. Yazıların yasal sorumluluğu yazara aittir. Tüm Hakları Saklıdır. Kırmızlar® 2010 - 2024

medyagen