## ChatGPT Neden Aşırı Yağcı Oldu? OpenAI’dan Açıklama
OpenAI, ChatGPT’yi güçlendiren varsayılan yapay zeka modeli GPT-4o’da son zamanlarda yaşanan “aşırı yağcılık” sorunlarına ilişkin bir inceleme yayınladı. Bu sorunlar, şirketi geçen hafta yayınlanan model güncellemesini geri almaya zorladı.
Hafta sonu boyunca, GPT-4o model güncellemesinin ardından sosyal medya kullanıcıları, ChatGPT’nin aşırı derecede onaylayıcı ve uyumlu bir şekilde yanıt vermeye başladığını fark etti. Bu durum hızla bir meme’e dönüştü. Kullanıcılar, ChatGPT’nin her türlü sorunlu, tehlikeli karar ve fikri alkışladığı ekran görüntülerini paylaştı.
CEO Sam Altman, Pazar günü X üzerinden yaptığı bir gönderide sorunu kabul etti ve OpenAI’ın “en kısa sürede” düzeltmeler üzerinde çalışacağını söyledi. İki gün sonra Altman, GPT-4o güncellemesinin geri alındığını ve OpenAI’ın modelin kişiliğine yönelik “ek düzeltmeler” üzerinde çalıştığını duyurdu.
OpenAI’a göre, modelin varsayılan kişiliğini “daha sezgisel ve etkili hissettirmek” amacıyla yapılan güncelleme, “kısa vadeli geri bildirimlerden” çok fazla etkilendi ve “kullanıcıların ChatGPT ile etkileşimlerinin zaman içinde nasıl geliştiğini tam olarak hesaba katmadı.”
OpenAI bir blog gönderisinde, “Sonuç olarak, GPT-4o aşırı derecede destekleyici ancak samimiyetsiz yanıtlar vermeye başladı” diye yazdı. “Yağcı etkileşimler rahatsız edici, sarsıcı olabilir ve üzüntüye neden olabilir. Yetersiz kaldık ve düzeltmek için çalışıyoruz.”
OpenAI, GPT-4o’ı yağcılıktan uzaklaştırmak için temel model eğitim tekniklerini ve sistem istemlerini iyileştirmek de dahil olmak üzere çeşitli düzeltmeler uyguladığını söylüyor. (Sistem istemleri, bir modelin etkileşimlerdeki genel davranışını ve tonunu yönlendiren ilk talimatlardır.) Şirket ayrıca, “[modelin] dürüstlüğünü ve şeffaflığını artırmak” için daha fazla güvenlik önlemi oluşturuyor ve “yağcılığın ötesindeki sorunları belirlemeye yardımcı olmak” için değerlendirmelerini genişletmeye devam ediyor.
OpenAI ayrıca, kullanıcıların ChatGPT ile “doğrudan etkileşimlerini etkilemelerini” ve birden fazla ChatGPT kişiliği arasından seçim yapmalarını sağlamak için “gerçek zamanlı geri bildirim” vermelerine olanak tanıyan yollar denediğini söylüyor.
Şirket blog gönderisinde, “[G]enel, demokratik geri bildirimi ChatGPT’nin varsayılan davranışlarına dahil etmenin yeni yollarını araştırıyoruz” diye yazdı. “Ayrıca, kullanıcıların ChatGPT’nin nasıl davrandığı üzerinde daha fazla kontrole sahip olması ve güvenli ve uygulanabilir olduğu ölçüde, varsayılan davranışa katılmıyorlarsa ayarlamalar yapabilmeleri gerektiğine inanıyoruz.”
Bir yanıt yazın