Etiket: pokemon blue

  • # Google’ın Gemini’si, Küçük Bir Yardımla Pokémon Blue’yu Yendi

    ## Google’ın Gemini’si, Küçük Bir Yardımla Pokémon Blue’yu Yendi

    Google’ın en pahalı yapay zeka modeli Gemini, 29 yıllık bir video oyununu yenerek önemli bir kilometre taşını geride bıraktı. Google CEO’su Sundar Pichai, sosyal medya platformu X üzerinden yaptığı açıklamada, “Ne bir bitiriş! Gemini 2.5 Pro, Pokémon Blue’yu tamamladı!” diyerek zaferi duyurdu.

    “Gemini Plays Pokemon” adlı canlı yayın, Google ile bağlantısı olmayan, kendisini “30 yaşında bir yazılım mühendisi” olarak tanımlayan Joel Z. tarafından oluşturuldu. Ancak Google yöneticileri bu çabayı destekliyor. Google AI Studio ürün yöneticisi Logan Kilpatrick, geçtiğimiz ay Gemini’nin Pokémon’u tamamlama konusunda büyük ilerleme kaydettiğini ve 5. rozetini kazandığını belirtmişti. Pichai ise bu duruma “API üzerinde çalışıyoruz, Artificial Pokémon Intelligence :)” şeklinde esprili bir yanıt vermişti.

    Peki neden Pokémon? Şubat ayında Anthropic, Claude AI modellerinin “Pokémon Red” oyunundaki ilerlemesini vurgulamış ve Claude’un “genişletilmiş düşünme ve aracı eğitimi” sayesinde klasik bir oyunu oynamak gibi “daha beklenmedik” görevlerde önemli bir avantaj elde ettiğini belirtmişti. Hatta Joel Z., ilham kaynağı olarak gösterdiği “Claude Plays Pokemon” adlı bir Twitch kanalı bile bulunuyor.

    Ancak, Claude henüz “Pokémon Red”i yenmiş değil. Bu, Gemini’nin oyunda nesnel olarak daha iyi olduğu anlamına mı geliyor? Joel Z., Twitch sayfasında izleyicileri, “Lütfen bunu bir LLM’nin Pokémon’u ne kadar iyi oynayabileceğinin bir ölçütü olarak görmeyin. Doğrudan karşılaştırmalar yapamazsınız – Gemini ve Claude farklı araçlara sahip ve farklı bilgiler alıyorlar.” diyerek uyarıyor.

    Her iki yapay zeka modelinin de oyunu oynamak için yardıma ihtiyacı var. İşte burada bahsedilen “aracı donanımları” devreye giriyor. Bu donanımlar, modellere ek bilgilerle kaplanmış oyun ekran görüntüleri sağlıyor. Bu sayede model, nasıl yanıt vereceğine (uzmanlaşmış aracıları çağırmayı içerebilir) karar verebiliyor ve ardından yapay zekanın talimatına karşılık gelen düğmeye basabiliyor.

    Joel Z., Gemini’nin oyunu tamamlamasına yardımcı olmak için başka “geliştirici müdahaleleri” olduğunu kabul ediyor, ancak bunun hile olmadığını savunuyor. “Müdahalelerim, Gemini’nin genel karar verme ve akıl yürütme yeteneklerini geliştiriyor,” diyor. “Spesifik ipuçları vermiyorum – Ay Dağı gibi belirli zorluklar için yol haritaları veya doğrudan talimatlar yok. Yaklaşık sayılabilecek tek şey, Gemini’ye bir Roket Askere iki kez konuşması gerektiğini söylemekti, bu da daha sonra Pokemon Yellow’da düzeltilen bir hataydı.”

    Ayrıca, “Gemini Plays Pokémon hala aktif olarak geliştiriliyor ve çerçeve sürekli olarak evrim geçiriyor.” diyerek sözlerini tamamlıyor.

  • # Gemini Levels Up: Google’s AI Triumphs in Pokémon Blue (with a Strategy Assist)

    ## Gemini Levels Up: Google’s AI Triumphs in Pokémon Blue (with a Strategy Assist)

    Google’s Gemini AI model has achieved a notable feat: conquering the classic Game Boy title, Pokémon Blue. This accomplishment, announced by CEO Sundar Pichai on X, highlights the evolving capabilities of advanced AI in tackling complex tasks, even those within the realm of gaming.

    However, the victory wasn’t a solo endeavor. The “Gemini Plays Pokemon” livestream, orchestrated by an independent software engineer named Joel Z, showcased Gemini’s gameplay with the assistance of an “agent harness.” This harness provides the AI with augmented game screenshots and tools to make informed decisions, essentially acting as a strategic advisor.

    The pursuit of AI-driven Pokémon mastery isn’t unique to Google. Anthropic previously demonstrated the progress of its Claude AI models in “Pokémon Red,” emphasizing how “extended thinking and agent training” can significantly boost performance in unexpected scenarios like navigating a video game. A dedicated “Claude Plays Pokemon” Twitch channel even served as inspiration for Joel Z’s Gemini project.

    While Gemini has seemingly surpassed Claude in this specific challenge, direct comparisons remain complex. As Joel Z points out, each AI model leverages different tools and information streams, making a head-to-head benchmark unreliable. The “agent harnesses” themselves play a crucial role, enabling the AI to interpret game data, strategize, and execute actions by selecting the appropriate button inputs.

    These “dev interventions,” as Joel Z calls them, are designed to enhance Gemini’s overall decision-making abilities rather than provide specific solutions or walkthroughs. He emphasizes that the framework is continuously evolving, suggesting ongoing efforts to refine Gemini’s gameplay and strategic thinking.

    This achievement, while seemingly lighthearted, underscores the potential of AI to tackle complex problem-solving tasks. By observing and interacting with dynamic environments like video games, AI models like Gemini and Claude can learn to strategize, adapt, and ultimately achieve goals – capabilities that could translate to real-world applications across various industries. While the debate on whether the “help” diminishes the accomplishment continues, the progress of AI in mastering classic games provides a fascinating glimpse into the future of artificial intelligence.