Etiket: gemini

  • # Google Gemini’ye Yapay Zeka Destekli Görüntü Düzenleme Özelliği Geldi

    ## Google Gemini’ye Yapay Zeka Destekli Görüntü Düzenleme Özelliği Geldi

    Google’ın yapay zeka sohbet robotu Gemini, kullanıcıların hem yapay zeka tarafından oluşturulan hem de telefon veya bilgisayardan yüklenen görselleri düzenlemesine olanak tanıyan yeni nesil görüntü düzenleme araçlarına kavuştu. Google’ın Çarşamba günü yaptığı duyuruyla birlikte, Gemini’nin görüntü düzenleme yetenekleri artık daha da geliştirildi.

    Bu yeni özellik, önümüzdeki haftalarda 45’ten fazla dilde ve çoğu ülkede kullanıma sunulacak ve kademeli olarak yaygınlaşacak.

    Google’ın bu hamlesi, Mart ayında AI Studio platformunda başlattığı ve su damgalarını kaldırma özelliğiyle tartışmalara yol açan yapay zeka görüntü düzenleme modelinin ardından geldi. Gemini’nin yeni görüntü düzenleme aracı, ChatGPT’nin yakın zamanda güncellenen görüntü düzenleme özelliği gibi, bağımsız yapay zeka görüntü oluşturuculara kıyasla teorik olarak daha iyi sonuçlar verebiliyor.

    Gemini, artık “çok adımlı” bir düzenleme akışı sunuyor. Google bu akışı, metin ve görüntülerin entegre edildiği her komuta “daha zengin, daha bağlamsal” yanıtlar verme yeteneği olarak tanımlıyor. Kullanıcılar, Gemini platformu içinde görsellerin arka planını değiştirebilir, nesneleri değiştirebilir, öğeler ekleyebilir ve daha fazlasını yapabilir.

    Google’ın blog yazısında belirtildiği gibi, “Örneğin, kişisel bir fotoğraf yükleyebilir ve Gemini’den farklı saç renkleriyle nasıl görüneceğinizin bir görüntüsünü oluşturmasını isteyebilirsiniz.” veya “Gemini’den ejderhalar hakkında bir uyku hikayesinin ilk taslağını oluşturmasını ve hikayeye eşlik edecek görüntüler sağlamasını isteyebilirsiniz.”

    Bu özelliklerin “deepfake” riskini artırabileceği endişeleri de dile getiriliyor. Google, bu endişeleri gidermek için Gemini ile oluşturulan veya düzenlenen görüntülerin görünmez bir filigran içereceğini belirtiyor. Şirket ayrıca, Gemini tarafından oluşturulan tüm görüntülerde görünür filigranlarla da “deneyler” yapıyor.

    Google’ın Gemini’ye eklediği bu yeni görüntü düzenleme araçları, yapay zeka destekli içerik oluşturma ve düzenleme alanında rekabeti kızıştırırken, aynı zamanda kullanıcıların yaratıcılıklarını sergilemeleri için de yeni olanaklar sunuyor. Ancak, bu tür teknolojilerin potansiyel kötüye kullanımını engellemek için geliştirilen güvenlik önlemleri de büyük önem taşıyor.

  • # Gemini’s Got a Glow-Up: Google Enhances Chatbot with Advanced Image Editing Tools

    ## Gemini’s Got a Glow-Up: Google Enhances Chatbot with Advanced Image Editing Tools

    Google’s Gemini chatbot is leveling up its image game. As of today, April 30th, 2025, the chatbot app is rolling out native image editing capabilities, allowing users to modify both AI-generated images and those uploaded directly from their devices. The new features, announced in a Google blog post, will be available in over 45 languages and most countries in the coming weeks.

    This upgrade follows Google’s earlier foray into AI image editing with its AI Studio platform in March. While that initial offering gained notoriety for its controversial watermark removal capabilities, Gemini’s integrated editor aims to provide a more seamless and powerful user experience, similar to the recent improvements seen in ChatGPT’s image generation feature.

    One of the key improvements is a “multi-step” editing flow. This allows Gemini to provide richer and more contextual responses to prompts, integrating both text and images within the same platform. Users can now easily change backgrounds, replace objects, and add entirely new elements to their images, all within the Gemini ecosystem.

    “For example, you can upload a personal photo and prompt Gemini to generate an image of what you’d look like with different hair colors,” Google explained. “Or you could ask Gemini to create a first draft of a bedtime story about dragons and provide images to go along with the story.”

    However, the powerful capabilities also raise concerns about potential misuse, particularly in the creation of deepfakes. To address these risks, Google has implemented invisible watermarks on all images created or edited using Gemini’s native image generation. The company is also “experimenting” with visible watermarks as an additional layer of security.

    With its enhanced image editing tools, Gemini is positioning itself as a comprehensive AI assistant capable of handling both text and visual content creation, marking a significant step forward in the evolution of chatbot technology. The gradual rollout promises wider accessibility in the coming weeks, so keep an eye out for the update.

  • # Gemini Set to Integrate with iPhones, Challenging Siri with AI Power

    ## Gemini Set to Integrate with iPhones, Challenging Siri with AI Power

    Google’s AI model, Gemini, is poised to make its way onto iPhones, potentially transforming how Siri handles complex queries and adding a new dimension to Apple’s AI capabilities. Google CEO Sundar Pichai confirmed that the company anticipates finalizing a deal with Apple to integrate Gemini into iPhones by mid-year, with a potential rollout by the end of 2025. The confirmation came during the recent search monopoly trial, signaling a significant shift in the landscape of AI integration in mobile devices.

    This collaboration mirrors Apple’s existing partnership with OpenAI’s ChatGPT, where Siri leverages the AI model to answer intricate questions and perform advanced tasks. The expected Gemini integration suggests a similar functionality, enabling Siri to tap into Gemini’s capabilities for a broader range of complex requests.

    Apple’s Senior Vice President, Craig Federighi, had previously hinted at the possibility of incorporating Gemini into Apple Intelligence, the company’s suite of AI-powered features, during its initial announcement last June. “We want to enable users ultimately to choose the models they want, maybe Google Gemini in the future,” Federighi stated, indicating a desire to provide users with options for their AI experiences.

    Pichai further revealed that he had discussed AI development with Apple CEO Tim Cook, including the distribution of the Gemini app. Cook reportedly suggested that more third-party AI models would be integrated into Apple Intelligence later this year.

    Adding to the mounting evidence, eagle-eyed observers have already spotted clues in iOS beta versions. In February, *MacRumors* contributor Aaron Perris uncovered references to “Google” as a potential Apple Intelligence model choice within an iOS 18.4 beta.

    The integration of ChatGPT in iOS provides a glimpse into what users can expect from Gemini. Siri currently requests user permission before utilizing ChatGPT to handle more complex inquiries, and the model can also analyze photos and generate images based on text prompts. The arrival of Gemini promises to further expand these capabilities, offering iPhone users a powerful new AI assistant within their familiar ecosystem. This partnership represents a significant step towards a future where users can choose the AI models that best suit their needs, further blurring the lines between competing tech giants and opening new avenues for innovation.

  • # Google’dan Büyük Hamle: Gemini, iPhone’lara Geliyor!

    ## Google’dan Büyük Hamle: Gemini, iPhone’lara Geliyor!

    Google CEO’su Sundar Pichai’den gelen açıklamalar, teknoloji dünyasında büyük yankı uyandırdı. Google’ın yapay zeka modeli Gemini’nin, Apple ile yapılan anlaşma sonucunda iPhone’lara entegre edileceği doğrulandı. Bu gelişme, Siri’nin yeteneklerini önemli ölçüde artırarak, kullanıcı deneyimini yeni bir boyuta taşıyacak.

    ABD Adalet Bakanlığı’nın Google’a karşı açtığı tekel davası sırasında konuşan Pichai, Gemini’nin iPhone’lara entegrasyonunun yıl sonuna kadar tamamlanmasının beklendiğini belirtti. Bu entegrasyon, Siri’nin daha karmaşık soruları yanıtlama yeteneğini Gemini’nin güçlü yapay zeka yetenekleriyle birleştirerek geliştirecek. Benzer bir entegrasyon, Apple’ın daha önce OpenAI’ın ChatGPT’si ile yaptığı işbirliğiyle hayata geçirilmişti.

    Apple’ın Kıdemli Başkan Yardımcısı Craig Federighi de daha önce Gemini’nin Apple Intelligence özelliklerine entegre edilebileceğine dair sinyaller vermişti. Federighi, kullanıcıların gelecekte istedikleri modelleri seçebilmelerini istediklerini, bu modeller arasında Google Gemini’nin de yer alabileceğini ifade etmişti.

    Pichai’nin açıklamaları, Adalet Bakanlığı avukatı Veronica Onyema’nın sorularına yanıt olarak geldi. Pichai, Apple CEO’su Tim Cook ile yapay zeka geliştirme konusunda görüştüğünü ve Cook’un, Google’ın yapay zeka teknolojilerini nasıl geliştirdiği ve yol haritası hakkında bilgi edinmeye çalıştığını belirtti. Pichai, Cook’un kendisine bu yıl içinde Apple Intelligence’da daha fazla üçüncü taraf yapay zeka modelinin kullanıma sunulacağını söylediğini de ekledi.

    Bu entegrasyonun yolda olduğuna dair başka işaretler de var. Şubat ayında, *MacRumors* yazarı Aaron Perris, iOS 18.4 beta sürümünde “Google”a ait bir Apple Intelligence modeline dair referanslar bulmuştu. Apple’ın ChatGPT entegrasyonunda olduğu gibi, Siri daha karmaşık soruları yanıtlarken üçüncü taraf yapay zeka modelini kullanmak için otomatik olarak izin isteyecek. ChatGPT ayrıca fotoğrafları analiz edebilecek ve metin tabanlı görüntüler oluşturabilecek.

    Google Gemini’nin iPhone’lara gelmesi, yapay zeka teknolojilerinin mobil cihazlarda kullanımının yaygınlaşması adına önemli bir adım. Siri’nin yeteneklerinin artması ve kullanıcıların daha akıllı bir asistan deneyimi yaşaması bekleniyor. Bu işbirliği, teknoloji dünyasında rekabeti kızıştırırken, tüketicilere daha gelişmiş ve kişiselleştirilmiş bir deneyim sunma potansiyeli taşıyor.

  • # Google’dan Kişiselleştirilmiş Dil Öğrenme Araçları: Yapay Zeka ile Yeni Bir Dönem

    ## Google’dan Kişiselleştirilmiş Dil Öğrenme Araçları: Yapay Zeka ile Yeni Bir Dönem

    Google, dil öğrenme deneyimini daha kişisel ve etkili hale getirmek amacıyla geliştirilen üç yeni yapay zeka destekli aracı tanıttı. Google Labs üzerinden erişilebilen bu deneysel araçlar, kullanıcıların dil becerilerini geliştirirken karşılaştıkları zorluklara yenilikçi çözümler sunmayı hedefliyor. Bu adımla Google’ın, Gemini’nin çok modlu dil modeli yardımıyla Duolingo gibi platformlara rakip olmayı hedeflediği düşünülüyor.

    **Anında İhtiyaca Yönelik “Minik Dersler”**

    Yeni bir dil öğrenirken karşılaşılan en büyük engellerden biri, belirli bir durumda ihtiyaç duyulan kelime ve cümleleri bilmemektir. Google’ın “Tiny Lesson” (Minik Ders) deneyi, tam da bu noktada devreye giriyor. Kullanıcılar, örneğin “kayıp bir pasaportu bulmak” gibi bir durumu tanımlayarak, o bağlama özel kelime ve dil bilgisi ipuçları alabiliyorlar. Ayrıca, “Nereye kaybettiğimi bilmiyorum” veya “Polise bildirmek istiyorum” gibi olası yanıtlar için öneriler de sunuluyor.

    **Yerel Gibi Konuşmak: “Slang Hang”**

    Bir dili kitaplardan öğrenmek, konuşurken resmi ve doğal olmayan bir tona sahip olmaya yol açabilir. “Slang Hang” (Argo Buluşması) adlı ikinci deney ise, kullanıcıların daha gündelik ve yerel ağızla konuşmalarına yardımcı olmayı amaçlıyor. Bu özellik sayesinde, ana dili konuşanlar arasındaki gerçekçi diyaloglar oluşturulabiliyor ve kullanıcılar, sokak satıcısı ile müşteri arasındaki bir sohbet veya metroda uzun zamandır birbirini görmeyen iki arkadaşın buluşması gibi çeşitli senaryolar üzerinden yeni ifadeler öğrenebiliyorlar. Bilinmeyen terimlerin üzerine gelindiğinde anlamları ve kullanımları hakkında bilgi edinmek de mümkün. Google, bu araçta argo kullanımlarının bazen hatalı olabileceğini belirtiyor ve kullanıcıları güvenilir kaynaklarla çapraz kontrol yapmaya teşvik ediyor.

    **Etrafındaki Dünyayı Tanı: “Word Cam”**

    Üçüncü deney olan “Word Cam” (Kelime Kamerası), kullanıcıların çevrelerindeki nesnelerin fotoğraflarını çekmelerine olanak tanıyor. Gemini yapay zekası, bu fotoğraflardaki nesneleri algılayarak öğrenilen dilde etiketliyor. Bu özellik, kullanıcılara nesneleri tanımlamanın yanı sıra, o nesneleri tanımlamak için kullanılabilecek ek kelimeler de sunuyor. Örneğin, “pencere” kelimesini biliyor olsanız bile, “jaluzi” kelimesini bilmiyor olabilirsiniz. Bu araç, dil öğrenme sürecinde farkındalığı artırmaya ve kelime dağarcığını genişletmeye yardımcı oluyor.

    **Desteklenen Diller ve Erişim**

    Bu yeni deneyler şu dilleri destekliyor: Arapça, Çince (Çin), Çince (Hong Kong), Çince (Tayvan), İngilizce (Avustralya), İngilizce (Birleşik Krallık), İngilizce (ABD), Fransızca (Kanada), Fransızca (Fransa), Almanca, Yunanca, İbranice, Hintçe, İtalyanca, Japonca, Korece, Portekizce (Brezilya), Portekizce (Portekiz), Rusça, İspanyolca (Latin Amerika), İspanyolca (İspanya) ve Türkçe. Araçlara Google Labs üzerinden erişilebiliyor.

    Google’ın bu hamlesi, yapay zekanın dil öğrenme sürecini nasıl daha dinamik ve kişiselleştirilmiş hale getirebileceğine dair önemli bir örnek teşkil ediyor. Bu araçlar, dil öğrenenlerin karşılaştığı gerçek sorunlara odaklanarak, öğrenme deneyimini daha etkili ve keyifli hale getirmeyi amaçlıyor.

  • # Google Aims to Disrupt Language Learning with New AI-Powered Tools

    ## Google Aims to Disrupt Language Learning with New AI-Powered Tools

    Google is throwing its hat into the language learning ring with the launch of three new AI-powered experiments. Unveiled today, these tools leverage the power of Gemini, Google’s multimodal large language model, to offer a more personalized and dynamic approach to language acquisition, potentially challenging established players like Duolingo.

    The new experiments, accessible via Google Labs, target key pain points in the language learning journey. The first, “Tiny Lesson,” addresses the frustration of needing specific phrases in real-world situations. Users can describe a scenario, like “finding a lost passport,” and receive tailored vocabulary and grammar tips, along with suggested responses such as, “I don’t know where I lost it,” or “I want to report it to the police.”

    “Slang Hang,” the second experiment, aims to bridge the gap between textbook learning and real-world conversation. It helps users move beyond formal language and embrace colloquialisms and slang. The feature generates realistic conversations between native speakers in various scenarios, like a street vendor interacting with a customer or long-lost friends reuniting. Users can hover over unfamiliar terms to learn their meaning and usage. Google does caution, however, that “Slang Hang” can occasionally misuse slang or even invent words, urging users to cross-reference information with reliable sources.

    The final experiment, “Word Cam,” utilizes the device’s camera to identify objects in the user’s surroundings and label them in the target language. By simply snapping a photo, Gemini will detect and name objects, providing additional vocabulary to describe them. Google highlights the importance of learning everyday words, noting that while a user might know the word for “window,” they might not know the word for “blinds.”

    Google emphasizes that these experiments are designed to explore how AI can personalize and dynamize independent language learning. The tools currently support a wide range of languages, including Arabic, Chinese (various regions), English (AU, UK, US), French (Canada, France), German, Greek, Hebrew, Hindi, Italian, Japanese, Korean, Portuguese (Brazil, Portugal), Russian, Spanish (LatAm, Spain), and Turkish.

    While these AI-powered tools are still in their early stages, their potential to provide personalized, contextualized, and engaging language learning experiences is undeniable. Whether Google can truly disrupt the existing landscape remains to be seen, but these experiments offer a glimpse into the future of language acquisition, powered by the capabilities of AI.