Etiket: phi 4

  • # Microsoft’tan Yeni Yapay Zeka Modeli: Phi 4, Büyük Sistemlerle Yarışıyor

    ## Microsoft’tan Yeni Yapay Zeka Modeli: Phi 4, Büyük Sistemlerle Yarışıyor

    Microsoft, yapay zeka geliştiricilerine yönelik yeni “açık” yapay zeka modellerini tanıttı. Bu modellerin en dikkat çekeni olan Phi 4, en azından bir kıyaslama testinde OpenAI’ın o3-mini modeline rakip olabilecek düzeyde performans sergiliyor.

    Yeni tanıtılan ve izin verilebilir lisanslara sahip modeller – Phi 4 mini reasoning, Phi 4 reasoning ve Phi 4 reasoning plus – “muhakeme” yeteneklerine odaklanıyor. Bu, karmaşık sorunlara çözüm üretirken daha fazla zamanı doğruluk kontrolüne ayırabildikleri anlamına geliyor. Bu modeller, Microsoft’un bir yıl önce başlattığı ve yapay zeka geliştiricilerine uç noktalarda uygulama geliştirme imkanı sunan Phi “küçük model” ailesini genişletiyor.

    **Phi 4 Modellerinin Özellikleri:**

    * **Phi 4 mini reasoning:** Çinli yapay zeka girişimi DeepSeek’in R1 muhakeme modeli tarafından üretilen yaklaşık 1 milyon sentetik matematik problemi üzerinde eğitildi. Yaklaşık 3.8 milyar parametreye sahip olan Phi 4 mini reasoning, Microsoft’a göre hafif cihazlarda “gömülü özel ders” gibi eğitim uygulamaları için tasarlandı.
    * **Phi 4 reasoning:** 14 milyar parametreye sahip bu model, “yüksek kaliteli” web verilerinin yanı sıra OpenAI’ın o3-mini modelinden alınan “özenle seçilmiş demolar” kullanılarak eğitildi. Microsoft, bu modelin matematik, bilim ve kodlama uygulamaları için ideal olduğunu belirtiyor.
    * **Phi 4 reasoning plus:** Microsoft’un daha önce piyasaya sürdüğü Phi-4 modelinin, belirli görevlerde daha iyi doğruluk elde etmek amacıyla muhakeme yetenekleri eklenmiş versiyonu. Microsoft, Phi 4 reasoning plus’ın, önemli ölçüde daha fazla parametreye (671 milyar) sahip olan R1’in performans seviyelerine yaklaştığını iddia ediyor. Şirketin yaptığı dahili testler, Phi 4 reasoning plus’ın OmniMath matematik beceri testinde o3-mini ile eşleştiğini gösteriyor.

    Microsoft, yeni modelleri şu sözlerle değerlendiriyor: “Damıtma, takviyeli öğrenme ve yüksek kaliteli veriler kullanarak, bu [yeni] modeller boyut ve performansı dengeliyor. Düşük gecikmeli ortamlar için yeterince küçükler, ancak çok daha büyük modellere rakip olan güçlü muhakeme yeteneklerini koruyorlar. Bu karışım, kaynakları sınırlı cihazların bile karmaşık muhakeme görevlerini verimli bir şekilde gerçekleştirmesini sağlıyor.”

    Phi 4 mini reasoning, Phi 4 reasoning ve Phi 4 reasoning plus modelleri, detaylı teknik raporlarla birlikte yapay zeka geliştirme platformu Hugging Face’te kullanıma sunuldu. Bu modeller, yapay zeka alanında daha küçük boyutlu modellerin de büyük sistemlerle rekabet edebileceğini gösteren önemli bir adım olarak değerlendiriliyor.

  • # Microsoft’s New Phi 4 AI Family Packs a Punch, Rivals Larger Models

    ## Microsoft’s New Phi 4 AI Family Packs a Punch, Rivals Larger Models

    Microsoft has unveiled its latest generation of “open” AI models, the Phi 4 family, boasting impressive performance relative to their size. The new models, announced Wednesday, aim to provide developers with a foundation for building AI applications, particularly for resource-constrained environments.

    The Phi 4 lineup includes three permissively licensed models: Phi 4 mini reasoning, Phi 4 reasoning, and Phi 4 reasoning plus. These models are specifically designed for “reasoning,” enabling them to dedicate more computational resources to fact-checking and problem-solving. This focus allows them to tackle complex tasks more effectively.

    The smallest of the trio, Phi 4 mini reasoning, is a 3.8-billion-parameter model trained on synthetic math problems generated by DeepSeek’s R1 reasoning model. Microsoft envisions this model primarily for educational purposes, highlighting its potential for “embedded tutoring” on lightweight devices.

    Phi 4 reasoning steps up to 14 billion parameters and is trained on a combination of high-quality web data and curated examples from OpenAI’s o3-mini. This model excels in math, science, and coding-related applications, according to Microsoft.

    Finally, Phi 4 reasoning plus is an adaptation of Microsoft’s existing Phi-4 model, refined for enhanced reasoning capabilities and accuracy. Impressively, Microsoft claims that Phi 4 reasoning plus approaches the performance levels of DeepSeek’s R1, despite R1 having a significantly larger parameter count of 671 billion. Internal benchmarks also show Phi 4 reasoning plus matching OpenAI’s o3-mini on the OmniMath benchmark.

    The launch of the Phi 4 family underscores Microsoft’s commitment to developing efficient and accessible AI models. As Microsoft stated in a blog post, these models “balance size and performance” through the use of techniques like distillation, reinforcement learning, and high-quality data. This approach allows even devices with limited resources to handle complex reasoning tasks efficiently.

    All three models – Phi 4 mini reasoning, Phi 4 reasoning, and Phi 4 reasoning plus – are available on the AI development platform Hugging Face, accompanied by detailed technical documentation. Developers can now explore and leverage these powerful, yet compact, AI models for a wide range of applications.