Etiket: ai code generation

  • # JetBrains Opens the Door to AI Code Generation with Mellum Model

    ## JetBrains Opens the Door to AI Code Generation with Mellum Model

    JetBrains, renowned for its suite of developer tools, has taken a significant step into the world of artificial intelligence by releasing Mellum, its “open” AI model designed for coding. The company announced on Wednesday that Mellum, previously utilized within its software development suites, is now openly accessible on the Hugging Face AI platform.

    Mellum, a code-generating model trained on a massive dataset of over 4 trillion tokens, boasts 4 billion parameters. Its primary function is code completion, intelligently suggesting code snippets based on the surrounding context. To put that in perspective, a million tokens translates to approximately 30,000 lines of code. Parameters, in simple terms, represent a model’s problem-solving capabilities.

    According to a technical report from JetBrains, Mellum is designed for integration into professional developer tools like intelligent code suggestions in integrated development environments (IDEs), AI-powered coding assistants, and for research purposes related to code understanding and generation. The model’s versatility also extends to educational applications and fine-tuning experiments.

    JetBrains emphasizes that Mellum, which is licensed under Apache 2.0, was trained using a diverse collection of datasets, including permissively licensed code from GitHub and English-language articles from Wikipedia. The training process itself took around 20 days, utilizing a cluster of 256 H200 Nvidia GPUs.

    While Mellum is now available, it’s important to note that it requires fine-tuning before it can be effectively used. The base model isn’t designed for immediate, out-of-the-box deployment. JetBrains has provided some pre-tuned models for Python, but they explicitly state that these are intended for evaluating Mellum’s potential capabilities and not for use in production environments.

    The rise of AI-generated code is undoubtedly reshaping the software development landscape, but it also introduces new challenges, particularly in the realm of security. A late 2023 survey by Snyk, a developer security platform, revealed that over 50% of organizations encounter security issues, sometimes or frequently, when using AI-produced code.

    JetBrains acknowledges these potential risks, noting that Mellum may inherit biases present in public codebases and that its code suggestions might not always be secure or vulnerability-free.

    “This is just the beginning,” JetBrains stated in a blog post accompanying the release. “We’re not chasing generality — we’re building focus. If Mellum sparks even one meaningful experiment, contribution, or collaboration, we would consider it a win.” This release signals JetBrains’ commitment to fostering innovation and collaboration within the AI-assisted coding space, while also highlighting the importance of responsible development and awareness of potential security implications.

  • # JetBrains’ten Kodlamaya Yeni Bir Soluk: Açık Kaynaklı Yapay Zeka Modeli Mellum

    ## JetBrains’ten Kodlamaya Yeni Bir Soluk: Açık Kaynaklı Yapay Zeka Modeli Mellum

    Popüler uygulama geliştirme araçlarının arkasındaki şirket olan JetBrains, kodlama için ilk “açık” yapay zeka modelini piyasaya sürdü. Şirket, geçen yıl çeşitli yazılım geliştirme paketleri için yayınladığı kod üreten model Mellum’u, yapay zeka geliştirme platformu Hugging Face’te kullanıma sundu.

    4 trilyondan fazla token üzerinde eğitilen Mellum, 4 milyar parametreye sahip ve özellikle kod tamamlama (yani, çevreleyen bağlama göre kod parçacıklarını tamamlama) için tasarlandı.

    Parametreler kabaca bir modelin problem çözme becerilerine karşılık gelirken, token’lar bir modelin işlediği ham veri parçacıklarıdır. Bir milyon token, yaklaşık 30.000 satır koda karşılık geliyor.

    JetBrains bir teknik raporda “Profesyonel geliştirici araçlarına (örneğin, entegre geliştirici ortamlarında akıllı kod önerileri), yapay zeka destekli kodlama asistanlarına entegrasyon ve kod anlama ve oluşturma araştırmaları için tasarlanan Mellum, eğitim uygulamaları ve ince ayar deneyleri için de çok uygun” açıklamasını yaptı.

    JetBrains, Apache 2.0 lisanslı Mellum’u, GitHub’dan izin verilen lisanslı kod ve İngilizce Wikipedia makaleleri dahil olmak üzere bir dizi veri kümesi üzerinde eğittiğini söylüyor. Eğitim, 256 H200 Nvidia GPU’dan oluşan bir küme üzerinde yaklaşık 20 gün sürdü.

    Mellum’u çalıştırmak biraz çaba gerektiriyor. Temel model kutudan çıkar çıkmaz kullanılamaz; öncelikle ince ayar yapılması gerekiyor. JetBrains, Python için ince ayar yapılmış birkaç Mellum modeli sunsa da, şirket bunların “potansiyel yetenekler hakkında tahmin” için olduğunu, bir üretim ortamına dağıtılmak için olmadığını belirtiyor.

    Yapay zeka tarafından üretilen kod, şüphesiz yazılımın nasıl oluşturulduğunu değiştiriyor, ancak aynı zamanda yeni güvenlik zorlukları da getiriyor. Geliştirici güvenlik platformu Synk tarafından 2023’ün sonlarında yapılan bir ankete göre, kuruluşların %50’den fazlası, yapay zeka tarafından üretilen kodla bazen veya sıklıkla güvenlik sorunları yaşıyor.

    JetBrains, Mellum’un “kamuya açık kod tabanlarında bulunan önyargıları yansıtabileceğini” (örneğin, açık kaynak depolarına benzer bir tarzda kod oluşturma) ve kod önerilerinin mutlaka “güvenli veya güvenlik açıklarından arınmış” olmayacağını belirtiyor.

    JetBrains bir blog yazısında “Bu sadece bir başlangıç” diye yazdı. “Genelliğin peşinde değiliz, odaklanma oluşturuyoruz. Mellum tek bir anlamlı deneyi, katkıyı veya işbirliğini tetiklerse bile, bunu bir kazanım olarak göreceğiz.”