Microsoft, yapay zeka alanındaki yenilikçi çalışmalarıyla adından söz ettirmeye devam ediyor. Son olarak, metin, ses ve görüntü üretme yeteneklerine sahip üç yeni yapay zeka modelini tanıttı: MAI-Transcribe-1, MAI-Voice-1 ve MAI-Image-2. Bu modeller, farklı alanlarda kullanıcıların iş süreçlerini daha verimli hale getirmeyi amaçlıyor.
Microsoft'un Üç Yeni Yapay Zeka Modeli
Microsoft, yapay zeka alanındaki yenilikçi çalışmalarıyla adından söz ettirmeye devam ediyor. Son olarak, metin, ses ve görüntü üretme yeteneklerine sahip üç yeni yapay zeka modelini tanıttı: MAI-Transcribe-1, MAI-Voice-1 ve MAI-Image-2. Bu modeller, farklı alanlarda kullanıcıların iş süreçlerini daha verimli hale getirmeyi amaçlıyor.
MAI-Transcribe-1: Çok Dilli Metin Dönüşümü
MAI-Transcribe-1, 25 farklı dildeki konuşmaları metne dönüştürebilen bir yapay zeka modeli olarak öne çıkıyor. Microsoft'un Azure Fast hizmetinden 2,5 kat daha hızlı olan bu model, arka plan gürültüsü ve düşük kaliteli ses kayıtları gibi zorlu koşullarda dahi üstün performans sergiliyor. Özellikle kafe, ofis ve konser gibi gerçek yaşam senaryolarında başarılı sonuçlar veren model, hem çevrimdışı hem de çevrimiçi transkripsiyon ihtiyaçlarına çözüm sunuyor. Copilot'un Sesli Modu ve Microsoft Teams ile entegre edilecek olan model, saat başına 0,36 dolarlık fiyatıyla da dikkat çekiyor.
MAI-Voice-1: Hızlı ve Özel Ses Üretimi
Ses üretme alanında devrim niteliğinde olan MAI-Voice-1, kullanıcıların bir saniyede 60 saniyelik ses oluşturmasına olanak tanıyor. Bu model, kişiselleştirilmiş sesler üretmek isteyen kullanıcılar için ideal bir çözüm sunuyor. 1 milyon karakter başına 22 dolarlık fiyatlandırmasıyla erişilebilir bir seçenek olan MAI-Voice-1, kullanıcıların yaratıcı projelerinde hız kazanmasına yardımcı oluyor.
MAI-Image-2: Gerçekçi Görüntü Üretimi
Görüntü üretiminde fotogerçekçiliği bir adım öteye taşıyan MAI-Image-2, doğal ışık, doğru cilt tonları ve gerçekçi ortamlar sunarak post-prodüksiyon sürecini kısaltmayı hedefliyor. Poster, infografik ve diyagram gibi çeşitli içerik türlerinde tutarlı sonuçlar üreten model, kullanıcıların görsel projelerinde zamandan tasarruf etmelerini sağlıyor. Metin girdisi için 1 milyon token başına 5 dolarlık ve görüntü çıktısı için 33 dolarlık fiyatlandırması ile piyasada yerini alan model, ilk olarak MAI Playground'da tanıtıldı.
Microsoft'un Yapay Zeka Vizyonu
Microsoft'un MAI Superintelligence ekibi tarafından geliştirilen bu modeller, şirketin yapay zeka araştırmalarındaki kararlılığını gösteriyor. Mustafa Suleyman liderliğinde yürütülen çalışmalar, Microsoft'un OpenAI ile olan ortaklığını da sürdürüyor. Microsoft, geçtiğimiz aylarda tanıttığı Phi-4-reasoning-vision-15B modeli ile donanım açısından verimli çözümler sunmaya devam ederken, MAI serisi ile de yapay zeka alanında yenilikçi adımlar atıyor.



