Çin merkezli DeepSeek, gelişmiş yapay zeka (AI) modellerinin hızlı bir şekilde popülerlik kazanmasının ardından dikkatleri üzerine çekmeyi başardı. Şirketin AI modellerini eğitmek için harcadığı bütçe ise yalnızca 6 milyon dolardan az. Buna karşın, OpenAI’nin DALL-E 3 modeli için yapılan yatırım yaklaşık 100 milyon dolar seviyesindeydi.
DeepSeek’in elde ettiği başarı, yalnızca App Store’da birinci sıraya yerleşmekle kalmayıp aynı zamanda NVIDIA’nın ABD pazarında 400 milyar dolarlık değer kaybına sebep olan önemli bir gelişme olarak da değerlendiriliyor. Bu durum, hizmetin siber saldırılara maruz kalmasına ve kapasite sıkıntıları yaşamasına neden oldu.
Janus-Pro’nun Devrim Niteliğindeki Gelişimi
Bu zorlukların üstesinden gelmeye çalışan DeepSeek, Janus-Pro adını taşıyan heyecan verici bir açık kaynaklı metinden görsele AI modelini tanıttı. Bu yeni model, geniş bir yankı uyandırarak görüntü üretiminde OpenAI’nin DALL-E 3, Stability AI’nin Stable Diffusion gibi diğer benzer yapay zeka modellerinden birçok kritere göre daha iyi performans gösteriyor.
Janus-Pro, bir önceki yıl sonunda piyasaya sürülen Janus modelinin geliştirilmiş versiyonudur. Model, 1 milyar ile 7 milyar parametre arasında değişen farklı boyut seçenekleriyle kullanıcılarla buluşuyor. DeepSeek’in paylaştığı bilgilere göre, en güçlü modeli olan Janus-Pro-7B, rakipleri PixArt-alpha, Emu3-Gen ve SDXL gibi seçenekleri GenEval ve DPG-Bench gibi endüstri standartlarında geride bırakarak görüntü üretimi ve analizinde dikkate değer bir başarı sergiliyor. Janus-Pro-7B, HuggingfaceAI platformu üzerinden ücretsiz olarak indirilebiliyor ve bu platform, makine öğrenimi alanında oldukça geniş bir kullanıcı kitlesine sahip.

Yeni Yaklaşım: Görsel Kodlayıcı ve Esneklik
Janus-Pro-7B, görsel kodlama süreçlerini ayrıştırmaya yardımcı olan birleşik bir transformatör mimarisi kullanıyor. Bu yaklaşım, yalnızca görsel kodlayıcının üretim ve anlayış rollerindeki çatışmayı hafifletmekle kalmıyor, aynı zamanda modelin esnekliğini önemli ölçüde artırıyor. Janus-Pro, belirli görevler için tasarlanmış modellere kıyasla çoklu görevlerde daha etkili bir performans sergiliyor. Ancak, özel amaçlı modellerin sağladığı performansın gerisinde kalmıyor.
Rekabetçi Ortam ve Uygulama Olanakları
Janus-Pro’nun tanıtılması, DeepSeek’in önceki başarılarının yanı sıra, GPT-4 benzeri işlevsellik sunan yeni R1 dil modelinin de etkisiyle büyük bir rekabet ortamı oluşturdu. Bu gelişmiş modellerin düşük maliyetle geliştirilmesi, ABD yapay zeka endüstrisinde önemli bir etki yarattı. Yenilikçi modeller, sektördeki geleneksel yapay zeka uygulamalarıyla karşılaştırıldığında daha uygun fiyatlarla önemli bir dönüşüm vaat ediyor.

0 Comments