Dünyanın en kıymetli şirketini büyük bir kayba sürükleyen, hisselerini sarsan ve bazıları için yapay zekada yeni bir dönemin başlangıcını simgeleyen bir gelişme yaşandı.
İki yaşını bile doldurmayan Çin merkezli bir firma, Silikon Vadisi’nde büyük bir etki yaratarak, teknoloji alanında ilgi çeken tartışmalara yol açtı.
DeepSeek’in kısa süre içerisinde piyasaya sunduğu iki farklı model, performansları ve inanılmaz derecede düşük maliyetleriyle global ölçekte kaygı, merak ve heyecan uyandırıyor.
ABD ve Çin arasındaki teknoloji mücadelesinde yeni bir sayfa açan bu olay, Batı’nın üstünlüğünü korumak için farklı yollar araması gerektiğini düşündürüyor.
Logos, bu hafta DeepSeek’in yarattığı sarsıntının yarattığı etkileri, yapay zekanın geleceği için taşıdığı anlamları, yeni modellerle ilgili iddiaları ve güvenlik konusundaki endişeleri detaylı bir şekilde ele alıyor.
1) DeepSeek: OpenAI’a rakip
Çin’in Hangzhou kentinde 2023 yılında kurulan DeepSeek, ilk geniş dil modelini de aynı yıl piyasaya sürdü. Ancak Aralık 2024 ve ardından geçen hafta tanıtılan V3 ve R1 modellerinin, OpenAI gibi devlerin ürünlerini geride bıraktığına dair iddialar daha önce fazla dikkat çekmemişti.
V3, 27 Ocak Pazartesi itibarıyla ABD’de en çok indirilen iPhone uygulaması oldu. DeepSeek, ABD merkezli şirketlerle yarıştığı bu modelleri daha uygun fiyatlarla sunuyor. Bu durum, Nvidia’dan Microsoft’a kadar olan teknoloji devlerinin piyasa değerinin yüzlerce milyar dolar kaybetmesine neden oldu.
Bu bölüm, konuyla ilgili referans noktalarını içerir. (Related Nodes field)
Bağımsız testlerde V3, OpenAI’ın GPT-4o ve Anthropic’in Claude Sonnet 3.5 gibi araçların performansına erişti ve Meta’nın Llama 3.1’i ile Alibaba’nın Qwen2.5’ini geride bıraktı. DeepSeek, V3 modelinin yalnızca iki ayda 6 milyon dolardan düşük bir maliyetle eğitildiğini savunuyor ve bunu gerçekleştirmek için Nvidia’nın H800 çiplerinden sadece 2 bin adet kullandığını belirtiyor. Karşılaştırıldığında, OpenAI’ın GPT-4’ün geliştirilmesi için 80-100 milyon dolara yakın bir bütçe harcandığı tahmin ediliyor. Ancak uzmanlar, V3 gelişimi için harcanan miktarın belirtilenin çok üstünde olduğunu düşünüyor.
DeepSeek ayrıca, 20 Ocak Pazartesi günü tanıtılan R1 modelinin birçok testte OpenAI’ın GPT-4’ünden daha iyi bir performans sergilediğini öne sürüyor. Bu iki model, V3 veya ChatGPT gibi diğer araçlardan farklı olarak “düşünebilen” ya da “mantık yürütebilen” yapay zeka araçları olarak tanımlanıyor.
Bu yapay zeka modelleri, doğru cevaplarını kontrol edebiliyor ve cevap süresi uzadıkça hata yapma ihtimalleri belirgin şekilde azalıyor. Dolayısıyla bu özellikleri, özellikle bilimsel araştırmalarda önem kazanıyor.
R1’in değerinin ve geliştirilmesi için harcanan bütçenin ne kadar olduğu henüz net değil. Ancak modelin açık kaynak olarak yayımlanması, kodunun inceleme ve değişiklik yapılmasına olanak tanıyarak, kapalı kapılar ardında çalışan OpenAI’a alternatif bir yaklaşım sunduğu söylenebilir.
Çinli firma, iki modelini de rakiplerine oranla çok daha uygun fiyatlarla piyasaya sunuyor. Tüm bunlar göz önüne alındığında, yapay zeka sektöründe yapılan harcamaların gerçekten gerekli olup olmadığı sorusu günümüz teknoloji tartışmalarının merkezine yerleşiyor.
2) Nvidia’da büyük çöküş
Son yıllarda yapay zeka alanındaki gelişmelerle birlikte çip satışlarının artması sebebiyle Nvidia, dünyanın en değerli şirketi
0 Comments