Çin merkezli teknoloji şirketi DeepSeek, yeni yapay zeka modelini açık kaynaklı olarak tanıttı. Şirket, geliştirdikleri bu yeni araçların, OpenAI’ın benzer modellerini geride bıraktığını iddia ediyor.
DeepSeek, R1 serisinin önizleme versiyonunu Kasım 2024’te kullanıma sunmuştu. 20 Ocak Pazartesi günü ise MIT lisansı çerçevesinde bu seriyi piyasaya sürdü.
MIT lisansı, yapay zeka modelinin kodunun incelenmesine, değiştirilmesine ve ticari amaçlarla kullanılmasına imkan tanıyor.
Bu bölüm, konuyla ilgili referans noktalarını içerir. (Related Nodes field)
R1, OpenAI’nın geçen yıl çıkarılan o1 serisi gibi “düşünebilen” ya da “mantık yürüten” yapay zeka sınıfında yer almakta. Geniş dil modellerinden farklı olarak, bu araçlar verdikleri yanıtların doğruluğunu kontrol etme yeteneğine sahip. Bu durum, cevap verme süresini uzatsa da hata yapma olasılığını azaltan “düşünce zinciri” sistemi, özellikle bilimsel araştırmalar açısından büyük bir avantaj sunuyor.
DeepSeek, R1’in matematik, kelime problemleri ve programlama gibi alanlardaki testlerde OpenAI’ın o1 serisini geride bıraktığını belirtiyor. Şirketin verileri, R1’in geri kaldığı testlerde bile iki model arasında yalnızca çok az bir fark olduğunu gösteriyor.
Diğer yandan, Ars Technica, yapay zeka testlerinin gerçek performansı her zaman tam olarak yansıtmadığına dikkat çekiyor ve bu sonuçların henüz bağımsız bir şekilde doğrulanmadığını ifade ediyor.
R1’in en gelişmiş versiyonu 671 milyar parametre içeriyor. Bu parametreler, modelin problem çözme becerilerinin etkinliğini göstermekte.
Şirket, 1,5 milyardan 70 milyar parametreye kadar değişen “damıtılmış” versiyonları da piyasaya sürdü. Bunların en küçük versiyonu dizüstü bilgisayarlarda çalışabilirken, en gelişmiş versiyonu ise daha güçlü bir donanım gerektirmektedir.
TechCrunch’a göre, DeepSeek’in yeni yapay zeka ailesi, performansının yanı sıra o1’ten yaklaşık %90 daha ucuz fiyatlarla sunulmasıyla da dikkat çekiyor. Açık kaynaklı modellerin genellikle o1 gibi rakiplerinden geri kaldığı düşünülse de, R1, teknoloji tutkunlarının yoğun ilgisini çekiyor.
George Mason Üniversitesi’nde yapay zeka üzerinde çalışan Dean Ball, sosyal medya paylaşımında DeepSeek’in damıtılmış modellerinin etkileyici performansına dikkat çekerek, bu tür muhakeme yeteneğine sahip cihazların yaygınlaşacağını öngörüyor.
Yeni yapay zeka modeli, Çin merkezli diğer araçlar gibi bir zorlukla karşı karşıya kalıyor. Asya ülkesi yasalarına göre “temel sosyalist değerleri” içermesi gereken yapay zeka araçları, Tayvan’ın özerkliği gibi bazı konularda yanıt veremiyor. Bununla birlikte, model, Çin dışında yerel olarak çalıştırıldığında bu sınırlamaların etkisi ortadan kalkıyor.
ABD ve Çin arasındaki yapay zeka yarışı
DeepSeek’in en son serisi, ABD’nin yapay zeka teknolojilerinin Çin’e satışına yönelik daha sıkı kısıtlamalar düşündüğü bir dönemde tanıtıldı. Önceden, Çin’deki şirketlerin gelişmiş yapay zeka çipleri satın alması engellenmişti. Ancak, eski Başkan Joe Biden yönetiminin önerdiği yeni düzenlemeler geçerlilik kazanırsa, kısıtlamaların kapsamı genişleyecek. Uzmanların değerlendirmelerine göre, bu değişikliğin amacı, Çin’in özellikle Ortadoğu ülkeleri aracılığıyla ABD çiplerine erişimini engellemektir. 20 Ocak’ta göreve başlayacak olan Donald Trump, bu öneriler hakkında henüz bir açıklama yapmadı.
Buna karşın, son gelişmeler ışığında ABD’nin kısıtlamalarının, Çin merkez
0 Comments