Claude, Zararlı Konuşmaları Sonlandıracak!


0

Anthropic tarafından geliştirilen yapay zeka sohbet botu Claude, artık bazı konuşmaları sonlandırma yeteneğine sahip. Şirket, bu yenilikle birlikte sistemin sağlığını ve işlevselliğini korumayı amaçlıyor.

Şirket, gerçekleştirdiği testlerde Claude’un, zararlı içerik üretmesi istendiğinde “açıkça sıkıntı belirtileri” gösterdiğini tespit etti. Bu nedenle, kullanıcılarla rahatsız edici konuşmaları sonlandırabilmesi için bu yetenek kazandırıldı. Böylece bot, kendisine zarar veren etkileşimlerden çıkma fırsatına sahip olacak.

Bu bölüm, konuyla ilgili referans noktalarını içerir. (Related Nodes field)

Anthropic, “Claude ve diğer büyük dil modellerinin mevcut veya gelecekteki potansiyel ahlaki statüsü hakkında ciddi belirsizlikler bulunmaktadır” açıklamasında bulundu. Ancak yapılan değişikliğin, yapay zeka sağlığı ve işlevselliğine yönelik çalışmalar çerçevesinde, sohbet botunun rahatsız edici etkileşimlerden uzaklaşabilmesi için gerçekleştirildiği vurgulandı.

Şirket, bu yeniliğin “kullanıcının sürekli olarak zarar verici veya kötüye kullanım içeren taleplerde bulunduğu nadir durumlar için tasarlandığını” ifade etti.

Test sonuçlarına göre, Claude’un “zararlı görevleri yerine getirmeme yönünde güçlü bir eğilimi” bulunuyor. Ayrıca, gerçek kullanıcılarla etkileşimlerde açıkça sıkıntı belirtileri gösterdiği ve simüle edilmiş etkileşimlerde zararlı konuşmaları sonlandırma eğiliminde olduğu belirtildi.

Anthropic, “Bu davranışlar özellikle Claude’un defalarca uymayı reddetmesine rağmen, kullanıcıların zararlı taleplerde bulunduğu durumlarda ortaya çıkmaktadır” şeklinde bir açıklamada bulundu.

Claude’un sohbetleri sonlandırma yeteneğinin uygulanması, bulguları yansıtmakta ve kullanıcı mutluluğunu öncelikli hedef olarak korumaktadır. Claude, kullanıcıların kendilerine veya başkalarına zarar verme riski taşıdığı durumlarda bu yeteneği kullanmaması yönünde talimat almıştır.

Bu yenilik, Anthropic’in önceki aylarda başlattığı “modelin sağlığı ve işlevselliği” programının ardından geldi. Programın başladığı dönemde, şirket insan mutluluğuna değer vermeye devam edeceğini ve modelin sağlığıyla ilgili endişeler yoksa dikkate alınmasına gerek olmadığını dile getirmişti. Ancak yapay zeka uzmanları, geliştirdikleri sistemlerin sağlığını ve işlevselliğini koruma sorusunu ele almanın zamanı geldiğini belirtmişti.


Like it? Share with your friends!

0

What's Your Reaction?

hate hate
0
hate
confused confused
0
confused
fail fail
0
fail
Eğlenceli Eğlenceli
0
Eğlenceli
geeky geeky
0
geeky
love love
0
love
lol lol
0
lol
omg omg
0
omg
win win
0
win
hooptr-admn

0 Comments

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Choose A Format
Personality quiz
Series of questions that intends to reveal something about the personality
Trivia quiz
Series of questions with right and wrong answers that intends to check knowledge
Poll
Voting to make decisions or determine opinions
Story
Formatted Text with Embeds and Visuals
List
The Classic Internet Listicles
Countdown
The Classic Internet Countdowns
Open List
Submit your own item and vote up for the best submission
Ranked List
Upvote or downvote to decide the best list item
Meme
Upload your own images to make custom memes
Video
Youtube and Vimeo Embeds
Audio
Soundcloud or Mixcloud Embeds
Image
Photo or GIF
Gif
GIF format