Anthropic’ten şimdiye kadarki en yetenekli Sonnet modeli: Sonnet 4.6

Batmantv.net

Yayınlama: 18.02.2026

A⁺

A^-

Yaklaşık iki hafta önce yeni yapay zeka modeli Claude Opus 4.6’yı duyuran Anthropic, şimdi de Sonnet modelinin yeni bir sürümü olan Sonnet 4.6’yı piyasaya sürdü. Model, kodlama, bilgisayar kullanımı, uzun bağlamlı muhakeme, ajan planlama, bilgi çalışması ve tasarım alanlarında tam bir yükseltme olarak karşımıza çıkıyor. Şirket, paylaştığı gönderide kodlama, talimatları takip etme ve bilgisayar kullanımı alanlarında yapılan iyileştirmelere dikkat çekti.

Sonnet 4.6’nın beta sürümü, 1 milyon tokenlik bir bağlam penceresi içerecek. bu da Sonnet için daha önce mevcut olan en büyük bağlam penceresinin iki katı büyüklüğüne denk geliyor. Anthropic’in belirttiğine göre; yeni bağlam penceresi tek bir istekte tüm kod tabanlarını, uzun sözleşmeleri veya düzinelerce araştırma makalesini barındıracak kadar yeterli.

Sonnet 4.6’nın performansı

Sonnet 4.6’nın piyasaya sürülmesiyle birlikte pek çok ölçütte dikkat çekici sonuçlar elde ettiğini söyleyebiliriz. Bunlara bilgisayar kullanımı için OS World ve yazılım mühendisliği için SWE-Bench de dahil. Gerçek dünya yazılım kodlaması için endüstri standardı test olan SWE-bench Verified‘da Sonnet 4.6, yüzde 79,6 puan alarak Opus 4.6’nın yüzde 80,8’ine çok yakın bir performans gösterdi.

Ajan bilgisayar kullanımı ölçütü OSWorld-Verified’da Sonnet 4.6, yüzde 72,5 puan aldı ve Opus 4.6’nın yüzde 72,7’sine neredeyse eşitti. Ofis görevleri ölçütü GDPval-AA Elo’da, Sonnet 4.6, 1633 puan alarak Opus 4.6’nın 1606 puanını aştı. Ajan finansal analizinde Sonnet 4.6 yüzde 63,3’lük bir puan alarak, yüzde 60,1’lik puanla Opus 4.6 dahil olmak üzere karşılaştırmadaki tüm modelleri geride bıraktı.

Ayrıca model, insan zekasına özgü becerileri ölçmek için tasarlanan ARC-AGI-2‘de elde ettiği yüzde 60,4’lük puan ile dikkatleri üzerine çekmeyi başardı. Bu puan, Sonnet 4.6’yı çoğu benzer modelin üzerine çıkarıyor. Öte yandan model, bu ölçütte Opus 4.6, Gemini 3 Deep Think ve GPT 5.2’nin geliştirilmiş bir versiyonu gibi modellerin gerisinde kalıyor. Bununla beraber Sonnet 4.6’nın, işletmelerin en çok önem verdiği birçok kategoride çalıştırılması yaklaşık beş kat daha pahalı olan modelleri yakalamayı başardığını ya da geride bıraktığını söyleyebiliriz.

Anthropic’in bilgisayar kullanımı özelliği zaman içinde nasıl gelişti?

Sonnet 4.6 ile birlikte Anthropic’in bilgisayar kullanımı konusundaki ilerlemesi de dikkat çekiyor. Bilgisayar kullanımı, bir yapay zekanın bir insan gibi bilgisayarı kullanma, fareye tıklama, klavyeyle yazma ve modern API’lar içermeyen yazılımları kullanma becerisi anlamına geliyor.

Bu özelliği ilk kez Ekim 2024’te tanıtan Anthropic, o dönemde özelliğin hala deneysel, bazen hantal ve hataya açık olduğunu dile getirmişti. O zamandan bu yana bilgisayar kullanımı ölçütünde gösterilen performans dikkate değer bir artış gösterdi. OSWorld ölçütünde Claude Sonnet 3.5, Ekim 2024’te yüzde 14,9 puan aldı. Sonnet 3.7, Şubat 2025’te yüzde 28,0’a ulaştı. Sonnet 4, Haziran ayında yüzde 42,2’ye ulaştı. Sonnet 4.5, Ekim ayında yüzde 61,4’e tırmandı. Şimdi Sonnet 4.6, yüzde 72,5’e ulaşarak 16 ayda neredeyse beş katlık bir gelişme gösteriyor.

Claude Sonnet 4.6, tüm Claude planlarında, Claude Cowork, Claude Code, API ve tüm büyük bulut platformlarında artık kullanılabilir. Sonnet 4.6, Free ve Pro plan kullanıcıları için varsayılan model olacak. Geliştiriciler, claude-sonnet-4-6‘ya Claude API aracılığıyla hemen erişebilir. Anthropic’in güncellenmiş Haiku modelinin ise önümüzdeki haftalarda piyasaya sürülmesi bekleniyor.

Batmantv.net

Benzer Konular

Anthropic, yeni programı ile yapay zeka “model refahını” incelemeye odaklanıyor

OpenAI rakibi Anthropic, dün model refahı olarak adlandırdığı kavramı araştırmak ve model refahına hazırlık yapmak için bir araştırma programı başlattığını duyurdu. Anthropic program kapsamında bir yapay zeka modelinin refahının ahlaki olarak dikkate alınmayı hak edip etmediğini belirlemenin yollarını araştıracak. Aynı şekilde şirketin, modelin sıkıntı belirtilerinin potansiyel önemi ve olası düşük...

25.04.2025

Divergent, 2.3 milyar dolar değerleme üzerinden 290 milyon dolar yatırım aldı

Üretim teknolojileri geliştiren Divergent, 290 milyon dolar yatırım aldı. Şirketin 290 milyon dolarlık E serisi yatırım turuna Rochefort Asset Management liderlik etti. Divergent’in değerlemesi 2.3 milyar dolara yükseldi. ABD merkezli Divergent, yeni aldığı yatırımı üretim kapasitesini artırmak, yeni ürünler geliştirmek ve daha fazla çalışan işe almak için kullanacağını açıkladı. Divergent, 2014 yılında...

16.09.2025

Yapay zeka destekli siber güvenlik girişimi Exaforce, 75 milyon dolar yatırım aldı

Siber güvenlik sistemleri için yapay zeka agentları sunan bir girişim olarak karşımıza çıkan Exaforce, yeni bir yatırım aldığını duyurdu. Exaforce tarafından aktarılan bilgilere göre girişim, A serisi yatırım turunda 75 milyon dolar yatırım aldı. Exaforce’un 75 milyon dolarlık A serisi yatırım turu, Khosla Ventures, Mayfield ve Thomvest Ventures‘ın ortak liderliğinde...

18.04.2025

X’ten ayrılan Linda Yaccarino, sağlık teknolojisi platformu eMed’in yeni CEO’su oldu

X’in eski CEO’su Linda Yaccarino’nun yaklaşık iki yıl süren görev süresinin ardından koltuğunu bırakma kararı aldığını geçtiğimiz temmuz ayında sizlere aktarmıştık. Deneyimli yöneticinin yeni adresinin neresi olduğu belli oldu. Linda Yaccarino, yapay zeka destekli sağlık teknolojisi platformu eMed’in yeni CEO’su olarak göreve başladı. Yaccarino, GLP-1 sınıfı ilaç kullanan hastalar için...

06.08.2025

Agentic otomasyon ve yapay zeka yazılım şirketi UiPath’in öne çıkan verileri

Agentic otomasyon ve yapay zeka yazılım şirketi UiPath, bugün UiPath Türkiye Genel Müdürü Tuğrul Cora‘nın katılımıyla gerçekleşen basın toplantısında RPA, agentic yapay zeka teknolojileri ve bu teknolojilerin Türkiye’deki yetenek dönüşümüne etkisi konuşuldu. Son dönemde agentic AI platformuyla öne çıkan UiPath, Türkiye’de 400’e yakın kurumsal müşteriye hizmet veriyor. Küresel ölçekte ise 50’den fazla ülkede faaliyet gösteren...

13.01.2026

Yurt dışı alışverişlerde gümrük muafiyeti kaldırıldı: 30 euro limiti tarihe karıştı

Yurt dışından yapılan düşük tutarlı alışverişlerde uygulanan gümrük muafiyeti sona erdi. Resmi Gazete’de yayımlanan Cumhurbaşkanı Kararı ile birlikte, posta ve hızlı kargo yoluyla gelen ürünlerde gümrüksüz alışveriş uygulaması kaldırıldı. 6 Ocak 2026 tarihli ve 10813 sayılı Cumhurbaşkanı Kararı, 4458 sayılı Gümrük Kanunu’nun ilgili maddelerine dayanılarak yürürlüğe girdi. Kararla birlikte, bugüne...

07.01.2026

Bir Yorum Yazın

[ Yoruma cevap yazmaktan vazgeç ]

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.