A
Anthropic 17. 2. 2026

Anthropic: Claude Sonnet 4.6

anthropic/claude-sonnet-4.6

Sonnet 4.6 je prémiový 'pracant' pro vývojáře a inženýry, který obětuje nízkou cenu za špičkovou spolehlivost v dlouhém kontextu a agentním chování. Je ideální pro komplexní úkoly, kde selhávají levnější modely.

Killer Feature Kombinace 1M kontextu s robustním 'Computer Use' pro spolehlivou end-to-end automatizaci softwarových úloh.
Skryté riziko Vysoká cena výstupu ($15/1M) může při neopatrné smyčce agenta (loop) vést k extrémně rychlému vyčerpání rozpočtu.
$3 / 1M vstup
$15 / 1M výstup
1.0M kontext
128k max výstup
textimage text Programování a vývoj softwaruAgentní systémy a automatizaceAnalýza dlouhého kontextu

📊 VibeCode skóre

86.7 / 100
Coding (váha 60 %) 85.4
Reasoning (váha 30 %) 85.1
Kontext (váha 10 %) 99

Spolehlivost medium. Coding složka pochází z BridgeBench Quality (agregát 7 sub-testů: UI, security, debugging, refactoring, hallucination, BS detection, reasoning). Reasoning složka z 2 benchmarků (GPQA Diamond, MMLU-Pro, HLE). Agents benchmarky (TAU-bench, MMAU) do skóre nezahrnujeme kvůli nízkému pokrytí napříč modely.

🧪 BridgeBench · nezávislý „vibe coding" benchmark

Quality
85.4
agregát 7 sub-testů
Vibe
80.1
celkový dojem
UI
81.5
generování UI
Security
85.3
detekce zranitelností
Debugging
86.6
ladění chyb
Refactoring
69.4
zlepšení kódu
Hallucination
76.6
odolnost vůči halucinacím
BS detection
91.5
odhalení nesmyslů
Reasoning
37.2
30 těžkých úloh (jiná škála)
Speed
95 tok/s
tokenová rychlost

Zdroj: bridgebench.ai/overall. BridgeBench sjednocuje 7 testů zaměřených na reálné programovací úlohy. Jeho Reasoning kategorie používá 30 velmi těžkých úloh a nelze ji přímo porovnávat s GPQA/MMLU.

🎯 Publikované benchmarky

Benchmark Kategorie Skóre Zdroj
SWE-bench Verified coding 79.6% ↗ provider
LiveCodeBench coding 82.09% ↗ nezávislý
GPQA Diamond reasoning 89.9% ↗ provider
MMLU-Pro reasoning 79.2% ↗ nezávislý

Found official and independent benchmark scores for Claude Sonnet 4.6 (released February 2026). SWE-bench Verified is consistently reported at 79.6%. GPQA Diamond is 89.9% per provider reports, and tau-bench retail is 91.7%. Some benchmarks like Aider Polyglot and AIME 2024 lacked definitive standard scores for this exact model (AIME 2025 was reported instead).

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Anthropic Claude Sonnet 4.6
← Právě prohlížíte
Gemini je levnější ($2.00 vs $3.00 vstup, $12.00 vs $15.00 výstup) Gemini nabízí stejné kontextové okno (1M) za nižší cenu a je silným konkurentem v multimodálním zpracování, ačkoliv Sonnet může mít navrch v čistém kódování.
OpenAI GPT-5.2 Codex
GPT-5.2 Codex je levnější na vstupu ($1.75), podobný na výstupu ($14.00) Přímý konkurent v oblasti programování. Codex je levnější pro analýzu kódu, ale má menší kontext (400k vs 1M), což Sonnet zvýhodňuje u velkých repozitářů.
Anthropic Claude Opus 4.6
Opus je výrazně dražší ($5.00/$25.00) Interní konkurence. Sonnet 4.6 nabízí většinu schopností Opusu za 60 % ceny, což z něj činí preferovanou volbu pro většinu komerčních aplikací kromě nejnáročnějšího reasoning.

🎯 Rozhodovací pomocník

Použij když...

  • Refactoring rozsáhlých legacy kódových bází
  • Autonomní testování webových aplikací (QA)
  • Tvorba dlouhých technických specifikací

Nepoužívej když...

  • Jednoduché chatboty (příliš drahé)
  • Zpracování audia v reálném čase
  • Hromadnou klasifikaci krátkých textů (použijte Haiku nebo Mistral)
Ideální pro:
Seniorní softwaroví inženýřiVývojáři automatizačních agentůTechničtí analytici zpracovávající velké dokumenty

💪 Silné a slabé stránky

+ Silné stránky

Kontext a Výstup

Kombinace 1M vstupního kontextu a 128k výstupních tokenů umožňuje zpracování a generování celých softwarových modulů nebo rozsáhlých dokumentů v jediném průchodu.

Agentní schopnosti

Pokročilá integrace 'Computer Use' pro automatizaci workflow a web QA, což modelu umožňuje efektivněji interagovat s externími nástroji než standardní textové modely.

Programování

Specializace na navigaci v komplexních bázích kódu a iterativní vývoj, konkurující dedikovaným kódovacím modelům.

Slabé stránky

Cenová politika

Cena $3.00/$15.00 za 1M tokenů je výrazně vyšší než u konkurence (např. Google Gemini 3 Pro je o 33 % levnější na vstupu), což snižuje atraktivitu pro velkoobjemové zpracování dat.

Omezené modality

Model podporuje pouze text a vstup obrazu, chybí nativní generování obrázků nebo zpracování audia, které nabízí konkurence (OpenAI, Google).

📝 Detailní popis

Sonnet 4.6 je dosud nejvýkonnější model třídy Sonnet od společnosti Anthropic, s špičkovým výkonem v oblasti kódování, agentů a profesionální práce. Vyniká v iterativním vývoji, komplexní navigaci v kódu, end-to-end projektovém řízení s pamětí, vytváření propracovaných dokumentů a spolehlivém používání počítače pro webové QA a automatizaci pracovních postupů.

Unikátní charakteristiky

Sonnet 4.6 představuje střední třídu nové generace modelů Anthropic s masivním kontextovým oknem 1M tokenů a specializací na ‘Computer Use’ (přímé ovládání rozhraní). Model je optimalizován pro udržení konzistence v dlouhých konverzacích a správu komplexních projektů, přičemž nabízí vysoký výstupní limit 128k tokenů pro generování rozsáhlého kódu.

Silné stránky

Kontext a Výstup

Kombinace 1M vstupního kontextu a 128k výstupních tokenů umožňuje zpracování a generování celých softwarových modulů nebo rozsáhlých dokumentů v jediném průchodu.

Agentní schopnosti

Pokročilá integrace ‘Computer Use’ pro automatizaci workflow a web QA, což modelu umožňuje efektivněji interagovat s externími nástroji než standardní textové modely.

Programování

Specializace na navigaci v komplexních bázích kódu a iterativní vývoj, konkurující dedikovaným kódovacím modelům.

Slabé stránky

Cenová politika

Cena $3.00/$15.00 za 1M tokenů je výrazně vyšší než u konkurence (např. Google Gemini 3 Pro je o 33 % levnější na vstupu), což snižuje atraktivitu pro velkoobjemové zpracování dat.

Omezené modality

Model podporuje pouze text a vstup obrazu, chybí nativní generování obrázků nebo zpracování audia, které nabízí konkurence (OpenAI, Google).

🔗 Další modely od Anthropic