Anthropic 17. 2. 2026

Anthropic: Claude Sonnet 4.6

Item: Anthropic: Claude Sonnet 4.6
Author: Patrick Zandl

anthropic/claude-sonnet-4.6

Sonnet 4.6 je prémiový 'pracant' pro vývojáře a inženýry, který obětuje nízkou cenu za špičkovou spolehlivost v dlouhém kontextu a agentním chování. Je ideální pro komplexní úkoly, kde selhávají levnější modely.

✦

Killer Feature Kombinace 1M kontextu s robustním 'Computer Use' pro spolehlivou end-to-end automatizaci softwarových úloh.

⚠

Skryté riziko Vysoká cena výstupu ($15/1M) může při neopatrné smyčce agenta (loop) vést k extrémně rychlému vyčerpání rozpočtu.

$3 / 1M vstup

$15 / 1M výstup

1.0M kontext

128k max výstup

Vyzkoušet na OpenRouter

textimage text Programování a vývoj softwaruAgentní systémy a automatizaceAnalýza dlouhého kontextu

📊 VibeCode skóre

86.7 / 100

Coding (váha 60 %) 85.4

Reasoning (váha 30 %) 85.1

Kontext (váha 10 %) 99

Spolehlivost medium. Coding složka pochází z BridgeBench Quality (agregát 7 sub-testů: UI, security, debugging, refactoring, hallucination, BS detection, reasoning). Reasoning složka z 2 benchmarků (GPQA Diamond, MMLU-Pro, HLE). Agents benchmarky (TAU-bench, MMAU) do skóre nezahrnujeme kvůli nízkému pokrytí napříč modely.

🧪 BridgeBench · nezávislý „vibe coding" benchmark

Quality

85.4

agregát 7 sub-testů

Vibe

80.1

celkový dojem

81.5

generování UI

Security

85.3

detekce zranitelností

Debugging

86.6

ladění chyb

Refactoring

69.4

zlepšení kódu

Hallucination

76.6

odolnost vůči halucinacím

BS detection

91.5

odhalení nesmyslů

Reasoning

37.2

30 těžkých úloh (jiná škála)

Speed

95 tok/s

tokenová rychlost

Zdroj: bridgebench.ai/overall. BridgeBench sjednocuje 7 testů zaměřených na reálné programovací úlohy. Jeho Reasoning kategorie používá 30 velmi těžkých úloh a nelze ji přímo porovnávat s GPQA/MMLU.

🎯 Publikované benchmarky

Benchmark	Kategorie	Skóre	Zdroj
SWE-bench Verified	coding	79.6%	↗ provider
LiveCodeBench	coding	82.09%	↗ nezávislý
GPQA Diamond	reasoning	89.9%	↗ provider
MMLU-Pro	reasoning	79.2%	↗ nezávislý

Found official and independent benchmark scores for Claude Sonnet 4.6 (released February 2026). SWE-bench Verified is consistently reported at 79.6%. GPQA Diamond is 89.9% per provider reports, and tau-bench retail is 91.7%. Some benchmarks like Aider Polyglot and AIME 2024 lacked definitive standard scores for this exact model (AIME 2025 was reported instead).

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Anthropic Claude Sonnet 4.6	← Právě prohlížíte	—
Google Gemini 3 Pro Preview	Gemini je levnější ($2.00 vs $3.00 vstup, $12.00 vs $15.00 výstup)	Gemini nabízí stejné kontextové okno (1M) za nižší cenu a je silným konkurentem v multimodálním zpracování, ačkoliv Sonnet může mít navrch v čistém kódování.
OpenAI GPT-5.2 Codex	GPT-5.2 Codex je levnější na vstupu ($1.75), podobný na výstupu ($14.00)	Přímý konkurent v oblasti programování. Codex je levnější pro analýzu kódu, ale má menší kontext (400k vs 1M), což Sonnet zvýhodňuje u velkých repozitářů.
Anthropic Claude Opus 4.6	Opus je výrazně dražší ($5.00/$25.00)	Interní konkurence. Sonnet 4.6 nabízí většinu schopností Opusu za 60 % ceny, což z něj činí preferovanou volbu pro většinu komerčních aplikací kromě nejnáročnějšího reasoning.

🎯 Rozhodovací pomocník

✓

Použij když...

Refactoring rozsáhlých legacy kódových bází
Autonomní testování webových aplikací (QA)
Tvorba dlouhých technických specifikací

✗

Nepoužívej když...

Jednoduché chatboty (příliš drahé)
Zpracování audia v reálném čase
Hromadnou klasifikaci krátkých textů (použijte Haiku nebo Mistral)

Ideální pro:

Seniorní softwaroví inženýřiVývojáři automatizačních agentůTechničtí analytici zpracovávající velké dokumenty

💪 Silné a slabé stránky

+ Silné stránky

Kontext a Výstup

Kombinace 1M vstupního kontextu a 128k výstupních tokenů umožňuje zpracování a generování celých softwarových modulů nebo rozsáhlých dokumentů v jediném průchodu.

Agentní schopnosti

Pokročilá integrace 'Computer Use' pro automatizaci workflow a web QA, což modelu umožňuje efektivněji interagovat s externími nástroji než standardní textové modely.

Programování

Specializace na navigaci v komplexních bázích kódu a iterativní vývoj, konkurující dedikovaným kódovacím modelům.

− Slabé stránky

Cenová politika

Cena $3.00/$15.00 za 1M tokenů je výrazně vyšší než u konkurence (např. Google Gemini 3 Pro je o 33 % levnější na vstupu), což snižuje atraktivitu pro velkoobjemové zpracování dat.

Omezené modality

Model podporuje pouze text a vstup obrazu, chybí nativní generování obrázků nebo zpracování audia, které nabízí konkurence (OpenAI, Google).

📝 Detailní popis

Sonnet 4.6 je dosud nejvýkonnější model třídy Sonnet od společnosti Anthropic, s špičkovým výkonem v oblasti kódování, agentů a profesionální práce. Vyniká v iterativním vývoji, komplexní navigaci v kódu, end-to-end projektovém řízení s pamětí, vytváření propracovaných dokumentů a spolehlivém používání počítače pro webové QA a automatizaci pracovních postupů.

Unikátní charakteristiky

Sonnet 4.6 představuje střední třídu nové generace modelů Anthropic s masivním kontextovým oknem 1M tokenů a specializací na ‘Computer Use’ (přímé ovládání rozhraní). Model je optimalizován pro udržení konzistence v dlouhých konverzacích a správu komplexních projektů, přičemž nabízí vysoký výstupní limit 128k tokenů pro generování rozsáhlého kódu.

Silné stránky

Kontext a Výstup