G
Google 2. 4. 2026

Google: Gemma 4 31B

google/gemma-4-31b-it

Gemma 4 31B je vysoce efektivní open-weights model, který poskytuje vynikající poměr ceny a výkonu pro multimodální úlohy a zpracování dlouhých dokumentů.

Killer Feature Kombinace masivního 131K výstupního okna a nativního zpracování videa za extrémně nízkou cenu.
Skryté riziko Lokální nasazení s využitím plného 256K kontextového okna bude vyžadovat enterprise-grade GPU infrastrukturu kvůli husté architektuře modelu.
$0.14 / 1M vstup
$0.4 / 1M výstup
262k kontext
131k max výstup
imagetextvideo text ProgramováníReasoningAnalýza dokumentůMultimodalita

📊 VibeCode skóre

64.6 / 100
Coding (váha 60 %) 60.7
Reasoning (váha 30 %) 67.3
Kontext (váha 10 %) 79.8

Spolehlivost medium. Coding složka pochází z BridgeBench Quality (agregát 7 sub-testů: UI, security, debugging, refactoring, hallucination, BS detection, reasoning). Reasoning složka z 3 benchmarků (GPQA Diamond, MMLU-Pro, HLE). Agents benchmarky (TAU-bench, MMAU) do skóre nezahrnujeme kvůli nízkému pokrytí napříč modely.

🧪 BridgeBench · nezávislý „vibe coding" benchmark

Quality
60.7
agregát 7 sub-testů
Vibe
54.6
celkový dojem
UI
78
generování UI
Security
45.2
detekce zranitelností
Debugging
42.6
ladění chyb
Hallucination
71.3
odolnost vůči halucinacím
Speed
27 tok/s
tokenová rychlost

Zdroj: bridgebench.ai/overall. BridgeBench sjednocuje 7 testů zaměřených na reálné programovací úlohy. Jeho Reasoning kategorie používá 30 velmi těžkých úloh a nelze ji přímo porovnávat s GPQA/MMLU.

🎯 Publikované benchmarky

Benchmark Kategorie Skóre Zdroj
SWE-bench Verified coding 77.8% ↗ nezávislý
LiveCodeBench coding 80% ↗ provider
GPQA Diamond reasoning 84.3% ↗ provider
MMLU-Pro reasoning 85.2% ↗ provider
Humanity’s Last Exam reasoning 19.5% ↗ nezávislý
TAU-bench Retail agents 86.4% ↗ provider

Found official Google DeepMind benchmarks for Gemma 4 31B IT (released April 2026). The model scores 80.0% on LiveCodeBench, 84.3% on GPQA Diamond, 85.2% on MMLU Pro, and 86.4% on TAU-bench Retail. HLE and SWE-bench Verified scores were found via third-party API providers and independent evaluations. AIME 2024 was not explicitly reported (only AIME 2025/2026 at 89.2%).

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Google Gemma 4 31B
← Právě prohlížíte
Mistral AI Mistral Small 2603
Téměř identická cena ($0.15/$0.60 vs $0.14/$0.40 u Gemmy). Oba modely mají srovnatelné kontextové okno (262K). Gemma má výhodu v nativní podpoře videa a obrazu a výrazně větším maximálním výstupu, zatímco Mistral se může soustředit na čistě textovou efektivitu.
DeepSeek DeepSeek V3.2
DeepSeek má téměř 2x dražší vstup ($0.26), ale podobnou cenu výstupu ($0.38). DeepSeek je silným konkurentem v programování a matematice, ale Gemma nabízí větší kontextové okno (262K vs 164K) a širší multimodální schopnosti včetně zpracování videa.
Grok je mírně dražší na vstupu ($0.20) i výstupu ($0.50). Grok nabízí masivní kontextové okno 2 miliony tokenů, což je téměř 8x více než Gemma. Gemma však kontruje otevřenou licencí Apache 2.0 a konfigurovatelným režimem uvažování.

🎯 Rozhodovací pomocník

Použij když...

  • Analýza dlouhých video záznamů a extrakce dat
  • Generování a refaktoring rozsáhlých kódových bází
  • Zpracování rozsáhlých multijazyčných dokumentů

Nepoužívej když...

  • Úlohy vyžadující generování multimédií na výstupu
  • Běh na koncových zařízeních s velmi omezenou pamětí (edge devices)
Ideální pro:
Vývojáři aplikacíVýzkumníci v oblasti AIEnterprise sféra hledající open-weights řešení

💪 Silné a slabé stránky

+ Silné stránky

Multimodalita

Nativní podpora obrazu a videa na vstupu umožňuje komplexní analýzu multimediálních dat bez nutnosti externích modulů.

Kapacita výstupu

Maximální délka výstupu 131 072 tokenů je výjimečně vysoká a umožňuje generování rozsáhlých kódových bází nebo celých knih v jednom běhu.

Licencování

Apache 2.0 licence umožňuje široké komerční nasazení a modifikace bez striktních omezení.

Cenová efektivita

S cenou $0.14 za milion vstupních tokenů nabízí velmi atraktivní poměr ceny a výkonu pro multimodální úlohy.

Slabé stránky

Hardwarové nároky

Hustá architektura s 30.7 miliardami parametrů vyžaduje pro lokální inferenci s plným 256K kontextem značnou kapacitu VRAM ve srovnání s MoE alternativami.

Omezení výstupu

Model podporuje pouze textový výstup, neumožňuje přímé generování obrázků nebo videa.

📝 Detailní popis

Gemma 4 31B Instruct je hustý multimodální model od Google DeepMind o velikosti 30,7 miliard parametrů, který podporuje textový a obrazový vstup s textovým výstupem. Nabízí kontextové okno o velikosti 256 tisíc tokenů, konfigurovatelný režim myšlení/usuzování, nativní volání funkcí a multijazyčnou podporu ve více než 140 jazycích. Je silný v úlohách kódování, usuzování a porozumění dokumentům. Licence Apache 2.0.

Unikátní charakteristiky

Gemma 4 31B je otevřený model střední velikosti, který integruje nativní podporu pro zpracování obrazu a videa s textovým výstupem. Vyniká rozsáhlým kontextovým oknem 256K tokenů a konfigurovatelným režimem uvažování (thinking mode), což je v kategorii open-weights modelů této velikosti nadstandardní.

Silné stránky

Multimodalita

Nativní podpora obrazu a videa na vstupu umožňuje komplexní analýzu multimediálních dat bez nutnosti externích modulů.

Kapacita výstupu

Maximální délka výstupu 131 072 tokenů je výjimečně vysoká a umožňuje generování rozsáhlých kódových bází nebo celých knih v jednom běhu.

Licencování

Apache 2.0 licence umožňuje široké komerční nasazení a modifikace bez striktních omezení.

Cenová efektivita

S cenou $0.14 za milion vstupních tokenů nabízí velmi atraktivní poměr ceny a výkonu pro multimodální úlohy.

Slabé stránky

Hardwarové nároky

Hustá architektura s 30.7 miliardami parametrů vyžaduje pro lokální inferenci s plným 256K kontextem značnou kapacitu VRAM ve srovnání s MoE alternativami.

Omezení výstupu

Model podporuje pouze textový výstup, neumožňuje přímé generování obrázků nebo videa.

🔗 Další modely od Google