Google 2. 4. 2026

Google: Gemma 4 31B

Item: Google: Gemma 4 31B
Author: Patrick Zandl

google/gemma-4-31b-it

Gemma 4 31B je vysoce efektivní open-weights model, který poskytuje vynikající poměr ceny a výkonu pro multimodální úlohy a zpracování dlouhých dokumentů.

✦

Killer Feature Kombinace masivního 131K výstupního okna a nativního zpracování videa za extrémně nízkou cenu.

⚠

Skryté riziko Lokální nasazení s využitím plného 256K kontextového okna bude vyžadovat enterprise-grade GPU infrastrukturu kvůli husté architektuře modelu.

$0.14 / 1M vstup

$0.4 / 1M výstup

262k kontext

131k max výstup

Vyzkoušet na OpenRouter

imagetextvideo text ProgramováníReasoningAnalýza dokumentůMultimodalita

📊 VibeCode skóre

64.6 / 100

Coding (váha 60 %) 60.7

Reasoning (váha 30 %) 67.3

Kontext (váha 10 %) 79.8

Spolehlivost medium. Coding složka pochází z BridgeBench Quality (agregát 7 sub-testů: UI, security, debugging, refactoring, hallucination, BS detection, reasoning). Reasoning složka z 3 benchmarků (GPQA Diamond, MMLU-Pro, HLE). Agents benchmarky (TAU-bench, MMAU) do skóre nezahrnujeme kvůli nízkému pokrytí napříč modely.

🧪 BridgeBench · nezávislý „vibe coding" benchmark

Quality

60.7

agregát 7 sub-testů

Vibe

54.6

celkový dojem

generování UI

Security

45.2

detekce zranitelností

Debugging

42.6

ladění chyb

Hallucination

71.3

odolnost vůči halucinacím

Speed

27 tok/s

tokenová rychlost

Zdroj: bridgebench.ai/overall. BridgeBench sjednocuje 7 testů zaměřených na reálné programovací úlohy. Jeho Reasoning kategorie používá 30 velmi těžkých úloh a nelze ji přímo porovnávat s GPQA/MMLU.

🎯 Publikované benchmarky

Benchmark	Kategorie	Skóre	Zdroj
SWE-bench Verified	coding	77.8%	↗ nezávislý
LiveCodeBench	coding	80%	↗ provider
GPQA Diamond	reasoning	84.3%	↗ provider
MMLU-Pro	reasoning	85.2%	↗ provider
Humanity’s Last Exam	reasoning	19.5%	↗ nezávislý
TAU-bench Retail	agents	86.4%	↗ provider

Found official Google DeepMind benchmarks for Gemma 4 31B IT (released April 2026). The model scores 80.0% on LiveCodeBench, 84.3% on GPQA Diamond, 85.2% on MMLU Pro, and 86.4% on TAU-bench Retail. HLE and SWE-bench Verified scores were found via third-party API providers and independent evaluations. AIME 2024 was not explicitly reported (only AIME 2025/2026 at 89.2%).

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Google Gemma 4 31B	← Právě prohlížíte	—
Mistral AI Mistral Small 2603	Téměř identická cena ($0.15/$0.60 vs $0.14/$0.40 u Gemmy).	Oba modely mají srovnatelné kontextové okno (262K). Gemma má výhodu v nativní podpoře videa a obrazu a výrazně větším maximálním výstupu, zatímco Mistral se může soustředit na čistě textovou efektivitu.
DeepSeek DeepSeek V3.2	DeepSeek má téměř 2x dražší vstup ($0.26), ale podobnou cenu výstupu ($0.38).	DeepSeek je silným konkurentem v programování a matematice, ale Gemma nabízí větší kontextové okno (262K vs 164K) a širší multimodální schopnosti včetně zpracování videa.
X-AI Grok 4.1 Fast	Grok je mírně dražší na vstupu ($0.20) i výstupu ($0.50).	Grok nabízí masivní kontextové okno 2 miliony tokenů, což je téměř 8x více než Gemma. Gemma však kontruje otevřenou licencí Apache 2.0 a konfigurovatelným režimem uvažování.

🎯 Rozhodovací pomocník

✓

Použij když...

Analýza dlouhých video záznamů a extrakce dat
Generování a refaktoring rozsáhlých kódových bází
Zpracování rozsáhlých multijazyčných dokumentů

✗

Nepoužívej když...

Úlohy vyžadující generování multimédií na výstupu
Běh na koncových zařízeních s velmi omezenou pamětí (edge devices)

Ideální pro:

Vývojáři aplikacíVýzkumníci v oblasti AIEnterprise sféra hledající open-weights řešení

💪 Silné a slabé stránky

+ Silné stránky

Multimodalita

Nativní podpora obrazu a videa na vstupu umožňuje komplexní analýzu multimediálních dat bez nutnosti externích modulů.

Kapacita výstupu

Maximální délka výstupu 131 072 tokenů je výjimečně vysoká a umožňuje generování rozsáhlých kódových bází nebo celých knih v jednom běhu.

Licencování

Apache 2.0 licence umožňuje široké komerční nasazení a modifikace bez striktních omezení.

Cenová efektivita

S cenou $0.14 za milion vstupních tokenů nabízí velmi atraktivní poměr ceny a výkonu pro multimodální úlohy.

− Slabé stránky

Hardwarové nároky

Hustá architektura s 30.7 miliardami parametrů vyžaduje pro lokální inferenci s plným 256K kontextem značnou kapacitu VRAM ve srovnání s MoE alternativami.

Omezení výstupu

Model podporuje pouze textový výstup, neumožňuje přímé generování obrázků nebo videa.

📝 Detailní popis

Gemma 4 31B Instruct je hustý multimodální model od Google DeepMind o velikosti 30,7 miliard parametrů, který podporuje textový a obrazový vstup s textovým výstupem. Nabízí kontextové okno o velikosti 256 tisíc tokenů, konfigurovatelný režim myšlení/usuzování, nativní volání funkcí a multijazyčnou podporu ve více než 140 jazycích. Je silný v úlohách kódování, usuzování a porozumění dokumentům. Licence Apache 2.0.

Unikátní charakteristiky

Gemma 4 31B je otevřený model střední velikosti, který integruje nativní podporu pro zpracování obrazu a videa s textovým výstupem. Vyniká rozsáhlým kontextovým oknem 256K tokenů a konfigurovatelným režimem uvažování (thinking mode), což je v kategorii open-weights modelů této velikosti nadstandardní.

Silné stránky

Multimodalita