O
Openai 17. 3. 2026

OpenAI: GPT-5.4 Mini

openai/gpt-5.4-mini

GPT-5.4 Mini je spolehlivý 'pracant' pro firemní prostředí, který nabízí stabilitu ekosystému OpenAI, ale za prémiovou cenu oproti dravé konkurenci.

Killer Feature Masivní výstupní okno 128 000 tokenů umožňuje generovat kompletní soubory bez nutnosti fragmentace.
Skryté riziko Poměr cena/výkon je horší než u komoditních modelů (DeepSeek, Google Flash), což může prodražit škálování.
$0.75 / 1M vstup
$4.5 / 1M výstup
400k kontext
128k max výstup
fileimagetext text Efektivita a propustnostMultimodální zpracováníDlouhé generování textu

📊 VibeCode skóre

72.2 / 100
Coding (váha 60 %) 69.4
Reasoning (váha 30 %) 73.1
Kontext (váha 10 %) 85.9

Spolehlivost high. Coding složka pochází z BridgeBench Quality (agregát 7 sub-testů: UI, security, debugging, refactoring, hallucination, BS detection, reasoning). Reasoning složka z 4 benchmarků (GPQA Diamond, MMLU-Pro, HLE). Agents benchmarky (TAU-bench, MMAU) do skóre nezahrnujeme kvůli nízkému pokrytí napříč modely.

🧪 BridgeBench · nezávislý „vibe coding" benchmark

Quality
69.4
agregát 7 sub-testů
Vibe
72.1
celkový dojem
UI
72.6
generování UI
Security
83.3
detekce zranitelností
Debugging
84.1
ladění chyb
Refactoring
62.3
zlepšení kódu
Hallucination
71.9
odolnost vůči halucinacím
BS detection
78.5
odhalení nesmyslů
Reasoning
36.2
30 těžkých úloh (jiná škála)
Speed
236 tok/s
tokenová rychlost

Zdroj: bridgebench.ai/overall. BridgeBench sjednocuje 7 testů zaměřených na reálné programovací úlohy. Jeho Reasoning kategorie používá 30 velmi těžkých úloh a nelze ji přímo porovnávat s GPQA/MMLU.

🎯 Publikované benchmarky

Benchmark Kategorie Skóre Zdroj
Aider Polyglot coding 9.8% ↗ nezávislý
SWE-bench Verified coding 48.2% ↗ nezávislý
GPQA Diamond reasoning 88% ↗ provider
MMLU-Pro reasoning 82.5% ↗ nezávislý
MMLU reasoning 80.1% ↗ nezávislý
Humanity’s Last Exam reasoning 26.6% ↗ zdroj

Found official OpenAI announcement and independent aggregator (OpenRouter, Tech Bytes) scores for GPT-5.4 Mini. Several benchmarks like LiveCodeBench, AIME 2024, and specific agent benchmarks lack published scores for this exact model.

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Openai GPT-5.4 Mini
← Právě prohlížíte
Gemini je o 33 % levnější na vstupu a o 33 % levnější na výstupu Gemini je levnější alternativou pro vizuální úlohy, ale má výrazně menší kontext (65k vs 400k u GPT), což dává OpenAI výhodu při práci s dokumenty.
DeepSeek je téměř 2x levnější na vstupu a 3.75x levnější na výstupu DeepSeek nabízí agresivnější poměr cena/výkon, zejména pro kódování, ale má menší kontextové okno (163k).
MistralAI Devstral 2512
Mistral je o 47 % levnější na vstupu a o 55 % levnější na výstupu Devstral je přímý konkurent pro vývojářské workflow; GPT-5.4 Mini však nabízí širší obecné schopnosti a větší kontext.

🎯 Rozhodovací pomocník

Použij když...

  • RAG aplikace nad středně velkými znalostními bázemi
  • Generování dlouhé dokumentace nebo kódu
  • Chatboti s požadavkem na nízkou latenci

Nepoužívej když...

  • Analýzu extrémně dlouhých kontextů (>400k tokenů)
  • Úlohy s extrémním tlakem na minimální cenu (zde volte DeepSeek/Flash Lite)
Ideální pro:
SaaS platformy vyžadující spolehlivostVývojáři automatizačních agentůPodniky zpracovávající středně velké dokumenty

💪 Silné a slabé stránky

+ Silné stránky

Výstupní kapacita

Maximální výstup 128 000 tokenů je výrazně vyšší než u většiny konkurentů v této cenové kategorii, což je ideální pro generování celých kódových bází nebo dlouhých reportů.

Multimodalita

Nativní podpora textu a obrazu s optimalizovanou latencí pro produkční nasazení v reálném čase.

Instrukční spolehlivost

Vysoká míra dodržování složitých systémových instrukcí, typická pro rodinu GPT-5, i při redukované velikosti modelu.

Slabé stránky

Cenová konkurenceschopnost

S cenou $0.75 za vstup je model výrazně dražší než vysoce výkonné modely od DeepSeek ($0.26-$0.40) nebo Google Flash Lite ($0.25).

Kontextové okno

Kapacita 400 000 tokenů je sice dostatečná, ale zaostává za standardem 1M+ u modelů Google a Anthropic nebo 2M u X-AI.

📝 Detailní popis

GPT-5.4 mini přináší klíčové schopnosti GPT-5.4 do rychlejšího a efektivnějšího modelu optimalizovaného pro úlohy s vysokou propustností. Podporuje textové a obrazové vstupy se silným výkonem v oblasti usuzování, kódování a používání nástrojů, přičemž snižuje latenci a náklady pro rozsáhlá nasazení.

Model je navržen pro produkční prostředí, která vyžadují rovnováhu mezi schopnostmi a efektivitou, díky čemuž je vhodný pro chatovací aplikace, asistenty kódování a pracovní postupy agentů, které fungují ve velkém měřítku. GPT-5.4 mini poskytuje spolehlivé dodržování instrukcí, solidní vícestupňové usuzování a konzistentní výkon v různých úlohách se zlepšenou nákladovou efektivitou.

Unikátní charakteristiky

GPT-5.4 Mini představuje střední třídu modelů OpenAI, která obětuje část hloubky uvažování modelu ‘Pro’ ve prospěch nižší latence a nákladů. Model se vyznačuje nadprůměrným limitem pro výstupní tokeny (128k), což jej činí unikátním pro generování rozsáhlého obsahu v jedné iteraci.

Silné stránky

Výstupní kapacita

Maximální výstup 128 000 tokenů je výrazně vyšší než u většiny konkurentů v této cenové kategorii, což je ideální pro generování celých kódových bází nebo dlouhých reportů.

Multimodalita

Nativní podpora textu a obrazu s optimalizovanou latencí pro produkční nasazení v reálném čase.

Instrukční spolehlivost

Vysoká míra dodržování složitých systémových instrukcí, typická pro rodinu GPT-5, i při redukované velikosti modelu.

Slabé stránky

Cenová konkurenceschopnost

S cenou $0.75 za vstup je model výrazně dražší než vysoce výkonné modely od DeepSeek ($0.26-$0.40) nebo Google Flash Lite ($0.25).

Kontextové okno

Kapacita 400 000 tokenů je sice dostatečná, ale zaostává za standardem 1M+ u modelů Google a Anthropic nebo 2M u X-AI.

🔗 Další modely od Openai