Openai 17. 3. 2026

OpenAI: GPT-5.4 Mini

Item: OpenAI: GPT-5.4 Mini
Author: Patrick Zandl

openai/gpt-5.4-mini

GPT-5.4 Mini je spolehlivý 'pracant' pro firemní prostředí, který nabízí stabilitu ekosystému OpenAI, ale za prémiovou cenu oproti dravé konkurenci.

✦

Killer Feature Masivní výstupní okno 128 000 tokenů umožňuje generovat kompletní soubory bez nutnosti fragmentace.

⚠

Skryté riziko Poměr cena/výkon je horší než u komoditních modelů (DeepSeek, Google Flash), což může prodražit škálování.

$0.75 / 1M vstup

$4.5 / 1M výstup

400k kontext

128k max výstup

Vyzkoušet na OpenRouter

fileimagetext text Efektivita a propustnostMultimodální zpracováníDlouhé generování textu

📊 VibeCode skóre

72.2 / 100

Coding (váha 60 %) 69.4

Reasoning (váha 30 %) 73.1

Kontext (váha 10 %) 85.9

Spolehlivost high. Coding složka pochází z BridgeBench Quality (agregát 7 sub-testů: UI, security, debugging, refactoring, hallucination, BS detection, reasoning). Reasoning složka z 4 benchmarků (GPQA Diamond, MMLU-Pro, HLE). Agents benchmarky (TAU-bench, MMAU) do skóre nezahrnujeme kvůli nízkému pokrytí napříč modely.

🧪 BridgeBench · nezávislý „vibe coding" benchmark

Quality

69.4

agregát 7 sub-testů

Vibe

72.1

celkový dojem

72.6

generování UI

Security

83.3

detekce zranitelností

Debugging

84.1

ladění chyb

Refactoring

62.3

zlepšení kódu

Hallucination

71.9

odolnost vůči halucinacím

BS detection

78.5

odhalení nesmyslů

Reasoning

36.2

30 těžkých úloh (jiná škála)

Speed

236 tok/s

tokenová rychlost

Zdroj: bridgebench.ai/overall. BridgeBench sjednocuje 7 testů zaměřených na reálné programovací úlohy. Jeho Reasoning kategorie používá 30 velmi těžkých úloh a nelze ji přímo porovnávat s GPQA/MMLU.

🎯 Publikované benchmarky

Benchmark	Kategorie	Skóre	Zdroj
Aider Polyglot	coding	9.8%	↗ nezávislý
SWE-bench Verified	coding	48.2%	↗ nezávislý
GPQA Diamond	reasoning	88%	↗ provider
MMLU-Pro	reasoning	82.5%	↗ nezávislý
MMLU	reasoning	80.1%	↗ nezávislý
Humanity’s Last Exam	reasoning	26.6%	↗ zdroj

Found official OpenAI announcement and independent aggregator (OpenRouter, Tech Bytes) scores for GPT-5.4 Mini. Several benchmarks like LiveCodeBench, AIME 2024, and specific agent benchmarks lack published scores for this exact model.

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Openai GPT-5.4 Mini	← Právě prohlížíte	—
Google Gemini 3.1 Flash Image Preview	Gemini je o 33 % levnější na vstupu a o 33 % levnější na výstupu	Gemini je levnější alternativou pro vizuální úlohy, ale má výrazně menší kontext (65k vs 400k u GPT), což dává OpenAI výhodu při práci s dokumenty.
DeepSeek DeepSeek v3.2 Speciale	DeepSeek je téměř 2x levnější na vstupu a 3.75x levnější na výstupu	DeepSeek nabízí agresivnější poměr cena/výkon, zejména pro kódování, ale má menší kontextové okno (163k).
MistralAI Devstral 2512	Mistral je o 47 % levnější na vstupu a o 55 % levnější na výstupu	Devstral je přímý konkurent pro vývojářské workflow; GPT-5.4 Mini však nabízí širší obecné schopnosti a větší kontext.

🎯 Rozhodovací pomocník

✓

Použij když...

RAG aplikace nad středně velkými znalostními bázemi
Generování dlouhé dokumentace nebo kódu
Chatboti s požadavkem na nízkou latenci

✗

Nepoužívej když...

Analýzu extrémně dlouhých kontextů (>400k tokenů)
Úlohy s extrémním tlakem na minimální cenu (zde volte DeepSeek/Flash Lite)

Ideální pro:

SaaS platformy vyžadující spolehlivostVývojáři automatizačních agentůPodniky zpracovávající středně velké dokumenty

💪 Silné a slabé stránky

+ Silné stránky

Výstupní kapacita

Maximální výstup 128 000 tokenů je výrazně vyšší než u většiny konkurentů v této cenové kategorii, což je ideální pro generování celých kódových bází nebo dlouhých reportů.

Multimodalita

Nativní podpora textu a obrazu s optimalizovanou latencí pro produkční nasazení v reálném čase.

Instrukční spolehlivost

Vysoká míra dodržování složitých systémových instrukcí, typická pro rodinu GPT-5, i při redukované velikosti modelu.

− Slabé stránky

Cenová konkurenceschopnost

S cenou $0.75 za vstup je model výrazně dražší než vysoce výkonné modely od DeepSeek ($0.26-$0.40) nebo Google Flash Lite ($0.25).

Kontextové okno

Kapacita 400 000 tokenů je sice dostatečná, ale zaostává za standardem 1M+ u modelů Google a Anthropic nebo 2M u X-AI.

📝 Detailní popis

GPT-5.4 mini přináší klíčové schopnosti GPT-5.4 do rychlejšího a efektivnějšího modelu optimalizovaného pro úlohy s vysokou propustností. Podporuje textové a obrazové vstupy se silným výkonem v oblasti usuzování, kódování a používání nástrojů, přičemž snižuje latenci a náklady pro rozsáhlá nasazení.

Model je navržen pro produkční prostředí, která vyžadují rovnováhu mezi schopnostmi a efektivitou, díky čemuž je vhodný pro chatovací aplikace, asistenty kódování a pracovní postupy agentů, které fungují ve velkém měřítku. GPT-5.4 mini poskytuje spolehlivé dodržování instrukcí, solidní vícestupňové usuzování a konzistentní výkon v různých úlohách se zlepšenou nákladovou efektivitou.

Unikátní charakteristiky

GPT-5.4 Mini představuje střední třídu modelů OpenAI, která obětuje část hloubky uvažování modelu ‘Pro’ ve prospěch nižší latence a nákladů. Model se vyznačuje nadprůměrným limitem pro výstupní tokeny (128k), což jej činí unikátním pro generování rozsáhlého obsahu v jedné iteraci.

Silné stránky

Výstupní kapacita