Představte si, že zadáte asistentovi úkol: „Přečti tuto smlouvu a řekni mi, kde jsou rizika.” Asistent si vezme dokument, začne číst — a někde v půlce zapomene, co četl na začátku. Závěry, které vám pak podá, jsou nepřesné. Možná i nebezpečné.

Přesně tohle se děje, když AI narazí na limit svého kontextového okna.

Co je kontextové okno a proč záleží na jeho velikosti

Kontextové okno je množství textu, které AI „vidí” najednou. Všechno, co se do tohoto okna nevejde, AI jednoduše nezpracuje — nebo musíte dokumenty strojově sekat na kousky a skládat výsledky ručně.

Dobrá analogie: pracovní stůl versus archivní skříň. AI pracuje jen s tím, co má právě na stole. Pokud je stůl malý, musíte dokumenty neustále přenášet tam a zpátky — ztrácíte čas, děláte chyby a část informací prostě přehlédnete.

Větší kontextové okno = větší stůl. Celá smlouva, celý výroční report, celý technický manuál — najednou, bez stříhání.

Od 4 000 tokenů k milionu: co se stalo za tři roky

Když v listopadu 2022 vyšel ChatGPT, jeho kontextové okno mělo 4 000 tokenů — zhruba 8 stran textu. Dnes, na začátku roku 2026, pracujeme s okny tisíckrát většími.

Klíčové milníky:

  • Květen 2023 — Anthropic jako první překonal hranici 100 000 tokenů s modelem Claude. Najednou šlo zpracovat celou knihu.
  • Listopad 2023 — GPT-4 Turbo od OpenAI dosáhl 128 000 tokenů. Claude 2.1 posunul laťku na 200 000.
  • Únor 2024 — Google přišel s Gemini 1.5 Pro a milionem tokenů. Zhruba 2 500 stran textu v jednom dotazu. Zlomový moment.
  • Duben 2025 — OpenAI vydal GPT-4.1 s milionovým kontextem. Poprvé měly všechny tři velké platformy (Google, Anthropic, OpenAI) modely s 1M oknem.
  • Listopad 2025 — Meta uvolnila open-source Llama 4 Scout s 10 miliony tokenů. Hranice se posunuly o další řád.
  • Březen 2026 — Claude Opus 4.6 a Sonnet 4.6 nabízejí 1M tokenů za standardní cenu, bez příplatku za dlouhý kontext.

Kde jsme dnes: přehled hlavních modelů (březen 2026)

ModelKontextové oknoPoznámka
Claude Opus 4.6 / Sonnet 4.61 000 000 tokenůBez příplatku za dlouhý kontext
GPT-4.1 (OpenAI)1 000 000 tokenůVšechny varianty (standard, mini, nano)
Gemini 2.5 Pro (Google)1 000 000 tokenůGoogle udává 99,7% přesnost i na plném rozsahu
Llama 4 Maverick (Meta)1 000 000 tokenůOpen-source, provozovatelný na vlastní infrastruktuře
Llama 4 Scout (Meta)10 000 000 tokenůOpen-source, zatím největší dostupný kontext
DeepSeek V41 000 000 tokenůČínský model s bilionem parametrů
Grok 3 (xAI)1 000 000 tokenů
GPT-4o (OpenAI)128 000 tokenůStarší generace, stále široce používaný
Claude Haiku 4.5200 000 tokenůRychlý a levný model pro kratší dokumenty

Pro srovnání: průměrná obchodní smlouva má 20–40 stran. Roční zpráva velké firmy 150–300 stran. S milionovým oknem zpracujete celou technickou dokumentaci softwaru najednou.

Na čem záleží víc než na deklarovaném čísle

Důležitý detail: deklarovaný limit neznamená, že AI pracuje s celým textem stejně spolehlivě. Většina modelů začíná ztrácet přesnost na 60–70 % svého maxima. Informace uprostřed velmi dlouhého dokumentu mohou být přehlédnuty.

Výjimkou je Gemini 2.5 Pro, u kterého Google dokládá 99,7% přesnost i při plném milionu tokenů. Claude Opus 4.6 vykazuje v nezávislých testech konzistentní kvalitu v celém rozsahu svého okna.

V praxi to znamená: nepoužívejte milionový kontext na všechno. Použijte ho tam, kde to dává smysl — na komplexní dokumenty, kde jsou klíčové informace rozesety po stovkách stran.

Konkrétní příklady úspory z praxe

Právní dokumenty a automatizace revizí

Právní oddělení typicky zadávají AI jednotlivé části smlouvy zvlášť a ručně skládají výsledky. S milionovým kontextem jde celá smlouva — včetně příloh a křížových odkazů — do jednoho dotazu. AI vidí nesrovnalosti mezi clausulemi na straně 3 a 47, které by při sekvenčním zpracování přehlédla.

Finanční analýzy a due diligence

Dokumentace klinických studií, výroční zprávy, auditní materiály — stovky stran dat. Dříve bylo nutné dokumenty rozsekat, zpracovat po částech a výsledky ručně agregovat. Dnes jde celý materiál do jednoho volání. Závěry jsou ucelenější, riziko ztráty kontextu eliminováno.

Technické manuály a code review

Softwarové firmy využívají velká kontextová okna pro review celých repozitářů najednou. Místo kontroly souboru po souboru AI vidí, jak spolu části kódu interagují — a odhalí chyby, které při sekvenčním zpracování přehlédne.

Kde ve vaší firmě přicházíte o peníze

Zeptejte se sami sebe: kde ve vaší firmě AI zpracovává dokumenty delší než 50 stran? Kde musíte manuálně kombinovat výstupy z více dotazů? Kde halucinace AI způsobují, že výsledkům nedůvěřujete?

To jsou přesně místa, kde větší kontextové okno přináší okamžitou úsporu.

Nejčastější kandidáti:

  • Právní oddělení — smlouvy, soudní spisy, regulatorní dokumenty
  • Finance — výroční zprávy, due diligence, auditní zprávy
  • IT a vývoj — technická dokumentace, code review, bezpečnostní audity
  • HR a compliance — interní předpisy, pracovní smlouvy, ISO dokumentace

Přehled konkrétních AI služeb pro zpracování dokumentů najdete na samostatné stránce.

Co to stojí

Větší kontext = vyšší náklady za volání. Orientační ceny za zpracování milionu tokenů (březen 2026):

  • Gemini 2.5 Flash: $0,30 — nejlevnější varianta pro hromadné zpracování
  • GPT-4.1: cca $2 — dobrý poměr cena/výkon
  • Claude Sonnet 4.6: $3 — bez příplatku za dlouhý kontext
  • Claude Opus 4.6: $5 — nejvyšší kvalita

Důležité: Claude Opus 4.6 a Sonnet 4.6 jako jediné nepřiráží za použití dlouhého kontextu. U většiny ostatních modelů platíte přirážku, když překročíte standardní limit.

Správná strategie není „vždy používat největší okno”. Je to „použít správný model pro správný úkol” — a vědět, kdy velký kontext skutečně ušetří čas a peníze a kdy je to přeplacené.

Jak začít: audit procesů jako první krok

Nejcennější první krok není výběr modelu. Je to audit: kde konkrétně ve vašich procesech AI naráží na limity dokumentů? Kde manuálně skládáte výsledky z více dotazů? Kde výsledkům nedůvěřujete, protože AI nevidí celý obrázek?

Teprve s touto mapou dává smysl navrhovat řešení.

Pokud nevíte, kde začít, nebo chcete konkrétní analýzu pro vaši firmu, napište mi. Nebo si nejdřív projděte, jak takový AI audit vypadá v praxi — bez závazků, bez technického žargonu. Další tipy na automatizaci procesů najdete také na blogu.

Větší stůl sám o sobě neznamená lepší práci. Ale když zpracováváte stránky a stránky dokumentů, je rozdíl mezi 50 a 2 500 stranami najednou přesně ten, na kterém záleží.