7 praktických pravidel, jak psát prompty pro analytické úkoly bez halucinací

Návody DataModelyNávodyScénáře

Analytický prompt má jiný cíl než kreativní zadání: nemá generovat nápady, ale převést jasně vymezená data na kontrolovatelný závěr. Pokud model nedostane hranice, začne doplňovat chybějící souvislosti odhadem. Právě tam vznikají halucinace, tedy tvrzení, která znějí věrohodně, ale nejsou opřená o zdroj, vstupní data nebo ověřitelnou logiku. U analytických úkolů proto nefunguje obecné „napiš analýzu“, ale sada přesných instrukcí: co smí model použít, co má ignorovat, jak má označit nejistotu a v jakém formátu má vrátit výsledek. For related context, see Jak postavit interní AI znalostní bázi z firemních dokumentů za 90 minut.

Claude

V praxi jde typicky o práci nad tabulkou, sadou dokumentů, zápisem z porady, výpisem ticketů, finančním přehledem nebo právním textem. Užitečný prompt zde neoptimalizuje „chytrost“ odpovědi, ale omezuje prostor pro domýšlení. Pokud se tématu promptování věnuje více textů, související přehledy bývají soustředěné v tematických rozcestnících na aivyber.cz; pro srovnání nástrojů se hodí i přehledy v sekci AI chatboti, protože právě rozdíly v práci s kontextem a soubory mají na analytické výstupy přímý dopad.

Níže je sedm pravidel, která fungují napříč modely typu ChatGPT, Claude, Gemini nebo Copilot. U každého pravidla je uvedeno, co přesně udělat, pro koho se hodí a kdy se naopak nevyplácí ho použít doslova. For related context, see Jak zavést interní AI policy pro tým do 20 lidí: šablona + kontrolní body.

1. Vymezte zdroj pravdy dřív než samotný úkol

Stock image

Nejspolehlivější způsob, jak snížit halucinace, je určit, z čeho model smí vycházet. Bez této instrukce často kombinuje interní znalost, pravděpodobný odhad a kusy ze vstupu. U analýzy je to chyba. Model musí vědět, zda má pracovat pouze s přiloženým CSV, jen s textem smlouvy, nebo například s dvojicí reportů a ničím dalším.

Co konkrétně udělat

Claude

Do promptu vložit větu typu: „Použij výhradně data z přiložené tabulky a nic nedoplňuj z obecných znalostí. Pokud údaj chybí, napiš výslovně, že ve vstupu není.“ Funguje i doplnění hierarchie zdrojů: „Primární je tabulka sales_q1.csv, sekundární je zápis z porady; při rozporu má přednost tabulka.“

U služeb, které umějí práci se soubory, je vhodné zdroje pojmenovat přesně. V ChatGPT lze nad nahranými soubory a tabulkami pracovat v režimech pro datovou analýzu; v Claude se vyplácí explicitně odkazovat na přiložený dokument podle názvu; v Gemini je důležité napsat, zda má model použít jen obsah konverzace a souborů, nebo i webové dohledávání, pokud je zapnuté.

Pro koho je to důležité

Pro analytičky a analytiky v marketingu, financích, HR, produktu i provozu. Typicky pro situace, kdy rozhodnutí stojí na jediné datové sadě a jakýkoli odhad navíc je riziko.

Kdy to nepoužívat

Nepoužívat v této tvrdé podobě u úkolů, které mají kombinovat interní data s externím kontextem, například tržní benchmark, právní rešerši nebo technologické srovnání. Tam je lepší zdroje rozdělit na interní a externí a požadovat jejich oddělené označení.

2. Definujte výstupní jednotku: co má být tvrzení, co důkaz a co nejistota

Stock image

Mnoho halucinací nevzniká z neznalosti, ale z nejasného zadání. Model neví, zda má shrnout trend, vypočítat odchylku, navrhnout hypotézu nebo obhájit rozhodnutí. Proto je potřeba rozložit odpověď na menší jednotky. Každé analytické tvrzení by mělo mít oporu: číslo, citaci, řádek dat nebo odkaz na konkrétní odstavec.

Co konkrétně udělat

Zadání formulovat jako strukturu: „U každého závěru uveď: 1) tvrzení v jedné větě, 2) důkaz ze vstupu, 3) míru jistoty vysoká/střední/nízká, 4) co by bylo potřeba k ověření.“ Tím se dramaticky sníží sklon modelu vyrábět hladce znějící, ale neukotvené odstavce.

U tabulkových analýz je vhodný i technický formát: „Vrátit jako markdown tabulku se sloupci Závěr, Zdrojový sloupec, Filtr, Výpočet, Riziko omylu.“ Pokud model neumí přesně popsat cestu k výsledku, bývá to první signál, že si část odpovědi domyslel.

Pro koho je to důležité

Pro product manažerky, controllery, interní audit, datové týmy a konzultanty, kteří musí výstup předat dál a potřebují auditní stopu.

Kdy to nepoužívat

Nehodí se pro prvotní průzkum tématu nebo brainstorm. Pokud je cílem rychle nasbírat hypotézy, příliš tvrdá struktura brzdí šíři záběru. V takovém případě je vhodné oddělit dvě fáze: nejprve hypotézy, potom ověřovací analýzu.

3. Zadejte zakázané operace: co model nesmí dopočítávat ani předpokládat

Stock image

Dobrý analytický prompt neříká jen co dělat, ale také co nedělat. Právě zákaz implicitních kroků často zabrání chybě. Model má tendenci dopočítat chybějící hodnotu z průměru, převést neurčité pojmy na přesná čísla nebo sloučit kategorie, které by měly zůstat oddělené.

Co konkrétně udělat

Do promptu vložit explicitní omezení: „Neodhaduj chybějící hodnoty. Neslučuj segmenty SMB a Enterprise. Nezaměňuj korelaci za příčinu. Pokud z dat neplyne kauzalita, napiš to výslovně.“ U textových dokumentů pomáhá i instrukce „Necituj parafrází jako přímou citaci“ a „Nevytvářej právní závěry, pokud text uvádí jen obchodní podmínky“.

Toto pravidlo je zvlášť důležité u modelů s dlouhým kontextem. Čím víc materiálu dostanou, tím snáz propojí nesouvisející části do elegantního, ale mylného závěru.

Pro koho je to důležité

Pro právní a compliance týmy, finance, výzkum, medicínské a technické obory, kde je chyba spíš v nelegitimním skoku než v samotném čtení dat.

Kdy to nepoužívat

Nepřehánět u scénářů, kde je žádoucí inferenční práce, například při tvorbě hypotéz nad zákaznickou zpětnou vazbou. Pokud model nesmí vyvozovat vůbec nic, vrátí pouze mechanický soupis bez přidané analytické hodnoty.

4. Vynucujte citaci zdroje na úrovni věty nebo odstavce

Stock image

Požadavek na citaci je praktický filtr proti halucinacím. Když musí model u tvrzení uvést původ, klesá pravděpodobnost, že si informaci doplní. Nejde přitom jen o akademické citace. U interních materiálů úplně stačí odkaz na název souboru, list, řádek, stránku nebo sekci.

Co konkrétně udělat

Zadání může znít: „Ke každému odstavci přidej v závorce zdroj ve formátu [soubor | sekce | stránka/řádek]. Pokud zdroj nelze určit, odstavec nevytvářej.“ U tabulek funguje i: „Ke každému číslu uveď vzorec nebo filtr, z něhož vychází.“

V nástrojích s webovým režimem je vhodné chtít i oddělení toho, co pochází z webu a co z přiložených souborů. Například: „Externí zdroje uváděj zvlášť a nikdy je nemíchej do závěrů z interních dat bez výslovného označení.“

Pokud se řeší výběr nástroje pro podobný workflow, užitečné bývají i srovnávací články na aivyber.cz, zejména tam, kde se hodnotí práce se soubory, citacemi a kontextovým oknem. Právě tyto funkce mají na kvalitu analytických promptů větší vliv než samotný marketingový název modelu.

Pro koho je to důležité

Pro editory, rešeršní týmy, právníky, analytiky veřejných zakázek, investiční týmy a všechny, kdo musí být schopni doložit původ tvrzení.

Kdy to nepoužívat

Nepoužívat v plné granularitě u rychlých interních pracovních poznámek. Citace po každé větě zvyšují přesnost, ale také prodlužují čas zpracování a dělají odpověď méně čitelnou. Pro mezikrok často stačí citace po odstavcích nebo jen u klíčových závěrů.

5. Rozdělte úlohu na dvě fáze: extrakce a až potom interpretace

strategy illustration: 5. Rozdělte úlohu na dvě fáze: extrakce a až potom interpretace

Častá chyba je chtít po modelu všechno najednou: najít fakta, odstranit duplicity, spočítat trend a ještě napsat doporučení. V takovém režimu se zvyšuje riziko, že se nepozorovaně promíchají data s interpretací. Spolehlivější je dvoukrokový postup.

Co konkrétně udělat

V prvním promptu zadat čistou extrakci: „Z dokumentu vytáhni pouze všechny zmínky o ceně, datu účinnosti, smluvní pokutě a výpovědní lhůtě. Nic nehodnoť.“ Ve druhém promptu teprve interpretaci: „Na základě extrahovaných položek porovnej odchylky proti internímu standardu a označ rizika.“

U datových úloh se osvědčuje mezivýstup nechat vrátit ve strojově čitelném formátu, například JSON nebo CSV. Tím se snižuje riziko, že model v další fázi pracuje s parafrází místo s původním zjištěním.

Praktický dopad je výrazný i u delších dokumentů. Při rozdělení úlohy se snáz odhalí, zda chyba vznikla už při čtení vstupu, nebo až při interpretaci. To zjednodušuje kontrolu i ladění promptu.

Pro koho je to důležité

Pro právní review, due diligence, QA tým, support operace, nákup a interní audit. Všude tam, kde je potřeba mít oddělené „co se v datech skutečně píše“ a „co z toho plyne“.

Kdy to nepoužívat

Nepoužívat u jednoduchých dotazů s malým vstupem, například jedné tabulky o deseti řádcích. Dvoufázový postup by zde jen přidal režii bez měřitelného přínosu.

6. Požadujte kontrolu konfliktů, hranic a chybějících dat

Model má tendenci uzavírat odpověď i tehdy, když jsou vstupy neúplné nebo si odporují. U analytiky je lepší opačný režim: nejprve detekce problému, teprve potom závěr. Prompt by měl model přímo nutit vypsat konflikty, mezery a podmínky, které mohou výsledek zkreslit.

Co konkrétně udělat

Přidat samostatnou povinnou sekci: „Před závěrem vypiš: a) rozpory mezi zdroji, b) chybějící pole, c) předpoklady nutné pro výpočet, d) dopad těchto omezení na jistotu závěru.“ U více dokumentů pomáhá i instrukce „Pokud se dvě verze liší, nevybírej automaticky jednu; uveď obě a označ rozdíl.“

To je zásadní například u finančních přehledů, kde se liší období, měny nebo definice metrik. Stejně tak u zákaznických dat, kde jedna tabulka pracuje s objednávkou a druhá s účtem. Bez explicitní kontroly konfliktů model často předpokládá, že jde o totožnou entitu.

Pro koho je to důležité

Pro finance, business intelligence, procurement, reporting pro vedení a všechny, kdo spojují více datových zdrojů.

Kdy to nepoužívat

Nehodí se pro čistě explanační úkoly, kde je vstup jediný a uzavřený, například shrnutí jedné interní směrnice. Tam by sekce s konflikty byla jen formální.

7. U kritických úloh nastavte režim „nejdřív otázky, pak odpověď“

Jestliže je zadání neúplné, nejlepší prompt není ten, který nutí model odpovědět za každou cenu, ale ten, který dovolí zastavit a doptat se. U složitější analytiky je to často nejúčinnější pojistka proti halucinaci.

Co konkrétně udělat

Zadání formulovat takto: „Pokud chybí definice metriky, období, jednotka nebo zdroj dat, nepokračuj rovnou k analýze. Nejprve polož maximálně pět upřesňujících otázek. Teprve po jejich zodpovězení vytvoř závěr.“ Lze doplnit i pravidlo priorit: „Ptej se jen na informace, které mají vysoký dopad na výsledek.“

Tento přístup funguje dobře i u API workflow a automatizací. Místo jednoho univerzálního promptu se vytvoří validační krok, který zkontroluje, zda payload obsahuje například časové období, měnu, definici KPI a očekávaný výstup. Pokud ne, proces vrátí chybu nebo žádost o doplnění.

Pro koho je to důležité

Pro týmy, které používají AI nad opakovanými šablonami: reporting, controllling, zákaznická analytika, RevOps, automatizace v no-code i přes API.

Kdy to nepoužívat

Nepoužívat tam, kde je prioritou latence a vstup je už standardizovaný. U plně strukturovaného dashboardového dotazu by dodatečné otázky jen zdržovaly.

Praktické scénáře: jak prompt upravit podle typu analytického úkolu

Scénář 1: Analýza prodeje z CSV

Špatně: „Zanalyzuj prodej a napiš hlavní zjištění.“

Lépe: „Použij pouze přiložený soubor sales_q1.csv. Vyhodnoť vývoj tržeb po týdnech, marži podle produktové kategorie a podíl vratek. U každého závěru uveď použité sloupce, filtr a výpočet. Pokud ve vstupu chybí nákladová data, marži neodhaduj.“

Výsledek: méně líbivé shrnutí, ale vyšší kontrolovatelnost.

Scénář 2: Shrnutí smlouvy a rizik

Špatně: „Najdi ve smlouvě problematická místa.“

Lépe: „Z přiložené smlouvy vytáhni pouze ustanovení o odpovědnosti, SLA, výpovědi, sankcích a zpracování dat. Ke každému bodu uveď citaci sekce. V druhé části porovnej extrahované body s interním checklistem a označ odchylky. Neprováděj právní kvalifikaci nad rámec textu.“

Výsledek: oddělení extrakce od hodnocení a nižší riziko, že model přidá právní závěr, který ve smlouvě není.

Scénář 3: Analýza zákaznických ticketů

Špatně: „Vyhodnoť, co zákazníky nejvíc trápí.“

Lépe: „Z ticketů identifikuj opakující se témata. Nejprve vrať seznam témat s počtem výskytů a reprezentativními citacemi. Teprve potom navrhni tři hypotézy příčin. Pokud z ticketů neplyne příčina, napiš, že jde pouze o hypotézu.“

Výsledek: jasné oddělení frekvence témat od spekulace o příčinách.

Scénář 4: Webová rešerše s externími zdroji

Špatně: „Zjisti, jak si stojíme proti konkurenci.“

Lépe: „Rozděl výstup na interní fakta a externí tržní kontext. Externí tvrzení uváděj jen pokud mají dohledatelný zdroj. Každý zdroj označ URL a datem publikace. Pokud je údaj orientační nebo ceník závisí na individuální nabídce, napiš výslovně ‚orientační údaj‘.“

Výsledek: nižší riziko, že se marketingové formulace konkurence zamění za doložené srovnání.

Limity: ani dobrý prompt nezaručí bezchybnost

Přesný prompt snižuje halucinace, ale neodstraňuje jiné typy chyb. Model může špatně přečíst tabulku, zaměnit jednotky, ztratit část kontextu v dlouhém dokumentu nebo nesprávně aplikovat filtr. To platí i u placených nástrojů. Orientačně se u běžných chatových služeb pro jednotlivce ceny pohybují přibližně od 20 USD měsíčně za vyšší limity a pokročilejší funkce; konkrétní podmínky se mění podle tarifu, regionu a dostupných funkcí. Cena sama o sobě ale negarantuje přesnější analytiku.

Důležité jsou i technické limity:

  • Dlouhý kontext není totéž co spolehlivá práce s kontextem. Model může dokument pojmout do okna, ale přesto špatně prioritizovat relevantní části.
  • Práce se soubory se liší službu od služby. Někde je silnější tabulková analýza, jinde shrnování dokumentů.
  • Webové dohledávání zvyšuje šanci na aktuální data, ale i riziko převzetí nepřesného sekundárního zdroje.
  • Citace mohou být formálně přítomné, ale obsahově slabé. Proto je potřeba namátková kontrola.

U kritických rozhodnutí proto zůstává nutná lidská verifikace. Ideální workflow je: validace vstupu, analýza s omezeným promptem, kontrola citací a až poté publikace nebo rozhodnutí.

FAQ

Stačí do promptu napsat „nehalucinuj“?

Nestačí. Jde o příliš obecnou instrukci. Účinnější je vymezit zdroj pravdy, zakázané operace, formát citací a pravidla pro práci s nejistotou.

Je lepší krátký, nebo dlouhý prompt?

Rozhoduje ne délka, ale jednoznačnost. Krátký prompt funguje, pokud jasně určí zdroje, cíl a formát. Dlouhý prompt škodí ve chvíli, kdy míchá stylové požadavky s analytickou logikou a zakrývá klíčové instrukce.

Má smysl chtít po modelu „uveď confidence score“?

Ano, pokud je jasně definované, co confidence znamená. Bez definice jde jen o pocitové číslo. Lepší je slovní škála navázaná na zdroj: vysoká jistota = přímá opora ve vstupu, střední = částečná opora, nízká = hypotéza.

Jak poznat, že prompt je pořád moc volný?

Když model používá formulace jako „pravděpodobně“, „zřejmě“, „lze předpokládat“, aniž by bylo zřejmé proč. Další signál je nemožnost dohledat původ tvrzení zpět do vstupu.

Pomůže few-shot ukázka?

Ano, hlavně u opakovaných úloh. Jedna kvalitní ukázka výstupu často zafunguje lépe než deset obecných pravidel. Musí ale být věcně správná a formátově přesně odpovídat požadavku.

Kdy raději použít šablonu než volný chat?

U pravidelných analýz se stejnými vstupy: měsíční reporting, kontrola smluv, audit ticketů, porovnání ceníků. Šablona stabilizuje kvalitu a snižuje rozptyl odpovědí mezi jednotlivými běhy.

Závěr

Prompt pro analytický úkol má fungovat jako specifikace, ne jako přání. Největší rozdíl dělá sedm kroků: určit zdroj pravdy, vymezit jednotku tvrzení a důkazu, zakázat nelegitimní odhady, vynutit citace, oddělit extrakci od interpretace, nechat vypsat konflikty a u nejasných zadání povolit nejdřív doplňující otázky. Takový postup neudělá z modelu arbitra pravdy, ale výrazně zmenší prostor pro domýšlení. A právě to je u analýzy důležitější než plynulost textu nebo efektní formulace.

Doporučený AI stack pro realizaci

Vyber si nástroje podle rozpočtu a úrovně automatizace. Níže je přímý přehled služeb pro realizaci projektu.

Služba Popis služby Nabídka
NordVPN VPN služba pro ochranu soukromí a bezpečné připojení. Otevřít nabídku
Semrush SEO a marketingová platforma pro analýzu a růst návštěvnosti. Otevřít nabídku
Notion Pracovní prostor pro poznámky, dokumentaci a řízení projektů. Otevřít nabídku
Hostinger Webhosting a domény pro rychlé spuštění webu. Otevřít nabídku
Fiverr Marketplace pro freelancery a externí specialisty. Otevřít nabídku
Adobe Kreativní nástroje pro grafiku, video a digitální obsah. Otevřít nabídku
Canva Online design nástroj pro grafiku, prezentace a sociální sítě. Otevřít nabídku
Jasper AI nástroj pro marketingové texty a obsahové kampaně. Otevřít nabídku

Poznámka: U uvedených služeb používáme affiliate odkazy. Pokud přes ně provedete nákup, můžeme získat provizi bez navýšení ceny pro vás.

Odkazy v článku

Zdroje ilustračních obrázků

Vlastní ilustrační obrázek byl vytvořen pomocí OpenAI Images API.