AI monitoring konkurence s týdenním reportem
Úvod

Monitoring konkurence v reálném čase je klíčový pro každou firmu usilující o udržení technologického náskoku. Díky pokroku v umělé inteligenci a automatizaci je dnes možné vybudovat systém, který s minimální ruční prací sleduje produkty, ceny, funkce a komunikaci konkurence a generuje pravidelné přehledy. Tento článek slouží jako praktický návod pro vytvoření funkčního MVP projektu „AI monitoring konkurence s týdenním reportem“. Cílem je propojit několik existujících služeb – web scraping, API, jazykový model (např. GPT‑5), cloudové úložiště a automatizované notifikace – do uceleného řešení.
Cíl projektu

Výstupem projektu je systém, který:
- automaticky shromažďuje data z veřejných webů a RSS feedů konkurence,
- analyzuje změny v obsahu (nové články, úpravy funkcí, změny cen),
- každý týden vygeneruje report v přehledné formě (PDF, e‑mail nebo zpráva do Slacku),
- umožní manažerům rychle vyhodnotit trendy bez čtení desítek zdrojů ručně.
Předpoklady
- Základní znalost Pythonu (verze ≥ 3.10)
- Založené účty pro přístup k veřejným API (např. SerpApi, OpenAI API, NewsAPI)
- Přístup k nástroji pro automatizaci úloh, např. Zapier nebo Apache Airflow
- Cloudový účet (např. Google Cloud nebo AWS)
- Základní zkušenost s formátováním výstupů (Markdown, HTML, PDF)
Kroky realizace
Krok 1: Definice seznamu konkurentů a zdrojů
Akce: Vytvořte tabulku competitors_sources.csv s nejdůležitějšími weby a URL zdroji konkurence. Použijte Google Sheets nebo CSV soubor s následující strukturou:
name,url,type
FirmaA,https://www.firmaa.cz/rss,news
FirmaB,https://www.firmab.cz/api/products,products
Vstup: seznam URL feedů, API odkazů nebo sitemap konkurence.
Výstup: soubor competitors_sources.csv uložený v projektu.
Metrika úspěšnosti: Minimálně 90 % sledovaných zdrojů musí být dostupných a poskytovat data při testu HTTP 200.
Krok 2: Automatizované získávání dat
Akce: Použijte knihovnu requests nebo httpx pro přístup k URL a BeautifulSoup pro extrakci textu. Každodenní scraping naplánujte pomocí nástroje Apache Airflow.
from bs4 import BeautifulSoup
import requests
url = "https://www.firmaa.cz/rss"
response = requests.get(url)
soup = BeautifulSoup(response.text, "xml")
items = soup.find_all("item")
news_data = [{"title": i.title.text, "link": i.link.text} for i in items]
Vstup: URL z předchozího kroku.
Výstup: JSON datový soubor data/raw/YYYY-MM-DD.json s extrahovanými položkami.
Metrika úspěšnosti: alespoň 95 % feedů zpracováno bez chyb HTTP 4xx/5xx. Logujte výjimky do logs/scraper.log.
Krok 3: Ukládání a verzování dat
Akce: Použijte cloudovou databázi (např. Firestore nebo DynamoDB) k uložení nových záznamů a verzi předchozích. Doporučuje se hashování obsahu, aby bylo možné detekovat změny.
import hashlib
hash_val = hashlib.sha256(item['title'].encode() + item['link'].encode()).hexdigest()
Vstup: JSON s novými daty.
Výstup: Uložené záznamy s polem hash, source, timestamp.
Metrika úspěšnosti: duplicity < 2 % měřených podle hash hodnot na 1000 záznamů.
Krok 4: Analýza změn a extrakce novinek
Akce: Porovnat aktuální dataset s předchozím týdnem. Použijte jednoduché porovnání hashů nebo knihovnu pandas k detekci unikátních záznamů. Poté využijte API GPT‑5 k sumarizaci novinek.
import pandas as pd
from openai import OpenAI
client = OpenAI(api_key="YOUR_OPENAI_API_KEY")
new_items = df_current[~df_current['hash'].isin(df_previous['hash'])]
prompt = f"Shrň hlavní změny konkurence: {new_items.to_json()}"
response = client.chat.completions.create(model="gpt-5", messages=[{"role": "user", "content": prompt}])
summary = response.choices[0].message.content
Vstup: Dataset s novými položkami (JSON).
Výstup: Textový souhrn weekly_summary.txt.
Metrika úspěšnosti: Souhrn má přesnost > 85 % při manuální verifikaci (hodnoceno ředitelem marketingu nebo analytikem).
Krok 5: Generování týdenního reportu
Akce: Překlopte textový výstup do formátu PDF pomocí WeasyPrint nebo ReportLab. Přidejte graf změn cen z minulých týdnů pomocí knihovny matplotlib.
from weasyprint import HTML
HTML('summary.html').write_pdf('weekly_report.pdf')
Vstup: Shrnutí weekly_summary.txt + data cen konkurence z databáze.
Výstup: Soubor weekly_report.pdf.
Metrika úspěšnosti: Report obsahuje všechny sledované konkurenty a nezobrazuje žádné prázdné sekce (validace přes regex kontrolu textu).
Krok 6: Distribuce reportu a integrace s komunikací týmu
Akce: Využijte službu Slack Webhooks nebo Gmail API pro odeslání týdenního PDF všem členům týmu.
import requests
webhook_url = "https://hooks.slack.com/services/T00000000/B00000000/XXXXXXXXXXXXXXXX"
msg = {"text": "Týdenní AI report je k dispozici.", "attachments": [{"title": "Zobrazit PDF", "title_link": "https://storage.cloud/report.pdf"}]}
requests.post(webhook_url, json=msg)
Vstup: Umístění PDF reportu v cloudu (např. Google Cloud Storage).
Výstup: Potvrzení o doručení zprávy do Slack kanálu.
Metrika úspěšnosti: 100 % členů týmu obdrží notifikaci a report do 5 minut od vytvoření (ověření Slack API timestampem).
Testování
Funkčnost ověřte unit testy i end‑to‑end scénáři:
- Unit testy pro funkce stahování (např. test, zda
requests.getvrací platný XML) - Kontrola datových typů a prázdných hodnot v
pandasdataframech - Porovnání dvou týdnů dat – očekávaných rozdílů (např. počet nových položek)
Příklad unit testu:
def test_fetch_data():
response = requests.get("https://www.firmaa.cz/rss")
assert response.status_code == 200
Každý test uložte do složky tests/ a spusťte příkazem pytest --maxfail=1 --disable-warnings -q.
Nasazení
Nasazení realizujte ve dvou prostředích – testovací a produkční:
- Testovací prostředí: Docker kontejner s omezeným přístupem k API klíčům a datům. Použijte oficiální Python image.
- Produkční prostředí: Cloud Run (Google Cloud) nebo AWS Lambda s denním triggerem. Nastavte proměnné prostředí:
OPENAI_API_KEY,NEWSAPI_KEY. - Curriculum cron časovače: např. „0 8 * * 1″ (pondělí 8:00) pro spuštění generování reportu.
Před finálním spuštěním zkontrolujte stabilitu (logy bez chyb během 3 cyklů) a ověřte, že report vzniká i při částečně nedostupných zdrojích – systém se má zotavit po chybě HTTP.
Limity
- API GPT‑5 a ostatních nástrojů mohou mít denní limit volání (např. 1000 požadavků). Doporučuje se caching promptů.
- Scrapování webů může být omezeno robots.txt – nutné respektovat podmínky.
- Některé stránky mění strukturu HTML, proto je vhodné validovat xpath selektory alespoň jednou měsíčně.
- Přesnost shrnutí GPT‑5 závisí na formátu vstupů; doporučuje se udržet maximální délku textu do 6 000 tokenů na požadavek.
FAQ
Otázka: Lze tento systém rozšířit o sledování sociálních sítí?
Odpověď: Ano, např. propojením s Meta Graph API nebo Twitter API, přičemž je nutné zohlednit limity a autentizaci OAuth 2.0.
Otázka: Jak zabezpečit API klíče?
Odpověď: Použijte dotenv soubor uložený mimo Git repo a v produkci nastavte proměnné prostředí.
Otázka: Kolik času zabere výpočet reportu?
Odpověď: Běžně 2–5 minut podle počtu zdrojů (měřeno na VM s 2 vCPU, 4 GB RAM).
Otázka: Udrží se systém sám?
Odpověď: Při správné konfiguraci Airflow DAGů je údržba minimální, doporučený dohled je 1× týdně.
Závěr
Tento návod představuje kompletní postup, jak vytvořit systém AI monitoringu konkurence se samostatným generováním týdenního reportu. Spojuje otevřené API, cloudové automatizační nástroje a schopnosti GPT‑5 ke zpracování dat a jejich srozumitelnému shrnutí. Po dokončení všech kroků získáte MVP řešení, které může být dále rozvíjeno – např. o trendové grafy, predikci vývoje cen nebo zapojení sentimentové analýzy. Klíčovým přínosem je výrazná úspora času analytiků a okamžitý přehled o situaci na trhu, který lze škálovat bez nutnosti manuálních zásahů.
Doporučený AI stack pro realizaci
Vyberte nástroje podle rozpočtu a úrovně automatizace. Níže je přímý přehled služeb pro realizaci projektu.
| Tool | Offer |
|---|---|
| NordVPN | Otevřít nabídku |
| Semrush | Otevřít nabídku |
| Notion | Otevřít nabídku |
| Hostinger | Otevřít nabídku |
| Fiverr | Otevřít nabídku |
| Adobe | Otevřít nabídku |
| Canva | Otevřít nabídku |
| Jasper | Otevřít nabídku |
Doporučený další krok
Odkazy v článku
Zdroje ilustračních obrázků
- Stock fotografie: zdroj
Vlastní ilustrační obrázek byl vytvořen pomocí OpenAI Images API.
| Služba | Popis služby | Nabídka |
|---|---|---|
| NordVPN | VPN služba pro ochranu soukromí a bezpečné připojení. | Otevřít nabídku |
| Semrush | SEO a marketingová platforma pro analýzu a růst návštěvnosti. | Otevřít nabídku |
| Make | Pokročilá vizuální automatizace workflow a integrací. | Otevřít nabídku |
| Hostinger | Webhosting a domény pro rychlé spuštění webu. | Otevřít nabídku |
| Fiverr | Marketplace pro freelancery a externí specialisty. | Otevřít nabídku |
| Adobe | Kreativní nástroje pro grafiku, video a digitální obsah. | Otevřít nabídku |
| Canva | Online design nástroj pro grafiku, prezentace a sociální sítě. | Otevřít nabídku |
| Jasper | AI nástroj pro marketingové texty a obsahové kampaně. | Otevřít nabídku |
Poznámka: U uvedených služeb používáme affiliate odkazy. Pokud přes ně provedete nákup, můžeme získat provizi bez navýšení ceny pro vás.




