Živá výzkumná agenda báze — kde je důkaz nejslabší a co by šlo doplnit dalším Ingestem
nebo webovým hledáním. Vzniká z Lintu (viz log.md). Není to tvrzení, ale seznam mezer.
Datové mezery
- Česká behaviorální data o prokliku a ověřování. Chybí domácí měření srovnatelné s Pew (chapekis-lieb-2025) nebo DNR (egan-2026-dnr) — jak Češi reálně proklikávají z AI odpovědí a zda je ověřují. Dnes jen agregovaná vendor/oborová data. → cesky-trh, duvera-konverzacni-rozhrani.
- Rozlišení zpravodajství vs. servisní obsah v ČR. Data SPIR jsou agregovaná; u zpravodajství zásadní dopad zatím nedoložen, ale chybí čisté oddělení.
- Vývoj přesnosti atribucí napříč generacemi modelů. BBC a EBU je statický snímek (2 700+ odpovědí). Zlepšují se novější modely v citaci a atribuci, nebo zůstávají stejně chybové? → halucinace-falesne-atribuce.
- Objem návštěvnosti z AI platforem pro česká média. Globálně <1 %; česká čísla chybí.
- Pokrytí licenčního trhu. Veřejně známé jsou jen velké dohody; jaký podíl trhu reálně pokrývají? → licencovani-trzni-asymetrie.
- Homogenizace na zpravodajských textech. Měřeno zatím jen na kreativních úlohách (doshi-hauser-2024) — přenos na newsroom je analogie. → homogenizace-obsahu.
Otázky k prozkoumání
- AI Mode vs. AI Overviews u Googlu — liší se dopad na proklik?
- Má Seznam vlastní režim oddělení crawlerů a opt-outu jako Google? → crawler-separation-opt-out.
- Koexistence českých oborových hlasů AOV / SLPV / SPIR — doplňují se, nebo si konkurují?
- Mění „ceremoniální citace” dlouhodobě důvěru ke konkrétní značce (ne jen jednorázové vnímání)?
- Přenos experimentů o transparentnosti (khatiwada-2026) na český kontext.
Kandidáti na vlastní stránku (zatím jen zmínky)
- Datové korpusy (C4, Common Crawl detailněji) · britská CMA jako instituce · konkrétní redakční AI pravidla českých vydavatelů.