Živá výzkumná agenda báze — kde je důkaz nejslabší a co by šlo doplnit dalším Ingestem nebo webovým hledáním. Vzniká z Lintu (viz log.md). Není to tvrzení, ale seznam mezer.

Datové mezery

  • Česká behaviorální data o prokliku a ověřování. Chybí domácí měření srovnatelné s Pew (chapekis-lieb-2025) nebo DNR (egan-2026-dnr) — jak Češi reálně prokliká­vají z AI odpovědí a zda je ověřují. Dnes jen agregovaná vendor/oborová data. → cesky-trh, duvera-konverzacni-rozhrani.
  • Rozlišení zpravodajství vs. servisní obsah v ČR. Data SPIR jsou agregovaná; u zpravodajství zásadní dopad zatím nedoložen, ale chybí čisté oddělení.
  • Vývoj přesnosti atribucí napříč generacemi modelů. BBC a EBU je statický snímek (2 700+ odpovědí). Zlepšují se novější modely v citaci a atribuci, nebo zůstávají stejně chybové? → halucinace-falesne-atribuce.
  • Objem návštěvnosti z AI platforem pro česká média. Globálně <1 %; česká čísla chybí.
  • Pokrytí licenčního trhu. Veřejně známé jsou jen velké dohody; jaký podíl trhu reálně pokrývají? → licencovani-trzni-asymetrie.
  • Homogenizace na zpravodajských textech. Měřeno zatím jen na kreativních úlohách (doshi-hauser-2024) — přenos na newsroom je analogie. → homogenizace-obsahu.

Otázky k prozkoumání

  • AI Mode vs. AI Overviews u Googlu — liší se dopad na proklik?
  • Seznam vlastní režim oddělení crawlerů a opt-outu jako Google? → crawler-separation-opt-out.
  • Koexistence českých oborových hlasů AOV / SLPV / SPIR — doplňují se, nebo si konkurují?
  • Mění „ceremoniální citace” dlouhodobě důvěru ke konkrétní značce (ne jen jednorázové vnímání)?
  • Přenos experimentů o transparentnosti (khatiwada-2026) na český kontext.

Kandidáti na vlastní stránku (zatím jen zmínky)

  • Datové korpusy (C4, Common Crawl detailněji) · britská CMA jako instituce · konkrétní redakční AI pravidla českých vydavatelů.