Otevřené otázky a datové mezery

Živá výzkumná agenda báze — kde je důkaz nejslabší a co by šlo doplnit dalším Ingestem nebo webovým hledáním. Vzniká z Lintu (viz log.md). Není to tvrzení, ale seznam mezer.

Datové mezery

Česká behaviorální data o prokliku a ověřování. Chybí domácí měření srovnatelné s Pew (chapekis-lieb-2025) nebo DNR (egan-2026-dnr) — jak Češi reálně proklikávají z AI odpovědí a zda je ověřují. Dnes jen agregovaná vendor/oborová data. → cesky-trh, duvera-konverzacni-rozhrani.
Rozlišení zpravodajství vs. servisní obsah v ČR. Data SPIR jsou agregovaná; u zpravodajství zásadní dopad zatím nedoložen, ale chybí čisté oddělení.
Vývoj přesnosti atribucí napříč generacemi modelů. BBC a EBU je statický snímek (2 700+ odpovědí). Zlepšují se novější modely v citaci a atribuci, nebo zůstávají stejně chybové? → halucinace-falesne-atribuce.
Objem návštěvnosti z AI platforem pro česká média. Globálně <1 %; česká čísla chybí.
Pokrytí licenčního trhu. Veřejně známé jsou jen velké dohody; jaký podíl trhu reálně pokrývají? → licencovani-trzni-asymetrie.
Homogenizace na zpravodajských textech. Měřeno zatím jen na kreativních úlohách (doshi-hauser-2024) — přenos na newsroom je analogie. → homogenizace-obsahu.

Otázky k prozkoumání

AI Mode vs. AI Overviews u Googlu — liší se dopad na proklik?
Má Seznam vlastní režim oddělení crawlerů a opt-outu jako Google? → crawler-separation-opt-out.
Koexistence českých oborových hlasů AOV / SLPV / SPIR — doplňují se, nebo si konkurují?
Mění „ceremoniální citace” dlouhodobě důvěru ke konkrétní značce (ne jen jednorázové vnímání)?
Přenos experimentů o transparentnosti (khatiwada-2026) na český kontext.

Kandidáti na vlastní stránku (zatím jen zmínky)

Datové korpusy (C4, Common Crawl detailněji) · britská CMA jako instituce · konkrétní redakční AI pravidla českých vydavatelů.

AI, média a žurnalistika

Procházet

Otevřené otázky a datové mezery

Datové mezery

Otázky k prozkoumání

Kandidáti na vlastní stránku (zatím jen zmínky)

Graf

Obsah

Příchozí odkazy