Možnosti obrany online vydavatelů proti vytěžování jejich obsahu umělou inteligencí
Sdružení pro internetový rozvoj (SPIR) zveřejnilo 19. 3 . 2026 novou verzi standardizované komunikace, pomocí které se provozovatelé internetových stránek v České republice mohou automatizovaně vymezit proti vytěžování svého obsahu umělou inteligencí. Návrh vznikl jako výsledek samoregulační aktivity a spolupráce podnikatelů v oblasti digitálních služeb a tvůrců obsahu.
Podklad týkající se realizace standardizované komunikace poskytl SPIR také dalším profesním organizacím, které sdružují vydavatele digitálních publikací včetně České unie vydavatelů.
Pokud se chcete bránit vytěžování svého obsahu nástroji generativní umělé inteligence, můžete postupovat podle pravidel obsažených v dokumentu, který je k dispozici zde.
Proč se bránit vytěžování vlastních dat?
K vytěžování dat dochází celoevropsky i celosvětově a do popředí zájmu se mimo tréninková a učící data dostávají také data využívaná k tzv. real-time odpovědím (asistenti umělé inteligence, online sumarizace a obdobné funkce). Od roku 2023, kdy byl nabídnut k aplikaci první způsob ochrany obsahu, rovněž došlo k přirozenému vývoji nástrojů a způsobů, kterými mohou provozovatelé internetových stránek vyjádřit svůj postoj k automatizovanému vytěžování textů a dat (TDM). SPIR se proto ve spolupráci s Asociací online vydavatelů (AOV), Českou unií vydavatelů (ČUV) a Správcem licenčních práv vydavatelů (SLPV) z výše uvedených důvodů rozhodl aktualizovat jednotný standard, díky kterému bude snadné určit, zda a v jaké konkrétní podobě provozovatel internetových stránek opt-out pro TDM nastavil.
Tento jednotný standard využívá tzv. Robots exclusion Protocol (robots.txt), který pro další oblasti užití vznikl již před rokem 2000, formálně byl představen v roce 2019 jako IETF standard RFC 9309 a byl schválen v roce 2022. Standard umožňuje efektivně, transparentně a automaticky komunikovat s internetovými crawlery tak, aby se provozovatelé internetových stránek mohli efektivně rozhodovat ve vztahu k různým způsobům a účelům užití a efektivně uplatňovat své právo podle čl. 4 odst. 3 Směrnice Evropského parlamentu a Rady (EU) 2019/790, případně obdobných zahraničních právních úprav (dále jen “výjimka TDM”). Tento standard je určen jako řešení pro vytěžování prostřednictvím internetových crawlerů, nikoliv pro jiné formy vytěžování dat.
Nový jednotný standard vypracovaný pracovní skupinou SPIR sestává z následujících dvou částí odpovídajících svému zacílení.
1. Užití dat k trénování obecných modelů AI (např. velké jazykové modely) a dalších AI systémů
2. Užití dat k trénování obecných modelů AI a dalších AI systémů a pro účely real-time odpovědí