# AI Pripravenosť webu — Slovník kontrol

20 kontrol pripravenosti na AI

---

## A1 — Organization schema

**Čo to je:** Overenie prítomnosti Organization schema markup, ktorý definuje základné informácie o firme — názov, logo, kontaktné údaje, sociálne siete a právnu formu. Tento markup vytvára digitálnu identitu organizácie.

**Prečo je to dôležité:** AI systémy používajú Organization schema na budovanie knowledge grafu o firme. Keď sa používateľ opýta ChatGPT alebo Google AI na vašu firmu, štruktúrované dáta zabezpečia presné a kompletné odpoveďe vrátane loga a kontaktov.

**Príklad z praxe:** Keď Google zobrazuje Knowledge Panel pre firmu ako Slovenská sporiteľňa, čerpá práve z Organization schema. Firmy bez tohto markup-u často nemajú Knowledge Panel alebo obsahuje nesprávne údaje prevzaté z tretích strán.

### Zdroje
- [Local Business Structured Data](https://developers.google.com/search/docs/appearance/structured-data/local-business) — Google

---

## A2 — Product schema

**Čo to je:** Kontrola Product schema na produktových stránkach e-shopov a služieb. Obsahuje cenu, dostupnosť, hodnotenia a popis produktu v strojovo čitateľnom formáte. Pre ne-eshopy sa kontrola automaticky preskakuje (N/A).

**Prečo je to dôležité:** AI asistenti ako Google Shopping a ChatGPT plugins využívajú Product schema na porovnávanie produktov a generovanie odporúčaní. Bez tohto markup-u sa vaše produkty nezobrazujú v AI-driven nákupných výsledkoch.

**Príklad z praxe:** Amazon má Product schema na každej produktovej stránke, čo umožňuje Google zobraziť cenu, dostupnosť a hodnotenie priamo vo výsledkoch. E-shopy bez Product schema strácajú až 30% organického trafficu z nákupných dopytov.

### Zdroje
- [Product Structured Data](https://developers.google.com/search/docs/appearance/structured-data/product) — Google

---

## A3 — FAQ schema

**Čo to je:** Overenie prítomnosti FAQ (Frequently Asked Questions) schema markup na stránkach s často kladenými otázkami. Pre stránky bez FAQ sekcie sa kontrola automaticky preskakuje (N/A).

**Prečo je to dôležité:** FAQ schema je priamy zdroj pre AI odpoveďe. Keď ChatGPT alebo Google AI Overviews hľadajú odpoveď na otázku, preferujú obsah označený FAQPage schema, pretože je už vo formáte otázka-odpoveď.

**Príklad z praxe:** Cloudflare má na svojich produktových stránkach FAQ schema, vďaka čomu sa ich odpoveďe zobrazujú priamo v Google výsledkoch ako expandovateľné otázky. Toto zvyšuje zaberaný priestor v SERP a CTR.

### Zdroje
- [FAQ Structured Data](https://developers.google.com/search/docs/appearance/structured-data/faq) — Google

---

## A4 — Review/Rating schema

**Čo to je:** Overenie prítomnosti Review a AggregateRating schema na stránkach s hodnoteniami produktov alebo služieb. Pre weby bez recenzií alebo hodnotení sa kontrola automaticky preskakuje (N/A).

**Prečo je to dôležité:** AI modely využívajú Review schema ako signál dôveryhodnosti a kvality. Keď AI generuje odporúčania, uprednostňuje zdroje s overenými hodnoteniami a recenziami od reálnych používateľov.

**Príklad z praxe:** Booking.com používa AggregateRating schema na všetkých hoteloch, čo umožňuje Google zobraziť hviezdičkové hodnotenie priamo vo výsledkoch. Hotely s viditeľným ratingom majú o 25% vyššiu mieru preklikov.

### Zdroje
- [Review Snippet Structured Data](https://developers.google.com/search/docs/appearance/structured-data/review-snippet) — Google

---

## A5 — AI bot policy

**Čo to je:** Analýza robots.txt a meta tagov pre AI crawlery (GPTBot, ClaudeBot, Google-Extended a ďalšie). Kontrola zisťuje, či web má explicitnú politiku pre AI boty, hodnotí jasnosť a zrozumiteľnosť pravidiel — či robots.txt obsahuje explicitné pravidlá pre každý AI crawler zvlášť, či existuje verejná stránka s vysvetlením politiky a či sú pravidlá konzistentné naprieč robots.txt a meta tagmi. Hodnotí aj strategický tradeoff — blokovanie AI botov môže chrániť obsah, ale znižuje AI viditeľnosť.

**Prečo je to dôležité:** Strategické riadenie prístupu AI botov je kľúčové. Úplné blokovanie znamená, že vaša firma nebude existovať v AI odpoveďíach. Naopak, úplné povolenie môže viesť k nežiaducemu trénovaniu na vašom obsahu bez kompenzácie. Nejasná AI bot politika vedie k nekonzistentnému správaniu crawlerov.

**Príklad z praxe:** The New York Times zablokoval GPTBot v robots.txt, čím ochránil svoj obsah pred trénovaním AI, ale stratil viditeľnosť v ChatGPT. Naopak Stripe povoľuje AI crawlery, pretože chce byť primárny zdroj informácií o platobných API.

### Zdroje
- [Overview of OpenAI Crawlers](https://developers.openai.com/api/docs/bots) — OpenAI
- [Anthropic Web Crawler Policy](https://privacy.claude.com/en/articles/8896518-does-anthropic-crawl-data-from-the-web-and-how-can-site-owners-block-the-crawler) — Anthropic
- [AI Crawl Control](https://developers.cloudflare.com/ai-crawl-control/) — Cloudflare

---

## A6 — llms.txt existencia

**Čo to je:** Kontrola existencie súboru /llms.txt — nového štandardu, ktorý poskytuje AI modelom štrukturovaný prehľad o webe v Markdown formáte. Hodnotí sa len prítomnosť súboru — kvalita obsahu sa hodnotí v samostatnej kontrole A7.

**Prečo je to dôležité:** Súbor llms.txt je navrhnutý špeciálne pre LLM modely, aby rýchlo pochopili účel webu, jeho služby a štruktúru. Na rozdiel od robots.txt, ktorý riadi prístup, llms.txt aktívne pomáha AI porozumieť vášmu obsahu. Samotná existencia je silný signál, že web je AI-ready.

**Príklad z praxe:** Stripe má jeden z najlepších llms.txt súborov — obsahuje prehľad produktov, linky na dokumentáciu a API referencie. Vďaka tomu ChatGPT a Claude dokážu presné odpoveďáť na otázky o Stripe produktoch.

### Zdroje
- [The /llms.txt File Specification](https://llmstxt.org/) — llmstxt.org
- [OpenAI llms.txt Documentation](https://developers.openai.com/api/docs/llms.txt) — OpenAI

---

## A7 — llms.txt kvalita obsahu

**Čo to je:** Hodnotenie kvality obsahu súboru /llms.txt — dĺžka, popis webu, počet linkov na sekcie, prítomnosť .md odkazov a celková informatívnosť. Ak llms.txt neexistuje (A6=fail), táto kontrola je automaticky N/A.

**Prečo je to dôležité:** Nestačí mať len prázdny alebo minimálny llms.txt. AI modely potrebujú kvalitný obsah — popis webu, linky na kľúčové sekcie, .md verzie dokumentácie. Kvalitný llms.txt výrazne zvyšuje presnosť AI odpoveďí o vašom webe.

**Príklad z praxe:** OpenAI má na developers.openai.com/api/docs/llms.txt detailný prehľad s linkami na všetky API sekcie vrátane .md verzií. Nekvalitný llms.txt s jedným riadkom 'Toto je náš web' nepomáha AI modelom takmer vôbec.

### Zdroje
- [The /llms.txt File Specification](https://llmstxt.org/) — llmstxt.org

---

## A8 — llms-full.txt (bonus)

**Čo to je:** Bonusová kontrola existencie súboru /llms-full.txt — rozšírenej verzie llms.txt s kompletným obsahom dokumentácie v jednom Markdown súbore. Táto kontrola nikdy nepenalizuje — ak súbor neexistuje, je hodnotená ako N/A a neovplyvňuje skóre.

**Prečo je to dôležité:** Súbor llms-full.txt umožňuje AI modelom načítať celú dokumentáciu v jednom requeste bez nutnosti crawlovať desiatky stránok. Toto dramaticky zrýchľuje pochopenie produktu a znižuje chybovosť AI odpoveďí. Keďže ide o špecifickú potrebu dokumentačných webov, kontrola funguje ako bonus — odmení weby, ktoré ho majú, ale netrestá tie, ktoré ho nemajú.

**Príklad z praxe:** OpenAI poskytuje llms-full.txt na developers.openai.com/api/llms-full.txt, ktorý obsahuje celú API dokumentáciu v jednom súbore. Konkurenčné AI služby tak môžu rýchlo indexovať OpenAI API bez crawlovania stoviek stránok.

### Zdroje
- [The /llms.txt File Specification](https://llmstxt.org/) — llmstxt.org
- [OpenAI llms.txt Documentation](https://developers.openai.com/api/docs/llms.txt) — OpenAI

---

## A9 — BLUF (Bottom Liné Up Front)

**Čo to je:** Hodnotenie, či stránka prezentuje kľúčovú informáciu na začiatku obsahu — princíp BLUF. AI modely extrahujú odpoveďe prevažne z prvých odsekov, preto je umiestnenie hlavnej myšlienky na začiatok kritické.

**Prečo je to dôležité:** AI modely pri generovaní odpoveďí dávajú najväčšiu váhu prvým odsekom stránky. Ak je kľúčová informácia zakopaná v strede alebo na konci textu, AI ju môže prehliadnuť a použiť menej relevantnú informáciu.

**Príklad z praxe:** Wikipédia používa princíp BLUF na každom článku — prvý odsek vždy obsahuje definíciu a najdôležitejšie fakty. Preto AI modely tak často citujú Wikipédiu — kľúčová informácia je vždy na začiatku.

### Zdroje
- [Creating Helpful Content](https://developers.google.com/search/docs/fundamentals/creating-helpful-content) — Google

---

## A10 — Content structure (lists, tables)

**Čo to je:** Analýza štruktúry obsahu — používanie odrážkových a číslovaných zoznamov, tabuliek a štruktúrovaných formátov. Dobre štruktúrovaný obsah so zoznamami a tabuľkami je ľahšie parsovateľný pre AI modely.

**Prečo je to dôležité:** AI modely spracúvajú štruktúrovaný obsah efektívnejšie ako súvislý text. Zoznamy umožňujú extrakciu bodových odpoveďí a tabuľky poskytujú porovnateľné dáta v prehľadnom formáte.

**Príklad z praxe:** Dokumentácia Cloudflare používa code bloky, zoznamy a tabuľky na každej stránke. Preto AI asistenti dokážu presné odpoveďáť na technické otázky o Cloudflare produktoch s konkrétnymi parametrami z tabuliek.

### Zdroje
- [Google Search Essentials](https://developers.google.com/search/docs/essentials) — Google

---

## A11 — FAQ sekcia na stránke

**Čo to je:** Kontrola prítomnosti FAQ sekcie priamo v obsahu stránky (nielen schema markup). Pre stránky kde FAQ nemá zmysel (napr. kontaktná stránka) sa kontrola preskakuje (N/A).

**Prečo je to dôležité:** FAQ sekcie sú ideálnym zdrojom pre AI odpoveďe, pretože obsahujú páry otázka-odpoveď v prirodzenom jazyku. AI modely môžu tieto páry priamo použiť ako odpoveďe na používateľské dopyty.

**Príklad z praxe:** Shopify má na každej produktovej stránke FAQ sekciu s reálnymi otázkami zákazníkov. Tieto odpoveďe sa pravidelne zobrazujú v Google AI Overviews a ChatGPT, pretože presné zodpoveďájú bežným dopytom používateľov.

### Zdroje
- [FAQ Structured Data](https://developers.google.com/search/docs/appearance/structured-data/faq) — Google

---

## A12 — Definície/glossary patterns

**Čo to je:** Detekcia definičných vzorov a slovníkových sekcií na stránke — napríklad formát 'Pojem: definícia', definičné zoznamy (dl/dt/dd) alebo dedikované glossary stránky. Pre stránky bez odbornej terminológie sa preskakuje (N/A).

**Prečo je to dôležité:** AI modely aktívne vyhľadávajú definície pojmov na budovanie znalostnej bázy. Stránky s jasne označenými definíciami sa stávajú autoritatívnym zdrojom pre AI pri vysvetľovaní odborných termínov.

**Príklad z praxe:** MDN Web Docs (Mozilla) používa konzistentný vzor definícií pre každý webový API a CSS vlastnosť. Preto keď sa opýtate ChatGPT na CSS flexbox, odpoveď často vychádza práve z MDN definícií.

### Zdroje
- [Creating Helpful Content](https://developers.google.com/search/docs/fundamentals/creating-helpful-content) — Google

---

## A13 — Knowledge chunkability & content depth

**Čo to je:** Hodnotenie, ako dobre sa obsah stránky dá rozdeliť na samostatné znalostné bloky (chunks). Každý chunk by mal obsahovať jednu ucelenú myšlienku s jasným nadpisom a kontextom. Zároveň sa hodnotí unikátnosť, hĺbka a jasnosť obsahu.

**Prečo je to dôležité:** RAG (Retrieval-Augmented Generation) systémy rozdeľujú webový obsah na chunky pred uložením do vektorovej databázy. Ak je obsah zle členený, chunky strácajú kontext a AI generuje nepresné alebo neúplné odpoveďe.

**Príklad z praxe:** Dokumentácia Stripe API má každý endpoint v samostatnej sekcii s nadpisom, popisom, parametrami a príkladmi. Toto umožňuje AI systémom presné extrahovať informácie o konkrétnom endpointe bez kontaminácie z iných sekcií.

### Zdroje
- [Creating Helpful Content](https://developers.google.com/search/docs/fundamentals/creating-helpful-content) — Google
- [Google Search Essentials](https://developers.google.com/search/docs/essentials) — Google

---

## A14 — Reference / evidence signals

**Čo to je:** Kontrola prítomnosti referencií, citácií a dôkazov v obsahu — externé linky na štúdie, štatistiky s uvedením zdroja, citácie odborníkov. Tieto signály zvyšujú dôveryhodnosť obsahu pre AI systémy.

**Prečo je to dôležité:** AI modely hodnotia dôveryhodnosť zdrojov na základe referencií a evidencie. Obsah podložený overiteľnými zdrojmi má vyššiu šancu byť citovaný v AI odpoveďíach.

**Príklad z praxe:** Články na HubSpot Blog vždy obsahujú linky na výskumy, štatistiky a case studies. Preto sú HubSpot články jedným z najčastejšie citovaných zdrojov v AI odpoveďíach na marketingové otázky.

### Zdroje
- [Google Search Essentials](https://developers.google.com/search/docs/essentials) — Google

---

## A15 — Freshness signals

**Čo to je:** Detekcia signálov aktuálnosti obsahu — dátum publikácie, dátum poslednej aktualizácie, verzia dokumentu. Pre homepage sa kontrola preskakuje (N/A), pretože homepage nemá typicky dátum publikácie.

**Prečo je to dôležité:** AI modely preferujú aktuálny obsah a používajú freshness signály na rozhodovanie, ktorý zdroj citovať. Zastaraný obsah bez dátumu aktualizácie má nižšiu prioritu v AI odpoveďíach.

**Príklad z praxe:** Dokumentácia Google Cloud zobrazuje 'Last updated' dátum na každej stránke. Keď AI porovnáva dva zdroje o rovnakej téme, preferuje ten s novším dátumom aktualizácie.

### Zdroje
- [Creating Helpful Content](https://developers.google.com/search/docs/fundamentals/creating-helpful-content) — Google

---

## A16 — Entity & author completeness

**Čo to je:** Kontrola kompletnosti informácií o autorovi a entitách na stránke — meno autora, bio, kontakt, sociálne profily a prepojenie s organizáciou. Hodnotí sa E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness).

**Prečo je to dôležité:** AI systémy budujú knowledge graf autorov a organizácií. Kompletné autorské profily zvyšujú dôveryhodnosť obsahu a AI modely preferujú citovať obsah od identifikovaťeľných expertov v danom odbore.

**Príklad z praxe:** Články na Mayo Clinic vždy obsahujú meno lekára, jeho špecializáciu a credentials. Preto AI modely pri zdravotných otázkach uprednostňujú Mayo Clinic pred anonymnými zdravotnými webmi.

### Zdroje
- [Google Search Essentials](https://developers.google.com/search/docs/essentials) — Google

---

## A17 — AI-friendly content formats & feeds

**Čo to je:** Hodnotenie, či web poskytuje obsah vo formátoch optimalizovaných pre AI spracovanie — Markdown verzie stránok, RSS feed s plným obsahom, API alebo dátové feedy. Pre weby kde API nemá zmysel sa API časť kontroly preskakuje (N/A).

**Prečo je to dôležité:** AI crawlery a agenty preferujú čistý obsah bez navigačného šumu. Weby, ktoré poskytujú Markdown alebo clean verzie obsahu, sú efektívnejšie spracovateľné a majú vyššiu šancu byť zahrnuté v AI odpoveďíach.

**Príklad z praxe:** Cloudflare ponúka funkciu Markdown for Agents — keď AI agent pošle požiadavku s Accept: text/markdown, dostane čistú Markdown verziu stránky namiesto plného HTML. Stripe poskytuje komplexné REST API s OpenAPI špecifikáciou.

### Zdroje
- [Cloudflare Markdown Conversion](https://developers.cloudflare.com/workers-ai/features/markdown-conversion/) — Cloudflare
- [The /llms.txt File Specification](https://llmstxt.org/) — llmstxt.org

---

## A18 — Linkability of key facts

**Čo to je:** Kontrola, či kľúčové fakty a informácie na stránke majú priame URL (anchor linky) — či nadpisy obsahujú ID atribúty, či existujú deep links na konkrétne sekcie a či sa dajú zdieľať konkrétne informácie.

**Prečo je to dôležité:** AI systémy potrebujú odkazovať na konkrétne fakty, nie len na celé stránky. Keď AI cituje zdroj, deep link na konkrétnu sekciu zvyšuje dôveryhodnosť odpoveďe a umožňuje používateľovi rýchlo overiť informáciu.

**Príklad z praxe:** GitHub dokumentácia automaticky generuje anchor linky pre každý nadpis, čo umožňuje presné citovanie. Keď ChatGPT odkazuje na GitHub docs, používateľ sa dostane priamo na relevantnú sekciu.

### Zdroje
- [Google SEO Starter Guide](https://developers.google.com/search/docs/fundamentals/seo-starter-guide) — Google

---

## A19 — Changelog / release notes

**Čo to je:** Detekcia changelogu alebo release notes na webe — história zmien, nové funkcie, opravené chyby. Pre weby kde changelog nemá zmysel (reštaurácie, lokálne služby) sa kontrola preskakuje (N/A).

**Prečo je to dôležité:** Changelog je kľúčový freshness signál pre AI modely. Pravidelne aktualizovaný changelog signalizuje aktívne udržiavaný produkt a AI modely ho používajú na overenie aktuálnosti informácií o produkte.

**Príklad z praxe:** Vercel má verejný changelog na vercel.com/changelog s dátumami a detailnými popismi zmien. Keď sa používateľ opýta AI na najnovšie funkcie Vercelu, AI dokáže poskytnúť aktuálnu odpoveď práve vďaka štruktúrovanému changelogu.

### Zdroje
- [Creating Helpful Content](https://developers.google.com/search/docs/fundamentals/creating-helpful-content) — Google

---

## A20 — Semantic HTML (article, section, nav, aside)

**Čo to je:** Kontrola používania sémantických HTML5 elementov — article, section, nav, aside, main, header, footer. Tieto elementy poskytujú AI modelom kontextové informácie o úlohe jednotlivých častí stránky.

**Prečo je to dôležité:** AI crawlery používajú sémantické HTML elementy na identifikáciu hlavného obsahu stránky. Element article označuje primárny obsah, nav navigáciu a aside vedľajší obsah — toto pomáha AI ignorovať šum a extrahovať relevantný obsah.

**Príklad z praxe:** Web.dev (Google) dôsledne používa sémantický HTML — hlavný obsah je v article, navigácia v nav a súvisiace linky v aside. AI crawlery tak môžu efektívne extrahovať len edukačný obsah bez navigačného šumu.

### Zdroje
- [Google Search Essentials](https://developers.google.com/search/docs/essentials) — Google

---