Menu

Datum - Svátek

Datum: 
čtvrtek 11.03.2010

Svátek slaví: 

Anděla

Archiv

 «  březen 2010  » 
Po18152229
Út29162330
St310172431
Čt4111825 
5121926 
So6132027 
Ne7142128 

Reklama

Statistiky a validita

TOPlistValid XHTML 1.0 TransitionalValid CSS!FOR FIREFOX READYFOR OPERA READYFOR IE READY Seo servis
Kategorie: Rubriky, Webové aplikace

Soubor SITEMAP - jak na to - 1. díl

sitemapKaždý správce webu má jistě zájem na tom, aby nově vznikající obsah byl co nejrychleji zaindexován vyhledávači a tím pádem dostupný při vyhledávání. Soubory sitemap jsou jednou z možností, jak vylepšit postavení svého webu v očích vyhledávačů, resp. jak je donutit k indexaci stránek nových a i těch stránek, na které není z úvodní stránky webu dobře vidět a nevede na ně téměř žádný odkaz. Pomocí mapy webu v souboru sitemap a v kombinaci se souborem robots.txt prohledávacímu robotovi sdělíte, které stránky se na vašem webu nacházejí a pod jakou adresou je nalezne, které adresáře má přeskočit a soubory v nich naopak nemá indexovat.

Nejčastěji je sitemap XML soubor, nebývá to však podmínka. Často jej můžete najít i s příponami HTML, RSS, TXT či PHP. Sitemap se většinou ukládá do kořenového adresáře webu. Dále se budeme bavit o souboru s příponou XML, jehož strukturu využívají jak vyhledávače Google, tak i domácí Seznam.cz.

Co je to sitemap

Sitemap je xml soubor, ktery má napomoci internetovým vyhledávačům vyznat se na webové stránce. Tento soubor obsahuje souhrn všech stránek, které chce webmaster indexovat ve vyhledávači. Specifikaci sitemap.xml naleznete např. zde a jeho struktura vypadá takto:

<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset>

Popis souboru sitemap

Soubor sitemap obsahuje seznam stránek v podobě XML struktury, ve které je kromě odkazu uveden datum poslední změny stránky, předpokládaná četnost změn na stránce a váha stránky ve srovnání s ostatními stránkami na daném webu. Soubor sitemap má i některá omezení. Mezi nejdůležitější patří:

  • na každém řádku může být jen jedna adresa
  • adresa nesmí být rozdělena na více řádků
  • soubor musí být kódován v UTF-8
  • nejvyšší počet řádků je 50.000


<url> Nadřazený uzel pro každou URL aresu webu, kterou chceme indexovat. Povinný údaj.
<loc> URL stránky. URL musí začínat protokolem (například HTTP). Tato hodnota musí být menší než 2048 znaků. Povinný údaj.
<lastmod> Datum poslední změny souboru
ve standartizovaném W3C formátu,
např. YYYY-MM-DD. Nepovinný údaj.
<changefreq> Jak často je tato stránka pravděpodobně změní. Tato hodnota nemá nic společného s informací, jak často by měl vyhledávač tuto stránku procházet. Platné hodnoty jsou: vždy, každou hodinu, denně, týdně, měsíčně, ročně, nikdy. Nepovinný údaj.
<priority> Priorita této URL ve srovnání s jinými URL na vašich webových stránkách. Platné hodnoty v rozmezí od 0,0 do 1,0. Tato hodnota pouze poskytuje vyhledávačům informaci o struktuře vašich stránek. Výchozí priorita je hodnota 0.5. Nepovinný údaj.


Jak vytvořit sitemap

Vše je odvislé od typu a velikosti vašeho webu.

Statický web

Máte-li menší web, kde jsou stránky statické a rozšiřujete jej pouze občas, např. manuální tvorbou nových HTML souborů, je možné vytvořit soubor sitemap i ručně. Stačí se držet pravidel, jak má struktura souboru sitemap.xml vypadat a hodnoty zadat v běžném textovém editoru.

Dynamický web

Pokud máte stránky robusnější, používáte redakční systém a web často aktualizujete, je nutné sitemap generovat vždy při každé změně obsahu webu.

Generování sitemap

Vycházím z předpokladu, že za generování nechci nic platit, tedy využívání volně dostupných aplikací.

1. Služby na internetu

XML Sitemaps GeneratorAsi nejznémější služba běží na adrese http://www.xml-sitemaps.com/.

Na webu XML Sitemaps máte možnost vytvořit nejenom běžné soubory sitemap.xml pro vyhledávač Google, ale také jejich modifikace určené pro Yahoo a další portály. Na zmíněné webové stránce zadejte do formuláře adresu svého webu směřující na jeho titulní stranu. V selectboxu nastavte rychlost, s jakou svůj web průběžně aktualizujete. Poté nastavte volbu, která bude určovat čas poslední změny webu. Přednastavená volba dosadí datum a čas serveru při procházení dané stránky. Prioritu jednotlivých stránek můžete ponechat na vyhodnocení serveru jak uzná sám za vhodné a nebo nevkládat vůbec. Poté klikněte na tlačítko Start.
Doporučuji pouze jako nouzové řešení než přejdete na své vlastní generování sitemap souboru.

Nevýhody neplacené verze jsou:

  • často přetížený server, generování trvá neúměrně dlouho
  • omezení jen na 500 stránek
  • chybí možnost jakkoliv ovlivnit definici jednotlivých parametrů

2. Generování sitemap v počítači s OS Windows

GSiteCrawlerPo dlouhodobém testování několika programů mne nejvíce zaujal GSiteCrawler.
GSiteCrawler je intuitivní program, který vám velmi pohodlně pomůže vytvořit sitemap soubor pro vaše webové stránky. Obsahuje mnoho nastavení a filtrů, takže vygenerovaný sitemap bude obsahovat jen to co chcete a s hodnotami, které chcete. Generování je možné v rámci localhostu i přímo na webu. V tomto případě je možné využít i integrovaného FTP klienta, který vám nově vygenerovaný sitemap automaticky nahraje na server.


3. Generování sitemap přímo na vlastních stránkách

RAMOK blog



RAMOK blog TIP:

Pokud váš webhosting běží pod Linuxem (PHP protokol), doporučuji aplikaci phpSitemapNG. V dalším díle si tento skvělý script představíme...

phpSitemapNG

RAMOK blog ODKAZY:

Používání souborů Sitemap - GOOGLE
Sitemaps.org - hlavní stránka, struktura souboru
Free Online Sitemap Generator - hlavní stránka volné verze
GSiteCrawler - hlavní stránka, download, průvodce
phpSitemapNG - hlavní stránka, download

print Formát pro tisk

Komentáře rss


Nebyly přidány žádné komentáře.