1. Dashboard
  2. Artikel
  3. Mitglieder
    1. Letzte Aktivitäten
    2. Benutzer online
    3. Team
    4. Mitgliedersuche
  4. Forum
    1. Unerledigte Themen
  • Anmelden
  • Registrieren
  • Suche
Dieses Thema
  1. HTML - Webmaster Forum
  2. HTML / Webmaster Forum
  3. HTML & CSS Forum

robots.txt

  • Nico1994
  • 21. Oktober 2010 um 17:30
1. offizieller Beitrag
  • Nico1994
    Interessierte/r
    Beiträge
    83
    • 21. Oktober 2010 um 17:30
    • #1

    Hi,

    habe jetzt keinen wirklich passenden Bereich gefunden, sollt ich ihn jedoch übersehen haben, wäre es toll wenn es in den richtigen verschoben werden könnte.

    Es geht um eine robots.txt Datei, die ich gerade erstellt habe:

    Code
    User-agent: *
    Sitemap: [URL]http://www.nicolas-pecher.com/sitemap.xml[/URL]



    Also, es sollen alle Spider durchgelassen werden, Sitemap habe ich angeführt, nur wie sieht das mit Allow aus? Ich will, dass die Spider jede Seite besuchen, muss ich da jetzt für jede Seite zb: Allow: http://www.blabla.htm anführen, oder reicht es, wenn ich Allow erst gar nicht erwähne, dass dann der Spider automatisch alle Seiten anschaut?

    Mit freundlichen Grüßen,
    Nico

    http://www.nicolas-pecher.com <- Meine Website
    Mein neues Projekt: http://www.mc-web.net

  • admin
    Administrator
    Reaktionen
    6
    Artikel
    1
    Beiträge
    12.794
    • 21. Oktober 2010 um 19:23
    • Offizieller Beitrag
    • #2
    Code
    User-agent: *

    Damit erlaubst Du allen Spider das indizieren deiner Seite.

    Nur wenn du Teile oder Bereiche von deiner HP ausschließen möchtest wäre noch ein Zusatz notwendig
    zb so

    Code
    Disallow: /search.php

    Oder wenn du bestimmte Spider ganz ausschließen wolltest
    zb so

    Code
    User-agent: Spinn3r
    Disallow: /

    oder einzelne Spider etwas Bremsen möchtest, die zu aggressiv deine Site Spidern
    zb so

    Code
    User-agent: Slurp
    Crawl-delay: 30

Tags

  • www
  • hp
  • http
  • teile
  • code
  • php
  • datei
  • htm
  • search
  • xml
  • spider
  • aggressiv
  • bremse
  • agent
  • robots
  • robots.txt
  • allow
  • delay
  • url
  • indizieren
  1. Datenschutzerklärung
  2. Impressum
Community-Software: WoltLab Suite™
  • Alles
  • Dieses Thema
  • Dieses Forum
  • Artikel
  • Seiten
  • Forum
  • Erweiterte Suche