Startseite » Codierung » Steuern Sie, wie Google Ihre Inhalte mit Metatags indiziert

    Steuern Sie, wie Google Ihre Inhalte mit Metatags indiziert

    Es gibt viele Suchmaschinen, aber meistens kümmern sich Websitebesitzer darum, dass ihre Website bei dem allmächtigen Google indiziert wird. Eine Möglichkeit, um die Suchmaschine besser zu machen, ist es Verwenden Sie Meta-Robotertags.

    Das Meta Robot Tag ist ein Konsens-Meta-Tag zwischen Suchmaschinen wie Google, Yahoo und Bing. Die Verwendung des Meta-Tags ermöglicht Webentwicklern die Kontrolle der Zugriffsmöglichkeiten für Webseiten gegenüber Suchmaschinen-Crawlern. Zum Beispiel so etwas noindex verhindert, dass alle Roboter von den Suchmaschinen Ihre Webseite in ihren Index aufnehmen.

    Googles eigener Roboter heißt Googlebot. In diesem Beitrag werden wir sehen, wie wir Googlebot exklusiv ansprechen Meta-Tags.

    Adressierung des Googlebot

    Um den Googlebot anzusprechen, geben Sie das Meta an Name wie Googlebot statt nur Roboter. In diesem Beispiel wird verhindert, dass Googlebot Ihre Website in ihren Index einfügt. Bots von Bing und Yahoo können jedoch weiterhin die Seite crawlen. Ihre Webseiten werden daher möglicherweise weiterhin in den Suchergebnissen von Bing und Yahoo angezeigt.

      

    Google verfügt über eine Reihe spezieller Roboter, die verschiedene Inhalte wie Bilder, Nachrichten, Videos, Anzeigen und Mobile durchforsten. Google ermöglicht Ihnen, diese Roboter einzeln zu blockieren. Wenn Sie nicht möchten, dass Ihre Website in den Suchergebnissen von Google Mobile angezeigt wird, können Sie das Meta-Robot-Tag folgendermaßen angeben:

      

    Die vollständige Liste der Google-Bot-Typen finden Sie auf der Website-Crawler-Seite von Google.

    Bildindizierung verhindern

    Es ist wirklich irritierend, wenn Sie feststellen, dass Ihr urheberrechtlich geschütztes Bild von einer anderen Person ohne Ihre vorherige Zustimmung verwendet wird. Wenn Sie dies minimieren möchten, können Sie verhindern, dass Google Ihre Bilder in ihren Index einfügt.

    Geben Sie das Meta-Robot-Tag mit dem Wert von an Noimageindex. Dadurch wird verhindert, dass der Roboter alle Bilder auf der Seite indiziert, und Ihre Bilder werden nicht in den Ergebnissen der Google-Bildersuche angezeigt. In diesem Fall suchen die Benutzer normalerweise nach Bildern.

      

    Alternativ können Sie den Metanamen als festlegen Googlebot-Bild um speziell zu verhindern, dass Googles Roboter Ihre Website für Bilder crawlen.

      

    Verhindern Sie das Übersetzen

    Google Chrome bietet mit Hilfe von Google Translate die Übersetzung einer Website in einer anderen Sprache an die bevorzugte oder lokale Sprache des Besuchers an. Während die Übersetzung von Google Translate immer besser wird, ist es bei manchen Sprachen alles andere als perfekt. Die Übersetzungsausgabe könnte manchmal sehr eigenartig sein.

    Wenn Sie nicht möchten, dass Google Ihre Webseiten übersetzt, setzen Sie das Googlebot-Meta auf den Wert von keine Übersetzung, wie so.

      

    Wenn Sie verhindern möchten, dass ein bestimmter Abschnitt der Seite übersetzt wird, können Sie das hinzufügen keine Übersetzung Klasse innerhalb des Elements, das den Inhalt umhüllt:

     

    Google wird dies ignorieren

    vollständig.

    Indizierung nach einer bestimmten Zeit verhindern

    Sie können auch verhindern, dass Google Ihre Webseiten nach einem bestimmten Zeitraum indexiert. Dies ist besonders nützlich für Webseiten, die nur innerhalb eines Zeitrahmens relevant sind, wie beispielsweise eine Seite zur Ereignisregistrierung.

    In diesem Fall möchten Sie wahrscheinlich dem Roboter mitteilen, dass er diese Seite nach dem Ende des Ereignisses nicht crawlen und indizieren soll. Dadurch wird verhindert, dass er in den Suchergebnissen von Google erscheint.

    Geben Sie dazu das Meta-Tag mit dem Wert von an nicht verfügbar_nach dann gefolgt von der Zeitinfo. Das Zeitformat sollte dem RFC-850-Format entsprechen, zum Beispiel: Donnerstag, 26. September, 14 Uhr 10:00 Uhr UTC

      

    Im obigen Beispiel wird der Google-Roboter die Seite nach dem 29. September nicht mehr crawlen. Die Seite wird schließlich aus dem Index entfernt. Sie können die Seite jedoch weiterhin zur Archivierung in Ihrer Website behalten.