Google verlinkt "tote Menüüberschrift"

  • Hallo,


    ich habe ein kleines Problem mit den Menüpunkten auf einer Internetseite, die mit Joomla erstellt wurde.

    Ich habe mehrere Menüpunkte, die selbst zu keinem Beitrag/... verlinken sollen, sondern einfach nur als Oberüberschrift für darunter geordnete Untermenüpunkte dienen.

    Diese Menüpunkte sind in Joomla erstellt mit der Einstellung: "Menüeintragungstyp: Menü-Überschrift".

    Auf der Webseite selbst funktionierten diese "toten Menüpunkte" wunderbar, allerdings gibt es ein Problem mit Google.


    Wenn ich die Seite mit Google suche, dann zeigt mir Google neben dem eigentlichen Link zur Startseite auch Links zu einzelnen Beiträgen, ... an. - An sich kein Problem, aber Google zeigt mir auch Links mit meinen "toten" "Menüpunkt-Überschriften" an. Diesen Menüpunkten ist ja kein Beitrag zugeordnet, aber Google verlinkt mich dann mit Klick auf die wohl doch irgendwie zugängliche Seite (http/...../tote-menüpunkt-überschrift). Auf dieser wird mir dann eine Liste mit allen Kategorien der Webseite (und Unterkategorien, sowie zugeordneten Beiträgen) angezeigt. Dies ist für die Besucher total verwirrend. Ich möchte gerne, dass Google praktisch nicht zu diesen "toten Menüpunkten" verlinkt - schließlich enthalten sie ja keinen Inhalt, da kein Beitrag ihnen zugeordnet ist.

    Kann mir jemand weiterhelfen? Weiß jemand, wie ich Google klar mache, dass die "toter Menüpunkt"-Seite (http/...../tote-menüpunkt-überschrift) nicht relevant ist und den Besuchern meiner Seite nicht zugänglich ist und folglich auch nicht über Google erreicht werden sollte.


    Viele Grüße

    Luxa



    Jetzt ist noch etwas Seltsames aufgetreten: Wenn ich im Joomla-Administatorbereich den betreffenden "toten Menüpunkt" aufrufe und einfach unverändert speichere, dann erscheint auf der Homepage (unter dem Link für den toten Menüpunkt, der ja eigentlich nicht zugänglich sein sollte (http/...../tote-menüpunkt-überschrift)) statt der Kategorieliste plötzlich die Fehlerseite.

    Woher kommt das? Würde Google jetzt nicht mehr diesen falschen (falsch, da er ja nicht gewünscht ist, da kein Beitrag dahinter liegt) Link in der Googlesuche aufführen (... dauert natürlich einige Woche bis Google seine Links überarbeitet)?

  • Mit einem Link zum Problem, wären wir sicherlich schneller.


    Meist sind das Phänomene, die auftreten, wenn das verwendete Template einen Override von mod_menu drinnen hat, der Override aber aus Zeiten stammt, als es die Menüüberschrift noch nicht gab. Von diesen Templates gibt es überraschend viele. Die haben dann auch kein CSS für Menüüberschrift dabei und man muss nervig nacharbeiten.


    1) Prüfen, ob es eine Datei

    /templates/MEINTEMPLATE/html/mod_menu/default.php

    gibt.

    2.) Prüfen, ob es darin die Zeile ähnlich dieser gibt,

    Code
    1. case 'heading':

    in diesem Kontext oder ähnlich (gelbe Zeilen)

    https://github.com/joomla/joom…/tmpl/default.php#L71-L82


    Bevor ich mir einen Wolf schreibe, schau erst mal.


    Vielleicht reicht ja nach deinem "Seltsames":

    Würde Google jetzt nicht mehr diesen falschen (falsch, da er ja nicht gewünscht ist, da kein Beitrag dahinter liegt) Link in der Googlesuche aufführen (... dauert natürlich einige Woche bis Google seine Links überarbeitet)?

    Du kannst in der Google Search Console die vorübergehende Entfernung von URLs beantragen. Das geht fix. Die URL darf aber dann auch nicht mehr erreichbar sein!


    Sollte sie jetzt gewiss eine 404-Seite anzeigen, wars das schon.


    Google wird dir zwar diesen Link in der Google SearchConsole auch in 20 Jahren noch als "Wichtige Seite nicht erreichbar" oder so anzeigen, vielleicht auch erst in 20 Jahren das erste mal wieder anzeigen, aber, so lange du darauf nicht reagierst, alles gut.

  • Vielen Dank für die schnelle Antwort.
    Für die Menüpunkte werde ich dann jeweils mit meiner "Seltsamen Beobachtung" die betreffenden Seiten-URLs entfernen und dann mit der Google Search Console sie auch aus der Googlesuche löschen. Sollte dann ja dauerhaft sein, da es ja den Link nicht mehr gibt wegen der Fehlerseite.

    [In der default.php konnte ich nichts mit "case heading" oder Ähnlichem finden. Ich denke aber, dass das nicht mehr relevant ist, da es jetzt ja mit den Menüpunkten dann funktionieren sollte.]



    Allerdings sind mir noch ähnliche Probleme bei zwei Dingen aufgefallen:

    1. Für "Kategorien":

    Joomla generiert für jede erstellte Kategorie eine eigene URL (z.B. .../index.php?option=com_content&task=view&id=31 und/oder .../index.php/43-NamederKategorie ; dabei ist 43 die Kategorie ID). Allerdings wird diese Seite/URL gar nicht benötigt und es ist nicht gewollt, dass diese bei der Google-Suche auftritt. Da ich keine Möglichkeit gefunden habe, dass diese URLs gar nicht existieren, habe ich jetzt bei den Kategorien jeweils in den Einstellungen auf "Robots: Globale Einstellung noindex, nofollow" umgestellt. Damit sollten die Seiten nach dem nächsten Crawling nicht mehr in der Google-Suche auftauchen, oder?
    Gibt es eine Möglichkeit Joomla ganz daran zuhindern, dass diese Kategorie-URLs generiert werden?


    2. In der Google-Suche erscheinen ganz viele https://Webseiten-Name/index.php?1213 , https://Webseiten-Name/index.php?1218 , usw. jeweils mit einer anderen vierstelligen Nummer. Es wird dabei immer zur Startseite verlinkt.

    Ich hab absolut keine Idee, woher diese URLs kommen. Scheinbar müssen sie ja von der Webseite selbst kommen, wenn Google sie findet. Aber ich habe keine Ahnung, warum Joomla so seltsame URLs generiert. - Folglich weiß ich auch nicht wie man diese extrem unnötigen URLs in der Googlesuche los wird. Hat mir da jemand eine Idee?
    Es habe das gleiche Phänomen aber auch schon bei einem anderen URL-Link gesehen. Auch hier wurde einfach eine vierstellige Nummer angehängt.

    [Den Namen der Webseite würde ich, falls notwendig, dann gerne per persönliche Nachricht schicken.]


    Schon mal vielen Dank für alle Tipps und Ratschläge!

  • Wenn Kategorie-URLs in Google auftauchen, hat der Entwickler nicht darauf geachtet, seine URLs Menübasiert aufzubauen.

    In den meisten CMS können Beiträge über mehrere URLs aufgerufen werden. So auch in Joomla, wenn z.B. Beiträge (mit Weiterlesen) über Module ausgegeben werden, für die es keinen Menüpunkt gibt.

    Will man einen Blog betreiben ist das aber eine feine Sache und gewollt.


    Ich habe das Problem nie, da ich bei der Erstellung darauf achte, dass Suchmaschinen nur meine Menüstruktur bekommen und nicht meine Kategoriestuktur. D.h. auch nicht willkürlich Artikel über Module (Newsfalsh / Beitragskategorien / Neueste Beiträge o.ä.) auszugeben ohne zu wissen, was man da macht.
    Hilfreich in so einem Fall ist auch eine Sitemap in der Searchkonsole.


    habe ich jetzt bei den Kategorien jeweils in den Einstellungen auf "Robots: Globale Einstellung noindex, nofollow" umgestellt. Damit sollten die Seiten nach dem nächsten Crawling nicht mehr in der Google-Suche auftauchen, oder?

    Glaube ich nicht, denn die Seiten sind schon im Index und weisen keine 301 oder 404 auf. Warum sollte Google was rauswerfen was ohne Probleme aufrufbar ist?

  • Vielen Dank für deine Antwort.

    Ich habe das Problem nie, da ich bei der Erstellung darauf achte, dass Suchmaschinen nur meine Menüstruktur bekommen und nicht meine Kategoriestuktur.

    Wie macht man das? Wie bewirke ich, dass Google nur die Menüstruktur bekommt? Hätte man da von Anfang an die Robots-Einstellungen entsprechend auf noindex,nofollow stellen müssen oder wie verhinderst du, dass Google nur deiner Menüstruktur folgt?


    Bzw. wie kann ich jetzt, nachdem der Fehler wohl passiert ist, die Kategoriestruktur wieder aus der Googlesuche versuchen zu entfernen?


    Und wie verhindere ich diese komischen URLs, an denen an die eigentliche URL "?1234" einfach willkürlich eine vierstellige Zahl angehängt wird. Google listet mir dadurch z.B. meine Startseite mehr als 10mal auf.

  • Wie macht man das?

    In dem man Google bei der Entwicklung nicht indexieren lässt (.htaccess-Schutz / noindex), bzw. aufpasst, dass erst keiner Kategorie gefolgt werden kann.


    Bzw. wie kann ich jetzt, nachdem der Fehler wohl passiert ist, die Kategoriestruktur wieder aus der Googlesuche versuchen zu entfernen?

    Über die Searchkonsole.

    Und wie verhindere ich diese komischen URLs, an denen an die eigentliche URL "?1234" einfach willkürlich eine vierstellige Zahl angehängt wird. Google listet mir dadurch z.B. meine Startseite mehr als 10mal auf.

    Da muss man erst mal herausfinden wie siese URLs entstehen (Erweiterung? Suche?). Ich habe die bei mir nicht und ich finde das Verhalten ungewöhnlich.

  • Nur Erfahrungswerte:

    Plötzliches noindex,nofollow nimmt Google zwar vermutlich nicht aus dem eigenen Index, hebt ja alles auf, wird aber in Suchergebnissen im Normalfall nicht mehr angezeigt, wenn's dann wirklich auf der sonderbaren Seite das noindex,nofollow gibt. Wenn's ganz blöd läuft, sieht Suchender gelegentlich den Suchtreffer mit Hinweis "Inhalt durch robots.txt gesperrt" oder so ähnlich.


    Wenn man die URL dann zusätzlichr in Search Console vorübergehend entfernt, verschwindet sie aus Suchergebnissen. Da sie aber bei nächstem Besuch dann eine noindex,nofollow hat, respektiert das Google normalerweise. Rätselhafte Ausnahmen bestätigen die Regel.

    (Ich rede von Suchergebnissen, die einem normalen Sucher bei Suche angezeigt werden.)


    Fällt bei dir ja aus, wenn die Startseite angezeigt wird.


    Alternative ist immer auch: Seite tipptopp in Ordnung bringen, alle Einstellungen setzen und eine Neuindexierung beantragen.


    Für ganz verbockte Seiten, wenn das nicht mehr möglich ist, verwende ich als letzte Lösung ein fieses Plugin, das aber nach und nach individuell im Code angepasst werden muss. Will nur sagen, geht dann auch noch für verquaste Seiten, die schon wertvolles Ranking aben.


    Oder halt mehr oder weniger mühsame 301-Umleitungen per .htaccess.


    Du könntest diese sonderbaren Links mit ?1234 mit einem Disallow in die robots.txt eintragen.


    Sonderbare Links können ihre Ursache darin haben, dass man die Seite zu früh für Suchmaschinen erreichbar gemacht hat, also während Arbeit nicht per robots.txt gesperrt hat oder ähnlich. Google vergisst diese Links nicht.

    Warum sollte Google was rauswerfen was ohne Probleme aufrufbar ist?

  • Vielen Dank für eure Hilfe.
    Habe jetzt erstmal einige Seiten manuell über die Google Search Console entfernt und in der robots.txt die Links mit /*? verboten. Mal sehen wie das klappt.
    Mittlerweile habe ich eine Teilursache für diese seltsamen ?1234 Links gefunden. Sie stammten u.a. von meinem Gallery-Tool. Bei dieser Galerie kann man einstellen, dass nicht jedes Bild eine eigene URL angezeigt bekommt (eben nicht die URL ...?1234 (wobei 1234 die Bild-Nummer ist), sondern nur die URL der Seite auf der sich die Galerie befindet). Diese Einstellung wirkt aber scheinbar nur für den Benutzer meiner Webseite und gilt nicht für Google ... für Google war dieser "manuell verborgene" Link scheinbar nicht unsichtbar. Die Entwickler der Galerie sind aber mittlerweile informiert und werden das Problem in künftigen Updates versuchen zu beheben.

    Noch eine Frage zum Schluss. Wisst ihr zufällig, wie man in der Google Search Console eine Neuindizierung für die gesamte Homepage beantragen kann?

    Bei der "alten" Version der Search Console konnte ich das, bei der "neuen" Search Console, auf die Google jetzt scheinbar umstellt (und einige Einstellungen werden auch nur noch mit der "neuen" Console anzeigt), finde ich die betreffende Option nicht. Ich finde nur die Option für das Beantragen der Neuindizierung von einzelnen URLs, nicht für die gesamte Homepage. - Die Seiten, auf denen sich jetzt eine neue "no index" Einstellung befindet, können dadurch (irgendwie auch logisch) nicht neu indiziert werden .... allerdings erkennt Google so aber auch vermutlich nicht, dass die Seite aus dem Suchverlauf rausgeschmissen werden sollte... Bin mal gespannt, wie lange das mit dem manuellen URL-Entfernen klappt ...