Weiterleitungen - URLs sammeln

  • Hallo zusammen,


    vorab, ich habe kein Problem, sondern nur eine Verständnisfrage.


    Ich habe nun seit ein paar Tagen meine neue J4 Seite Online. Nach ein paar Startschwierigkeiten läuft jetzt alles rund - zumindest habe ich noch keine Fehler feststellen können.

    Wen es interessiert: www.doeka-kassel.de


    Meine Menustruktur und auch die URLs für Beiträge habe ich weitgehend beibehalten.

    Für URL´s, die sich geändert haben, habe ich bereits im Vorfeld unter System/Weiterleitungen entsprechende Einträge erstellt.

    Das Weiterleitungs-Plugin ist mit "URLs´sammeln" aktiviert. Nach dem Start habe ich über site:domain.com eine Suchanfrage bei Google gestellt und dort alle! indizierten Einträge geöffnet.

    Die aufgelaufenen 404 habe ich entsprechend umgeleitet.

    Meine Hoffnung war somit alles weitgehend abgearbeitet zu haben.


    Wäre da nicht diese URLs sammeln Funktion.

    Im Backend unter Weiterleitungen laufen Aufrufe auf, von denen ich mir nicht erklären kann, woher die stammen. Beispiele:

    Es gab in 2016 ein Gewinnspiel zum Fußball-EM, dementsprechend einen Link, der natürlich schon lange nicht mehr existiert. Der taucht auf einmal in den Weiterleitungen wieder auf.

    Produkte, die wir seit Jahren nicht mehr Online haben, werden immer noch aufgerufen. Die URLs sind seit ewigen Zeiten gelöscht und auch Google findet dazu nichts. Trotzdem tauchen diese URLs auf einmal wieder auf.

    Links zu Seminaren, die längst Vergangenheit sind und deren URLs gelöscht sind, werden auch wieder gelistet.

    All diese Links sind min. über drei Jahre alt und gelöscht.


    Stammen die 404 von Google oder einer anderen Seite, steht die bezugnehmende Seite dabei, das fehlt hier.

    Ich kann mir auch kaum vorstellen, dass genau diese URLs noch bei irgendjemanden in den Lesezeichen gespeichert sind und just nach der Umstellung aufgerufen werden.
    Besonders dann nicht, wenn ich pro Tag, lt. Matomo, keine 100 Besucher habe und diese gelöschten URLs schon recht speziell waren.


    Meine Frage nun, woher stammen diese Aufrufe? Es scheint bald, als würde meine neue Seite sämtliche alten URLs der Vergangenheit in der alten Datenbank abfragen, die ja immer noch auf dem Server liegt. Gleichwohl meine J4 Seite eine neue Datenbank für sich allein hat. Die J3 Installation lag somit in einer anderen Datenbank und anderem Verzeichnis.

    Und wie gehe ich nun damit um, wieder weiterleiten oder als 404 ins Nirvana laufen lassen?

  • Auch wenn du deine Seiten optimiert hast und alle URLs bei Google korrekt indexiert sind, werden weiterhin jede Menge URLs gesammelt, die ein 404 wiedergeben. Größtenteils werden da einfach irgendwelche URLs ausprobiert durch Bots und Co.. Manchmal sind es typische Wordpress-Links oder Links zu Bildern, die typischerweise im Joomla-Core vorhanden sind. Oder auch Links zum admin- oder download-Verzeichnis. Insbesondere wenn man mehrsprachig arbeitet, werden hier z.B. englische und deutsche Menüpunkte "kombiniert" und nicht existierende URLs aufgerufen.

    Viele alte URLs sind sicherlich auch noch im "Hintergrund" bei den Suchmaschinen gespeichert und werden hin- und wieder noch mal getestet. Das Internet vergisst nicht.

    Alles völlig normal.

    Mit deiner Datenbank hat das nichts zu tun.


    Wenn eine URL nicht existiert und auch zukünftig nicht verwendet wird, dann einfach nichts machen. Durch die 404-Antwort wird ein Großteil in Zukunft nicht mehr aufgerufen werden. Komplett vermeiden kann man das nicht wirklich.

    Das "URL sammeln" kannst du dann in ein paar Wochen ruhig deaktivieren, wenn es nur zum Überprüfen verwendet wird.


    Und wirklich wichtige 301-Weiterleitungen von alter zu neuer URL mache ich persönlich auch immer in der .htaccess. Das hast du ja bereits so realisiert.

  • Nur als Tipp um Übersicht zu behalten: Ich archiviere solche Links (Status- Archiv), die unter "ist halt mal so" auflaufen in der Umleitungskomponente. Dann sind sie aus den Augen aus dem Sinn und werden nicht jedes mal wieder neu erfasst und angezeigt, sondern dümpeln nur im Hintergrund rum.


    Nur als Bestätigung, hat JoomlaWunder schon gesagt: So alte Leichen tauchen auch Jahre(!) später plötzlich wieder auf, selbst in der Google-Search-Console manchmal wieder, weil man bei Google URLs nicht dauerhaft entfernen kann. Ich halte das für No-Go und verstößt sicherlich auch gegen irgendwas, aber ist halt das göttliche Google ;) Komplett ignorieren ist die richtige Variante! Nix tun! Weder in Console, noch in Joomla.


    Die dürfen ja auch weiterhin die in DE rechtlich nicht mehr zulässigen, verfaselten Cookie-Warner ohne "schnelles Ablehnen" nutzen, scheint es ;)

  • Vielen lieben Dank für Eure Zeit und Antworten.

    Dann mach ich es ja richtig.

    Und die URLs die ich nicht will, archiviere ich ebenso. Das hatte ich bei der Umstellung auf J3 auch so gehandhabt, nachdem ich rausgefunden hatte, dass sonst immer wieder die gleichen URLs auftauchen. Sobald ich das "Sammeln" deaktiviert hab, wird das Archiv geleert und der Papierkorb ebenfalls.


    Zu dem Bug. Ich habe eben mal kurz gegoogelt und folgendes gefunden. Anstatt der Weiterleitung wird ein Servererror 500 ausgeworfen.
    Exakt das war bei mir auch unmittelbar nach der Umstellung. Hatte schon wieder Herzrasen bekommen, weil ich dachte, ich hätte was versaut.

    Aus lauter Verzweiflung habe ich dann alles wieder zurückgestellt, meine Domain auf die alte Seite zeigen lassen. Dann nochmals die Domain auf die J4 Seite, Fehler war immer noch da. Herzrasen auch.

    Wenn ich es richtig in Erinnerung habe, habe ich dann die .htaccess zu htaccess.txt umbenannt, und das ganze dann wieder zurück in .htaccess.

    Dann noch das Plugin Advanced redirect installiert und die Optionen eingestellt.


    Was nun davon gefruchtet hat, weiß ich nicht. Aber meine Weiterleitungen funktionieren jetzt. Herzrasen ist weg :P

    Das Plugin finde ich persönlich ganz nett. Es leitet den User auf eine andere Seite (kann man einstellen, wohin) und gibt dort in einen Hinweis aus, dass die aufgerufene Seite nicht existiert. Etwas schicker als die 404 Seite.

    Vielleicht für diejenigen die den Fix nicht einbauen wollen, und nicht aufs Update warten möchten nützlich.