Probleme mit Ghost URLS

  • Joomla Version
    5.1.
    PHP Version
    PHP 8.1.x
    Hoster
    Hetzner
    Link (URL) zur Seite mit dem Problem
    https://www.team-survival.de/

    Hallo,

    ich habe gerade bemerkt, dass ich bei mir an die Startseite ein ?p= anhängen kann und immer die Startseite mit einem 200 HTTP/2 ausgegeben wird. Es kann hinter dem ?p= auch irgendwas stehen, funktioniert auch. Darauf aufmerksam bin ich erst durch verweisende Seiten in der Google Search Console geworden. Ist natürlich nun aus Seo Sicht nicht ganz so gesund. Ist das jetz ein Fehler von Jommla oder habe ich in meinen Weiterleitungen Mist gemacht?

  • Solche URLs werden nur indexiert, wenn sie aktiv generiert werden. Ich sehe auf Deiner Startseite nichts, was diese URLs generieren kann.

    Hattest Du mal eine Suche o.ä. aktiv oder eine Seitennavigation zu Blogbeiträgen, die jetzt nicht mehr vorhanden sind.
    Hast Du die Joomla Weiterleitung mit Sammeln von 404 aktiv?

  • Sammeln ist aktiv. Die Seite habe ich seit 14 Jahren durch die ganzen Versionen durchgezogen. Kann sein, dass ich vieleicht früher mal was mit einem Blog hatte. Darauf gekommen bin ich, weil solche Meldungen bei Google Search kommen:


    Kann ich nicht irgendeine Weiterleitung einrichten, welche alles mit ?pxxx mit einem 301 oder so versieht auf auf die normale URL weiterleitet.


    Google meldet auch solche Duplicate (die URL ist wegen indizierung hier von mir ausgeixxxt):

    Code
    https://www.team-xxx.de/?pageNo=2
       
    https://www.team-xxx.de/?pageNo=3
    
    oder sows, wo ein Slash dahinter gesetzt wird:
    
    https://www.team-xxx.de/team.html/
    https://www.team-xxx.de/medien.html/

    Das ist ein leerer Query-Parameter, ich denke, das Verhalten ist normal

    https://stackoverflow.com/questions/3617…on-website-urls

    Dann ist es aber duplicat Content und wird von Google abgestraft, wenn die gleiche URL unter unbegrenzt vielen URLs mit Header 200 aufgerufen werden kann.

    Einmal editiert, zuletzt von Indigo66 (6. Juni 2024 um 11:30) aus folgendem Grund: 2 Beiträge von CryoW mit diesem Beitrag zusammengefügt.

  • Der Parameter wird von Joomla wahrscheinlich garnicht abgefragt. Deshalb läuft es so als ob der Parameter nicht angegeben wurde.

    Es gab mal so einen Link von extern auf meine Seite. Den hat Google gefunden und seitdem wird dieser regelmäßig von Google abgefragt. Da das Ergebnis immer HTTP 200 ist, kommt Google immer wieder damit.

    Gruß

    kdh

  • Dann ist es aber duplicat Content und wird von Google abgestraft,

    Nein!
    https://www.sistrix.de/frag-sistrix/o…content-penalty

    Duplicate Content - Keine Abstrafung durch google, ABER... - Orange Raven Chemnitz
    Rico StodolkaRico ist Gründer und Inhaber von Orange Raven. Er ist seit über 10 Jahren als Marketing Experte (Studium Uni) speziell für Gambio und WordPress…
    www.orange-raven.de

    Da das Ergebnis immer HTTP 200 ist, kommt Google immer wieder damit.

    Du kannst diese URLs über die Seache Console rauswerfen lassen oder eine Regel in die .htaccess schreiben.

  • Nein!
    https://www.sistrix.de/frag-sistrix/o…content-penalty

    https://www.orange-raven.de/duplicate-cont…ch-google-aber/

    Du kannst diese URLs über die Seache Console rauswerfen lassen oder eine Regel in die .htaccess schreiben.

    Aber Google meldet Sie mir ja als Fehler, und das deshalb die Seite nicht indiziert wird. Ich habe tausende Seiten mit parametern und eigentlich so jede Seite doppelt, wo noch ein Slash hinter .html angehangen wird in der Auswertung. Beide sollen eigentlich laut Einstellung von Jommla SEF nicht angezeigt werden.
    Wie würde denn die Regel ausschauen, dass ich sowas:

    Code
    ?pageNo=2 (hab ich allein über 300 unterschiedliche Seiten allein auf der Startseite, also so: ?pageNo=334 )
    ?p=
    und .html/ 

    mit einem 301 und einer Weiterleitung auf die originale entfernen kann?


    Und noch eine kleine Frage.
    ich habe viele externe Verlinkungen auf https://www.team-survival.de/ueberlebenstraining.html, welche aber leider so von den Leuten verlinkt wurden: https://www.team-xxx.de/ueberlebenstraining/

    Die Verlinkung funktioniert zwar, jedoch ist die .html die richtige.
    Wenn ich jetzt eine einfache 301 Weiterleitung von https://www.team-xxx.de/ueberlebenstraining/ auf https://www.team-survival.de/ueberlebenstraining.html mache, funktionieren aber die Unterseiten wie z.b. https://www.team-survival.de/ueberlebenstra…rvival-nrw.html nicht mehr. Da kommt dann https://www.team-xxx.de/ueberlebenstrainingsurvival-nrw.html mit einer 404 Fehlermeldung.

    Einmal editiert, zuletzt von Indigo66 (6. Juni 2024 um 13:49) aus folgendem Grund: Ein Beitrag von CryoW mit diesem Beitrag zusammengefügt.

  • Hat niemand eine Idee, wie ich das umgehen kann? Es geht weiter und Google meldet neue Seiten und die Geister URLS werden ja leider sogar als kanonisch von Joomla ausgegeben:

    Code
    Duplikat – Google hat eine andere Seite als der Nutzer als kanonische Seite bestimmt
    https://www.team-xxx.de/widerrufsrecht-shop.html/   08.06.2024
    https://www.team-xxx.de/?pageNo=3  07.06.2024