Bei Quatschadresse Websiteaufruf statt 404 Seite

  • Hi Leute,


    für den SEO Check einer Website ist das Optimizer Tool von Sistrix im Einsatz und gibt einen 404 Fehler aus, was in diesem Fall bedeutet:

    es kommt bei der Eingabe einer "Quatschdoomain" keine 404 Seite sondern der Statuscode 200, also eine Webpage die eigentlich nicht exisitieren sollte, in diesem Fall der Kontaktbeitrag als einzelner Contet Beitrag (also nicht als Menülink).


    sicherheitdirekt.de/7z6x5r7h2ugf5b1a



    Die 404 Seit ist eigentlich völlig i.O. d.h. bei allen /xyzduwbcuwb Adressen die ich mir ausdenke, kommt 404 (und nicht 200).


    Kennt jemand das Problem, könnte es mit dem Kontaktbeitrag zusmamenhängen der irgendwie als "Catch All" konfiguriert ist. (Oder kennst Sistrix einfach diese Domain und generiert unnötige Fehler?)


    Jedenfalls sollte bei JEDER nicht existieren Domain IMMER die 404 Seite kommen.


    Who can help?

  • Kann ich nicht beantworten, da ich das Tool nicht im Einsatz habe.


    Warum sollte Sixtrix 404 mit einer anderen Bedeutung ausgeben? Wäre ja kontraproduktiv.


    "Sistrix gibt einen 404 Fehler aus, was in diesem Fall bedeutet keine 404 Seite sondern der Statuscode 200"

  • Deinen Link kann man nicht anklicken, da man sich einloggen müsste. Welche konkrete URL ist denn überhaupt betroffen?

    Wenn 200, dann gibt es die Seite. Müsste man also in Joomla was deaktivieren oder eventuell eine Weiterleitung machen.


    Ist wohl ähnlich dieser URL, die es wahrscheinlich auch nicht geben düfte, aber dennoch ein 200er liefert, da sie existiert:

    https://www.sicherheitdirekt.de/index.php?option=com_content

  • Hm, spannend. Das scheint am Routing zu liegen. Der Router interpretiert sicherheitdirekt.de/7z6x5r7h2ugf5b1a als Artikel mit der ID 7 und ignoriert alles nach der 7. Normalerweise werden auf diese Art URLs wie /7-alias-hier-einsetzen aufgelöst. Aber hinter der Zahl kann wohl einfach irgendwas beliebiges stehen.


    Vielleicht kann da ein Routing-Experte ( Hackwar? zero24?) beurteilen, ob das so gewollt ist?

  • Bisher hatte ich diesbezüglich bei den Suchmaschinen noch keinerlei Probleme, da solche URLs noch nicht indexiert wurden.

    Hat jemand andere Erfahrungen gemacht?


    Vermutlich sind solche Analysen einfach nur etwas "überoptimiert". Dennoch: Das Problem gibt es ja schon länger.


    Auf deiner Seite sind allerdings gemischte Inhalte: Google-Fonts, welche direkt von Google geladen werden und das auch noch über http. Das hat auf jeden Fall Priorität.

  • Sieht nur temporär nach einem Routing-Problem aus.


    Wahrscheinlich wird da von Input einfach auf int gefiltert und dann kommt sowas raus, vermutlich sollte abc7z null sein und nicht 7, die Frage ist darum, ob diese Filterung so ganz allgemein Sinn macht oder ein besonderer Filter her müsste.

  • Gibt es irgendwo einen Katalog von direkt aufrufbaren URLs, für die es sinnvoll wäre, Umleitungen einzurichten oder andere Mittel zu deren Verhinderung einzusetzen?

    Katalog? Nicht das ich wüsste.

    Du kannst aber mittels site:www.example .org (hier natürlich deine Domain einsetzen) auf Google die indexierten URLs anschauen und bei Bedaf entscheiden, ob gehandelt werden sollte.

  • Tatsächlich kommt dieses Problem bei allen URLs die mit einer Zahl anfangen

    also

    sicherheitdirekt.de/2xyz...
    sicherheitdirekt.de/3...

    sicherheitdirekt.de/4...

    usw.


    Es kommt dann immer der Artikel mit der zuerst genannten Zahl nach dem / (=Artikel-ID), alles danach ist nicht relevant.

    Ist es so, dass dies, wie Anka es formulierte, ein allg. Joomla Problem sein könnte, für das bislang k. Lösung exisitiert oder gibt es da evtl Möglichkeiten den Router oder Joomla entsprechend anzupassen?

  • Gibt es irgendwo einen Katalog von direkt aufrufbaren URLs, für die es sinnvoll wäre, Umleitungen einzurichten oder andere Mittel zu deren Verhinderung einzusetzen?

    Es gibt diverse (mindestens für jede installierte Komponente) und deshalb kann man nur empfehlen, sich auf das zu konzentrieren, welche Links Suchmaschinen eben fehlerhaft gesammelt haben und nicht, was so alles rein theoretisch eine 200 ergeben könnte.


    Joomla verwendet eben als Defaultwerte bzw. Fallback option=com_content, wenn es nix anderes aus der URL ermitteln kann. In obigem Fall wird das 7xyz dann als id ausgewertet. Die 7 deswegen, weil ein (int) 7xyz dafür verwendet wird. Was auch insofern sinnvoll ist, weil ja die Beitrags-URLs beim traditionellen Router eine Kombination aus id und Alias sind.

    Code
    example.org/blablubb/.../7-ich-bin-der-alias-des-beitrags

    Nur, wenn kein Beitrag oder Kategorie(? bin grad nicht sicher) mit id=7 gibt, kommt eine 404 statt 200.


    Ich verwende so was auf einer Seite als Kurz-URLs für Beiträge, wäre also nicht glücklich, wenn Joomla das Verhalten plötzlich ändern würde ;)

    Code
    example.org/7

    Wenn Sistrix das nach 1000 Jahren Joomla nicht weiß, sollte man eher Sistrix anzweifeln.


    Zurück zur Frage:

    Ich hatte bspw. anfangs unachtsamerweise (=durch eigene Blödheit bzw. durch ein dämliches Canonical-Plugin) bei Suchmaschinen einen Link der Art

    Code
    example.com?option=com_contact&...sonstiger-Kram

    Per Joomla-PHP kann man das z.B. so umleiten

    Da jeder Seitenaufruf vorher geprüft werden muss, frisst das natürlich Performance. Deshalb der Hinweis oben, dass man sich auf reale Szenarios konzentrieren sollte und nicht auf theoretischen Kram.


    Geht vermutlich auch per .htaccess. Finde nur kein Beispiel in meinem Verhau.


    Anderes kann man auch per robots.txt ausschließen, damit Suchmaschinen es vergessen. Z.B. die berühmten /component/-Links, die auch bei unachtsamer Einrichtung der Seite auftauchen könnten.

    Code
    Disallow: /component/content/
    Disallow: /component/contact/
    Disallow: /component/mailto/
    Disallow: /component/mailto
    Disallow: /component/tags/
    Disallow: /component/weblinks/
    Disallow: /component/users/

    Eigentlich hat man die Probleme nicht, wenn man von Anfang an die Menüstruktur der Seite richtig aufgesetzt hat und dann erst Suchmaschinen darauf los lässt (und nicht irgendwelche blöden Canonical-Plugins u.ä. verwendet, wie ich damals ;) ).

  • Vielleicht kann da ein Routing-Experte ( Hackwar? zero24?) beurteilen, ob das so gewollt ist?

    Da kann ich leider nicht weiterhelfen Hannes ist da der bessere Ansprechpartner.


  • Wahrscheinlich meint der TE um diesen Link hier:


    https://www.sicherheitdirekt.de/7z6x5r7h2ugf5b1a


    Hat evtl. etwas damit zu tun, dass Joomla bei einer beliebigen Ziffer/Zahl in der URL den Beitrag mit dieser ID aufruft. Dieses Verhalten ist zwr schon länger bekannt, aber mir ist bis jetzt noch nicht ganz klar, wie man es mit Bordmitteln verhindern kann.


    Anka hat recht. Das ist ein bekanntes Problem und hat mich gerade an meine ersten Gehversuche mit Joomla erinnert: https://github.com/joomla/joomla-cms/pull/8141