Ungewöhnliche URLS werden generiert

  • Hallo Zusammen,


    ich bin auf der Fehlersuche bei der Generierung von URLS, die bei Google im Index sind, teilweise als nicht sicher eingestuft werden, teilweise aber auch normal funktionieren.


    Beispiel


    "normale URLS ( ca. 6000 im Index) sehen bei uns so aus : https://www.toptresore.de/waff…es-waffengesetz-2017.html


    die fehlerhaften ( ca 600im Index) https://www.toptresore.de.dd12…es-waffengesetz-2017.html - werden dann aber auf die richtige umgeleitet


    Es geht um die Frage: woher kommt der Zusatz "dd12226.kasserver.com" ?


    Erste Überlegung waren fehlerhafte Umleitungen. Hier ist nichts zu finden.
    Zweite Überlegung war, dass es sich um alte Inhalte einer alten Übergangsdomain ( aus 2011) handelt, die Google sich wieder krallt. Allerdings war die Übergangsdomain seinerzeit anders und die Inhalte gab es noch nicht. Außerdem werden auch neue Inhalte so als fehlerhafte URL generiert ( siehe Beispiel oben - das war Juni 2017 neu)


    Es betrifft auch nicht nur URls aus der Shopkomponente Joomshopping, sondern auch in K2 erstellten Artikeln.


    Allinkl als Provider hat keine Idee, noch nie vorgekommen. In andere Foren wird auf "vermutlich Joomla" hingewiesen.


    Joomla ist aktuell ( 3.7.5), die Extensions auch regelmäßig geupdatet.


    Bin für jeden Hinweis / Idee dankbar.


    Grüße
    KHG

  • Nicht mein Fachgebiet, aber wenn man einen Webspace hat, ist dieser doch meist schon über kundennummer.example.com zu erreichen, was durch den Provider so eingerichtet wird. Eine Domain kann man später noch einrichten. Die Seiten wurden wohl mal in den Anfängen der Webseite durch Google indexiert.
    Kannst ein neues Verzeichnis anlegen und dieses als Zielverzeichnis für dd12226.kasserver.com angeben. Dann sollten sie aus dem Index fliegen!
    Oder irgendwelche 301-Weiterleitungen einrichten, eventuell auf 404-Fehlerseiten.
    Ich gehe davon aus, dass alle Seiten über die "normale" Domain zu erreichen sind.
    Warum auch noch toptresore.de vor der Subdomain steht, kann ich dir leider nicht erklären. Das sollte aber der Provider können.

  • danke für die Einschätzung, aber das ist ja genau nicht der Fall. die Übergangsdomain des Providers war 2011 eine andere und es werden nicht alte Inhalte so " fehlerhaft" generiert sondern Inhalte die nach Verwendung dieser Übergangsdomain erstellt wurden. Und ja...Weiterleitungen könnte ich machen. Aber wenn jeder neue Inhalt zukünftig ebenfalls diesen Fehler generiert ( z.b. stehen wir aktuell vor der Einbindung von ca. 600 neuen Produkten) bin ich ja nur am Weiterleiten.


    Noch versuche ich dem möglichen Fehler auf die Spur zu kommen. Das Ergebnis dann irgendwie aus dem Index zu kriegen wäre der zweite Schritt.


    Gruß
    KHG

  • Solange die alte Subdomain irgendwo im Netz hinterlegt ist und das ist sie zahlreich, werden Suchmaschinen sie auch weiterhin aufrufen.


    Wenn du sie nur weiterleitest, suggerierst du: "Es gibt mich.".


    Also kille den HTTP_HOST via .htaccess radikal und Schluss ist


    Apache Configuration
    Rewritecond %{HTTP_HOST} toptresore.de.dd12226.kasserver.com$ [NC]RewriteRule .* - [F]


    Und Umleitungen musst du doch nicht alle einzeln händisch machen, wenn du das per .htaccess abwickelst. Irgend so was (inkl. https), nach obiger Zeile, wenn du die verwendest.

    Apache Configuration
    Rewritecond %{HTTP_HOST} !^www.toptresore.de$ [NC,OR]
    RewriteCond %{HTTPS} !=on
    RewriteRule ^(.*)$ https://www.toptresore.de/$1 [R=301,L]
  • Aus dem Index fliegen URLs automatisch sobald sie mehrere Male ein 404 zurückgegeben haben. Allerdings werden diese wohl noch Jahre lang in den Suchmaschinen irgendwo gespeichert.


    Schau mal die .htaccess genauestens durch! Und natürlich auch die, welche oberhalb des Jooma-Verzeichnisses liegen!
    Und schau auch alle Einstellungen beim Hoster durch!
    Verwendest du irgendein SEO-Plugin?
    Gibt es mehrere Projekte im Webspace und sind diese sauber voneinander getrennt?

  • Hallo,


    also das mit der .htaccess werde ich nochmals genau prüfen. Habe ich zwar keine Umleitungen drin ( bis auf eine vor 1 Woche - Fehler ist aber älter) aber sieht kryptisch aus :)


    Und ja..ich verwende seit Joomla 2. noch das Artio SEF für die K2 Artikel / Kategorien - nur dafür. Habe aber eben gelesen, dass K2 auch SEF ohne diese Komponente können soll..
    Allerdings....hier stehen keine unklaren gebildeten SEF drin ( was nichts heißen muss) ich teste es mal...


    Es gibt noch 2 weitere Seiten, die ich zum testen habe -gespiegelt, sind aber seit 3 Jahren offline. Auch die lösche ich mal..


    Grüße
    Safeman


    Danke

  • Hallo nochmal,


    danke für die bisherigen Antworten. Artio-SEF und noch ein zweites habe ich schonmal deinstalliert. Obs was geholfen hat kann ich noch nicht sehen.
    Allerdings geben mir die Hinweise auf die .htaccess zu denken, wobei ich hier nahezu keine Kenntnisse habe ( außer das man hier viel falsch machen kann)


    Nach der Umstellung auf https habe ich hier nach einigen Vorschlägen aus dem NEtz 1- 2 Änderungen gemacht ( rot). Siehe unten. Kann hier der Fehler stecken.
    Zur Sicherheit mal die ganze .htaccess, weitgehend noch Standard. Ist hier ein Fehler oder kann ich das ausschließen?


    ##
    # @package Joomla
    # @copyright Copyright (C) 2005 - 2015 Open Source Matters. All rights reserved.
    # @license GNU General Public License version 2 or later; see LICENSE.txt
    ##


    ##
    # READ THIS COMPLETELY IF YOU CHOOSE TO USE THIS FILE!
    #
    # The line just below this section: 'Options +FollowSymLinks' may cause problems
    # with some server configurations. It is required for use of mod_rewrite, but may already
    # be set by your server administrator in a way that disallows changing it in
    # your .htaccess file. If using it causes your server to error out, comment it out (add # to
    # beginning of line), reload your site in your browser and test your sef url's. If they work,
    # it has been set by your server administrator and you do not need it set here.
    ##


    ## No directory listings
    IndexIgnore *


    ## Can be commented out if causes errors, see notes above.
    Options +FollowSymlinks
    Options -Indexes


    ## Mod_rewrite in use.


    RewriteEngine On


    ## Begin - Rewrite rules to block out some common exploits.
    # If you experience problems on your site block out the operations listed below
    # This attempts to block the most common type of exploit `attempts` to Joomla!
    #
    # Block out any script trying to base64_encode data within the URL.
    RewriteCond %{QUERY_STRING} base64_encode[^(]*\([^)]*\) [OR]
    # Block out any script that includes a <script> tag in URL.
    RewriteCond %{QUERY_STRING} (<|%3C)([^s]*s)+cript.*(>|%3E) [NC,OR]
    # Block out any script trying to set a PHP GLOBALS variable via URL.
    RewriteCond %{QUERY_STRING} GLOBALS(=|\[|\%[0-9A-Z]{0,2}) [OR]
    # Block out any script trying to modify a _REQUEST variable via URL.
    RewriteCond %{QUERY_STRING} _REQUEST(=|\[|\%[0-9A-Z]{0,2})
    # Return 403 Forbidden header and show the content of the root homepage
    RewriteRule .* index.php [F]
    #
    ## End - Rewrite rules to block out some common exploits.


    ## Begin - Custom redirects
    #
    # If you need to redirect some pages, or set a canonical non-www to
    # www redirect (or vice versa), place that code here. Ensure those
    # redirects use the correct RewriteRule syntax and the [R=301,L] flags.
    #
    ## End - Custom redirects


    ##
    # Uncomment following line if your webserver's URL
    # is not directly related to physical file paths.
    # Update Your Joomla! Directory (just / for root).
    ##


    # RewriteBase /


    ## Begin - Joomla! core SEF Section.
    #
    RewriteRule .* - [E=HTTP_AUTHORIZATION:%{HTTP:Authorization}]
    #
    # If the requested path and file is not /index.php and the request
    # has not already been internally rewritten to the index.php script
    RewriteCond %{REQUEST_URI} !^/index\.php
    # and the requested path and file doesn't directly match a physical file
    RewriteCond %{REQUEST_FILENAME} !-f
    # and the requested path and file doesn't directly match a physical folder
    RewriteCond %{REQUEST_FILENAME} !-d
    # internally rewrite the request to the index.php script
    RewriteRule .* index.php [L]
    #
    ## End - Joomla! core SEF Section.
    RewriteEngine On
    RewriteCond %{HTTPS} OFF
    RewriteRule (.*) https://%{HTTP_HOST}%{REQUEST_URI}


    ##Umleitungen 25.07.2017


    ##Kontakt##
    Redirect 301 /component/foxcontact/foxcontact.html https://www.toptresore.de/kontakt/foxcontact.html


    Grüße Safeman

  • Folgendes noch


    ich habe, wie vom " Meister" vorgeschlagen diese Zeilen nun eingefügt
    Rewritecond %{HTTP_HOST} toptresore.de.dd12226.kasserver.com$ [NC]
    RewriteRule .* - [F]


    Ergebnis: Die Urls sind nicht mehr zu erreichen ( You don't have permission to access /index.php on this server.). Ich denke das ist so gewollt und irgenwann verschwinden die ausm Index.


    Allerdings, wenn ich darunter dann
    Rewritecond %{HTTP_HOST} !^www.toptresore.de$ [NC,OR]
    RewriteCond %{HTTPS} !=on
    RewriteRule ^(.*)$ https://www.toptresore.de/$1 [R=301,L]



    einbaue, hat es keinen Effekt. So wie ich es verstehe, heisst das doch "Alles was ungleich www.toptresore.de ist ( also diese kasserver URl), umleiten auf www.toptresore.de


    Oder liege ich da falsch?

  • 1
    Ist doch logisch. Wenn du vorher das kasserver-Dings killst, wird doch die nächste Umleitung gar nicht mehr ausgeführt.


    2
    Wenn ich die Seite via toptresore.de besuche, wird sie mir mit www angezeigt. Irgendwas leitet scheints auf www um. Auch Google scheint www zu bevorzugen. Also solltest du das www auch wie von mir gepostet drinnen haben, damit du nicht unnötig viele Umleitungen durchführst. Das mögen Suchmaschinen u.a. nämlich auch nicht sonderlich bzw. verballern Zeit mit warten statt indexieren.