Joomla und Seitenindexierung bei PDF Option

  • Sehr geehrte Damen und Herren,


    ich habe eine Frage bezüglich der Seitenindexierung von Google bei einer umfangreichen Domain, die mit Joomla als CMS arbeitet.
    Bei meiner Onpage-Analyse mit Screaming Frog ist mir aufgefallen, dass sehr, sehr viele Seiten indexiert werden, die mit der PDF Druck Option in Zusammenhang stehen.
    Ich meine damit die Option, aus einem Artikel ein PDF zu erzeugen. Natürlich soll sowohl der Artikel, als auch mögliche hinterlegte PDFs indexiert werden, jedoch werden auch die popup Anzeigen als einzelne Seiten ausgelesen. Die entsprechenden Domains bekommen dann eine, oder mehrere zusätzliche Endungen, die ungefähr so aussehen:


    http://www.meinedomain.de/inde…1&pdf=1&pdf=1&pdf=1&pdf=1


    Gibt es die Möglichkeit, die Indexierung dieser "Optionsseiten" zu unterbinden?
    Da die Endungen ja dynamisch erzeugt werden und im Zusammenhang mit den Artikeln stehen, ist ein Eintrag in die robots.txt meines Erachtens nicht zielführend.
    Ich hoffe, Sie können meine Frages nachvollziehen. Ich habe bisher leider keine Lösung bei meinen Recherchen gefunden, deshalb bemühe ich nun Sie.


    Vielen Dank und mit vielen Grüßen,
    Paul

  • Danke! Ich werde schauen, ob das irgendwie automatisch implementiert werden kann.
    Allerdings glaube ich, dass es sich in meinem Fall um einen Programmierfehler seitens der Agentur handelt, da es zu einem Loop kommt, dem auch der Crawler einfach folgt. Auf der Artikelseite wird der Buttom zum PDF erzeugen geklickt - es öffnet sich ein Popup mit den Buttons [zum PDF] und [Schließen] - nach dem Schließen wird der Artikelseite die Endung 1&pdf angehangen. Das Spiel kann man beliebig wiederholen, es kommt immer ein 1&pdf dazu. Somit denkt der Bot, er hat eine neue Seite vor sich und crawlt von vorn.
    Ich gebe das mal so weiter. Nochmal Danke für den Hinweis.

  • Mit einem rel="nofollow" "klickt" der Bot den Link gar nicht erst, zumindest nicht Google.


    Joomla selbst hat übrigens schon lange keine Option mehr, um PDFs zu generieren. Gabs mal in Joomla 1.5 oder so.



    Nebenbei: Wenn du eine Agentur hast, die für dich programmiert und die Seite sehen darf, warum fragst dann hier?

  • Das hab ich auch so verstanden. Ist nur die Frage, wie es automatisch implementiert werden kann.


    Ich habe keine Agentur. Ich erarbeite gerade für einen Kunden eine SEO Analyse und dabei fiel mir auf, dass eine Unmenge an Seiten bei Google indexiert werden, bzw. Screaming Frog SEO Spider stundenlang die Domain crawlt. Es zeigt sich, dass es sich bei einem Großteil der Seiten um diese 1&pdf URL Anhänge handelt. Da ich nirgends etwas zu der generierten Endung finden konnte, dachte ich, hier wäre ein guter Ort für die Frage, in der Hoffnung, dass jemand das Problem kennt und das CMS des Kunden auch Joomla ist.
    Für mich geht es darum, eine sinnvolle sitemap und eine robots.txt zu erstellen.
    Ich gehe davon aus, dass der Kunde eine Agentur hatte oder hat, aber das kann ich im Moment nicht klären, werde aber das Problem und Dein Lösungsvorschlag weiterleiten.
    Ich danke Dir für Deine Zeit und Mühe!
    MfG paukae