Fragen zum Canonical in Verbindung mit Stellenanzeigen aus PHP Script und MySQL Table

  • Hallo zusammen,


    auf einer Internetseite werden verschiedene Stellenanzeigen in einer Rubrik Karriere abrufbar angezeigt. Jede Stellenanzeige hat grundsätzlich die gleiche URL an der URL hängt aber eine entsprechende ID als GET Parameter.


    Die Stellenanzeigen sind inhaltlich alle sehr ähnlich. Der Arbeitsort ist immer individuell und noch ein paar andere Kleinigkeiten. Textlich ist der überwiegende Teil aber identisch, so wie das halt oftmals bei Stellenanzeigen der Fall ist.


    Ich möchte die Anzeigen nun mit stukturierten Daten auf Google Job Posting bringen. Das habe ich mir soweit auch alles angeschaut und größtenteils verstanden. Was aber meine absolute Achillesferse bleibt, ist der canonical Tag. Ich weiß zwar grundsätzlich man ihn einbaut, aber nicht wann es sinnvoll ist. Gerade in meinem Beispiel habe ich folgendes Verständnisproblem.


    Mit dem canonical sage ich Google ja, dass Seiten mit gleichem oder ähnlichem Inhalt existieren und verweise durch den canonical auf die Hauptseite. Wenn ich das mache, sorgt das aber doch dafür, dass manche Stellenanzeigen von Google nicht indexiert werden. Ich möchte ja nicht nur Stellenanzeige A aus Berlin indexiert wissen, sondern eben auch Stellenanzeige B aus Köln, die aber inhaltlich fast gleich zu Stellenanzeige A ist. Was bringt mir das, einen canonical zu setzen, wenn dann auf Google die Stellenanzeige B nicht angezeigt wird, habe ich nichts gewonnen.


    Also vielleicht kann mir mal jemand den gordischen Knoten in meinem Kopf lösen und mir sagen, wie ich wirklich alle - sehr ähnlichen Stellenanzeigen - von Google gezogen und angezeigt bekomme.


    Ich freu mich.

  • Du hast das schon richtig erkannt. Lass den Canonical weg. Auch, wenn dich irgenwelche SEO-Tools darauf hinweisen sollten, ist das in 99% der Fälle Nonsens. Der Tag macht nur Sinn, wenn tatsächlich 2 oder mehr Seiten (URLs) exakt den selben Inhalt bzw. Hauptinhalt haben und eben nur eine davon indexiert werden soll. Und selbst dann können automatisierte Canonicals in Joomla mehr Schaden anrichten als sie bringen oder sind komplett sinnfrei gesetzt. Meist bekommt man das auch über Umleitungen in der .htaccess hin, um "echt doppelte" URLs auszumerzen, wenn man mal welche entdeckt.

    Keinesfalls ist es richtig, dass jede Seite einen Canonical-Tag haben muss, wie nach wie vor oftmals behauptet wird. Sie sind keinesfalls eine Notwendigkeit für besseres Ranking wie auch oft behauptet wird.

  • Hallo Later,


    danke für deine Antwort, die mir grundsätzlich natürlich entgegen kommt, spart sie mir doch Arbeit.


    ABER: Auch in der Vergangenheit habe ich mit Stellenangeboten die größtenteils Ähnlichkeit hatten (nicht 100% gleich waren), das Problem, dass Google diese tatsächlich nicht indexiert hat, weshalb ich immer davon ausging, dass DC das Problem ist.


    Hast du eine Idee, woran das gelegen haben könnte und wie ich das tatsächlich vermeiden kann, dass Stellenanzeigen mit einer GET ID in der URL von Google nicht als DC bewertet werden?


    Wenn ich den canonical weglassen kann, wäre ich mehr als glücklich.

  • Wenn du kein Canonical hast, das Google in die Irre führt und du keine Einstellung in GSC hast, dass bestimmte GET-Parameter ignoriert werden sollen (ich glaube aber, das gibt es heutzutage gar nicht mehr(?)), dann gehört deine Seite wohl zu denen, die eine Sitemap verwenden sollten und bei Google eingereicht, und die aktualisiert wird. Im Normalfall hat man eine automatische Sitemap auf der Seite laufen, die also immer aktuell ist und reicht den Link zu dieser bei Google ein.


    Man kann aber auch, wenn es nicht so viele sind in der Search Console explizit zum Crawlen von URLs auffordern. Heißt glaube ich "Indexierung beantragen".


    Und alte entfernen, die aber tatsächlich "tote Seiten" zeigen sollten, womit sie jedenfalls für eine gewisse Zeit Google erst mal nicht bremsen bei einer Reindexierung deiner Seite. Solche Seiten sollten sowieso niemals auf irgendwas anderes umgeleitet werden, nur nebenbei, tot ist tot.


    Wie viel Google indexiert, hängt auch von der Zeit ab, die Google auf der Seite verbringt. Das ist limitiert. Es werden nicht einfach alle Seiten durchgeknattert, sondern irgendwann bricht der Bot ab und macht beim nächsten mal weiter.


    Damit auch wie schnell eine Seite durchnavigierbar ist. Lange Ladezeiten = Zeitverlust.


    Auch davon, wie leicht Google die Links in einem Wust findet. Hätte man beispielsweise eine "frühe" Seite "Die aktuellsten Anzeigen", oder was menüartiges, wo halt immer das neuere zuerst drauf ist, steigt die Wahrscheinlichkeit, dass die neuen Seiten schneller gefunden werden.


    Ich habe bspw. eine HTML-Sitemap auf der Seite, wo alle mir wichtigen Links automatisch aufgelistet sind, neueste zuerst. Suchmaschinen stoßen sehr schnell auf diese Unterseite, wenn sie die Startseite von oben nach unten durchlaufen.


    Und wie oft Google kommt.


    DC sind keine Seiten, die ähnlich sind und schlimmes DC fängt ganz woanders an als bei ähnlichen Stellenanzeigen.


    Vielleicht die Chance, die ähnlichen Stellenanzeigen noch etwas zu individualiseren? Bspw. durch abweichende TITLE-Tags, Metabeschreibungen, oder eben dargestellten Inhalt?


    eventuell gibt es unter dem Stichwort "Structured Data" auch was, was Google mittlerweile gesondert behandelt für Jobs, ähnlich wie für Veranstaltungen etc. Weiß ich nicht.