Sitemap.xml wird nicht gelesen

  • Hallo zusammen,


    wenn ich gelegentlich in der search console nachschaue, wundert mich, dass die sitemap.xml meiner Seite zuletzt am 22.08.2022 vom Googlebot gecrawlt wurde, obwohl ich immer wieder aktualisierte Sitemaps eingereicht habe, was auch von Google jeweils datumsgerecht bestätigt wurde.

    Bei meinen anderen Seiten, die ich auf dieselbe Weise erstellt habe, ist dies nicht so.

    Woran könnte das liegen?


    lg Dirk

  • Hast du sie möglicherweise in der robots.txt ausgeschlossen? Vielleicht während des Entwurfs der Webseite.


    Ansonsten: Wenn du sie aber selber regelmäßig eingereicht hast, dann sollte zumindest das Einreichungsdatum korrekt in der GSC drinstehen. Ist dem so?
    Und in diesem Zusammenhang wird sie ja auch gleich auf mögliche Fehler überprüft.

  • Wie und womit hast du sie angelegt?


    Wäre ein Link zur Seite hilfreich?

    Der Link ist:

    Meditation, Tantra und Paarseminare
    Zentrum für Meditation, Spiritualität, Tantra, Paarseminare, Achtsamkeit, Selbsterfahrung und Retreats für Rheinland, Niederrhein und Ruhrgebiet
    lebensart-duisburg.info


    Und das ist der Stand der Dinge in der GSC, zuletzt also eingelesen am 22.08.2022. Und nein, ich habe sie neuerdings sogar ausdrücklich in der robots.txt angepriesen (Sitemap: https://lebensart-duisburg.info/sitemap.xml)


    Elwood: angelegt habe ich sie mit xml-sitemaps.com.

    Einmal editiert, zuletzt von Indigo66 () aus folgendem Grund: Ein Beitrag von dirk63 mit diesem Beitrag zusammengefügt.

  • Elwood: habe sie auch immer mit xml-sitemaps.com erstellt.

    Habe leider keine Lösung dazu, da ich nur mit dieser Erweiterung von Kubik-Rubik arbeite:


    EJS - Easy Joomla Sitemap - Kubik-Rubik Joomla! Extensions
    Erstellt eine XML-Sitemap, um Suchmaschinen bei der Indexierung der Joomla! Website zu unterstützen. Sitemap-Komponente für Joomla! zur Erstellung von…
    kubik-rubik.de

  • Hast du sie möglicherweise in der robots.txt ausgeschlossen? Vielleicht während des Entwurfs der Webseite.


    Ansonsten: Wenn du sie aber selber regelmäßig eingereicht hast, dann sollte zumindest das Einreichungsdatum korrekt in der GSC drinstehen. Ist dem so?
    Und in diesem Zusammenhang wird sie ja auch gleich auf mögliche Fehler überprüft.

    Vielleicht wird sie auf Fehler überprüft, sie wird aber nicht eingelesen. Es werden weiterhin die alten Sachen indiziert, die ich mit großem Zeitaufwand jeweils nur für ein paar Wochen deaktivieren kann. Die alte sitemap.xml lässt sich in der GSC nicht wirklich löschen.


    Grüße, Dirk

  • Du könntest die Logfiles der letzten Wochen mal durchschauen bzw. auswerten, ob das so wirklich stimmt, wie es in der GSC drinsteht!

    Auch könntest du die sitemap.xml mal umbenennen (z.B. my-sitemap.xml) und einreichen, Dann erkennt man vielleicht innerhalb der nächsten Wochen bestimmte Dinge, die das Ganze erklären.


    Der Block bzgl. GPTBot in der robots,txt ist doch überflüssig, oder?

    Die Angabe der Sitemap-URL gilt auch immer unabhängig von den User-agents. Schreibe ich nur, weil du die Zeile da so auffällig im GPT-Block platziert hast.


    Und was sind das für User-agents für die du ein paar Allow gesetzt hast? Ansonsten steht ja alles auf Disallow (nur damit ich die Absicht dahinter verstehe)

    Code
    User-agent: 2a01:4f8:fff0:d5:: / 64 + 116.202.68.152 / 29
  • Der Block bzgl. GPTBot in der robots,txt ist doch überflüssig, oder?

    siehe hier:


    Liebe Grüße

    Christine

  • Das ist ein SEO-Tool namens Performance Suite, wollte mal sehen, was deren AI dazu sagt. Ansonsten will ich aber keine AI mit meinen Texten füttern

  • Du könntest die Logfiles der letzten Wochen mal durchschauen bzw. auswerten, ob das so wirklich stimmt, wie es in der GSC drinsteht!

    Auch könntest du die sitemap.xml mal umbenennen (z.B. my-sitemap.xml) und einreichen, Dann erkennt man vielleicht innerhalb der nächsten Wochen bestimmte Dinge, die das Ganze erklären.

    Danke! So einfach kann's gehen! Jetzt werden nur noch 51 statt 96 Seiten indiziert, wie die Sitemap es vorgibt. Problem gelöst!!!


    lg Dirk