Indexierung schlägt fehl

  • Ich bin der Typ, der sich gerade an dem Bug versucht und ich habe ein Problem: Ich kann das nicht nachstellen.


    Das Problem sind nicht die Kategorien, zumindest nicht direkt, sondern der Code, der weitere Attribute zu den Einträgen im Suchindex dazuspeichert. Die Meldung ist eigentlich eine generische Meldung und der Hinweis auf die Kategorien ist eigentlich falsch. Aber das jetzt detailliert zu erläutern würde zu weit führen.


    Für mich gibts jetzt einige Punkte, die wir klären sollten:

    0. Ich hoffe, wir bewegen uns auf einem Testsystem. Aktiviere dort bitte das Debugging von Joomla in den globalen Einstellungen. Wenn das kein Testsystem ist, stelle bitte vorher die Zugriffsrechte für das "System - Debug" Plugin auf "Spezial", damit nur du als Super Admin die Ausgabe des Debug Modes sehen kannst.
    1. Indexierst du wirklich NUR Beiträge oder noch mehr Sachen? Das heisst, hast du mehr als nur das Finder Plugin für Beiträge aktiviert? Der Indexierungsprozess wird mit Plugins gesteuert, die unter der Gruppe "finder" zu finden sind.

    2. Solltest du mehr als nur die Beiträge indexieren, lass uns bitte einmal eingrenzen woran es liegt und deaktiviere die Plugins alle und aktiviere sie jeweils einzeln. Vielleicht liegt es nicht an Beiträgen, sondern an Newsfeeds o.ä.

    3. Wenn es an den Beiträgen liegt, schau bitte einmal bei der Indexierung zu. Mit dem Debug Modus eingeschaltet, kriegst du dort einiges mehr an Infos angezeigt als vorher. Damit sollte es dir möglich sein, den Fehler auf einige wenige Einträge einzugrenzen. Wenn du z.b. 500 Beiträge hast und machst die Indexierung in 5er oder 10er Schritten, dann tritt der Fehler z.B. irgendwann bei der Bearbeitung der Einträge von 435 bis 440 auf und du kannst dann nachschauen, ob die entsprechenden Einträge irgendwie besonders sind. Die Indexierung sortiert nach der ID der Beiträge und zählt dann entsprechend ab. Also im Backend nach ID sortieren und die Filter auf "Alle" stellen und dann "abzählen" mit der Paginierung.

    4. Hast du irgendwas besonderes installiert auf der Seite? Eine Multikategorieerweiterung oder sowas?


    Wahrscheinlich ist es so, dass der Finder versucht, etwas zu indexieren, dessen Kategorie nicht mehr veröffentlicht ist oder etwas in der Richtung. Aber woran es liegt, kann ich gerade nicht sagen.

  • Hallo Hackwar,


    danke für den ausführlichen Hinweis.


    Leider ist es keine Testumgebung, sondern eine Webseite im Betrieb. Vermutlich war es die Migration von 3 auf 4.


    Ich habe jetzt das System-Debug auf Spezial gestellt, kann aber irgendwie nicht erkennen, wo ich da mehr Infos ersehen kann.


    Ich habe alle finder-Plugins außer "Suchindex - Inhalt" deaktiviert und der Fehler taucht genau da wieder auf. Scheint also in der Tat an den BEiträgen zu liegen.


    Was ich nicht ganz verstehe ist, was du damit meinst, dass ich bei der Indexierung zuschauen soll im Debug-Modus eingeschaltet. Was meinst du damit - sorry, aber ich bin steck da nicht so tief im System drin...


    Der Index stoppt nach 307 Einträgen. Wenn ich die Artikel nach ID sortiere und mir den 307. bzw. den 308. Eintrag ansehe, dann fällt mir nichts wirklich gravierendes auf. Gerade diese Beiträge hatten beide den gleichen Alias. Ich habe zwei verschiedene vergeben, aber das hat nichts gebracht.


    Was meinst du mit Multikategorieerweiterungen? Soweit ich das sehe ist das System bei mir relativ schlank.



    Viele Grüße


    Jetzt habe ich die beiden Einträge einfach mal gelöscht. Aber der FEhler taucht trotzdem auf. Wieder genau nach der gleicehn Anzahl Einträge.

    Einmal editiert, zuletzt von Indigo66 () aus folgendem Grund: Ein Beitrag von Tobi_IN mit diesem Beitrag zusammengefügt.

  • Wenn du den Debug Modus anschaltest, zeigt er dir während der Indexierung unter dem Fortschrittsbalken weitere Infos an, unter anderem welche Inhalte er indexiert und bei wieviel von wievielen er ist. (Dazu zeigt dir der Debug Modus beim Klick auf das Icon unten links in der Ecke eine ausführliche Debug Info an.)


    Die ID 307 ist NICHT der 307. Eintrag. Du kannst ja inzwischen Beiträge gelöscht haben o.ä. Dann ist vielleicht der Beitrag mit der ID 500 der 307. Eintrag in der Liste.


    Stell mal "Fehler Berichten" auf "Einfach" in den globalen Einstellungen. Vielleicht kommt da noch etwas mehr. Grundsätzlich sollte der fehlerhafte Eintrag eigentlich nicht im Index auftauchen, insofern wird es eher der 308. Eintrag oder sowas sein. Hast du die Einträge auch aus dem Papierkorb gelöscht? Sonst indexiert er das immer noch, nur eben nicht veröffentlicht.


    Ich hab bei mir die Datenbank mal etwas misshandelt und konnte den Fehler provozieren, wenn ich bei einer Kategorie den Titel rauslösche. Smart Search indexiert dabei nicht nur die direkte Kategorie, sondern auch die Eltern der Kategorie. Wenn du also z.B. aus den Sampledaten von Joomla einen Beitrag in der Kategorie "Park Blog" packst, indexiert er auch die Kategorien "Park Site" und "Sample Data Article", wie man an dem Pfad "sample-data-articles/park-site/park-blog" sehen kann. Wenn also eine Elternkategorie fehlt oder irgendwie defekt ist oder sowas, dann knallt es. Kannst du da noch einmal nachschauen?

  • Alles klar. Jetzt hab ich's weitgehend verstanden. Was mir etwas unklar ist. Ich indexiere jetzt in 5er Packungen. Er stoppt bei 205. Woran ersehe ich jetzt welcher Eintrag das sein kann?


    Der 205 oder 206. Eintrag in der Artikelliste ist es ja offenbar nicht, wie du schreibst. Aber wie kann ich den dann rausfinden?


    Wo kann ich das ablesen, wo der Fehler ist oder wo er stoppt? Unter Queries? Log ist ein leeres Feld.


    Sorry, dass ich da etwas hilflos bin :o(


    PS: Ich zähl gerne 207 Einträge durch, aber wie zähle ich die, dass ich den "Störenfried" finde.


    Die Kategorien könne es an sich nciht mehr sein, weil ich die jetzt alle neu angelegt habe und natürlich auch alles "Elternkategorien" neu vergeben habe

    Einmal editiert, zuletzt von Indigo66 () aus folgendem Grund: Ein Beitrag von Tobi_IN mit diesem Beitrag zusammengefügt.

  • Wenn er das in 5er Schritten macht, dann ist der Eintrag mit dem Problem der 206.-210. Beitrag in deinem System. Das heisst, du gehst ins Backend unter "Inhalt->Beiträge", unter Filter Optionen stellst du "Status" auf "alle", sortierst nach ID und stellst die Anzahl der Beiträge pro Seite auf 100. Dann gehst du auf die dritte Seite und schaust dir dort die Einträge 6-10 an. Wie gesagt, das können Beiträge sein, die in den Papierkorb verschoben wurden oder archiviert sind.


    Hast du die Kategorien wirklich komplett gelöscht oder sind die nur in den Papierkorb gewandert?

  • Jipieeee! Gefunden!!!!!! Es war der Autor. Bei einigen Artikeln war der Autor XY mit einem "(Alias)" darunter ergänzt. Den entsprechenden Artikel geöffnet und den Autor einfach nochmal angewählt: Dann abgespeichert. Und das war's!!!




    Ganz, ganz vielen Dank an alle, die mir hier so tolle Tipps gegeben haben. Ihr seid großartig!

  • Ich kann dir nur das Problem schildern.


    Offenbar wurde bei einigen Artikeln (etwa sechs bis acht Stück) beim Autor ein "(Alias)" angehängt. Konkret war es also nicht "Hans Meier" (blau hinterlegt als Link), sondern "Hans Meier (Alias)", wobei (Alias) schwarz war und nicht angeklickt werden konnte.

    Wenn man den Beitrag öffnete, deutete aber nichts auf ein Problem hin. Als Autor war ganz normal "Hans Meier" eingetragen (ohne Alias) und auch sonst passte alles. Ich habe dann einfach beim Autor über den nebenstehenden Link erneut "Hans Meier" aus dem Kontextmenü ausgewählt. Sah nachher genauso aus wie vorher. Dann abgespeichert und das wars. Anschließend lief der Index weiter bis zum nächsten "Hans Meier (Alias)". Als ich den dann genauso korrigiert habe, lief der Index wieder weiter etc.


    Mehr Infos hab ich nicht. Ich weiß also nicht, woran das lag. Mir sah das so aus, als hätte ich die entsprechenden Beiträge mal von einem bestehenden kopiert und dabei ist vielleicht was schief gelaufen. Allerdings sind das Beiträge die mindestens sieben Jahre alt waren. Das heißt in Joomla3 gab's da keine Probleme.


    Hilft dir das weiter?