Das Gesamtvorhaben war eigentlich, eine offline Datenbank von Wikipedia (nur Kurzbeschreibung eines Themas) zu haben, auf die man jederzeit zugreifen kann.
Beiträge von Poxay12
-
-
Danke, dass sie mir bei diesen ganzen Dingen geholfen haben! Abschließend hätte ich noch eine Frage: Wissen Sie, ob man in Java Daten per Google Suche beziehen kann? Jegliche Recherche diesbezüglich war nicht so erfolgreich.
Ansonsten schönen Abend noch und ein frohes neues Jahr!
-
Mit welchem Programm hast du die <links> rausgeschnitten? Vielleicht ist die Frage blöd, keine Ahnung. Kann ich die Daten auch auf der Festplatte anstatt auf einem Server in MySQL speichern?
Und weißt du zufällig, ob die hier behandelte Datei alle Wikipedia Artikel einschließt?
Danke
Jedesmal, wenn ich anhand eines Programmes versuche, die Datei zu bearbeiten, wird die Datei als zu groß gemeldet.
-
Also gibt es keine Möglichkeit, die XML Datei automatisiert zu reduzieren? Manuell ist das ja kaum möglich.
Ich hätte dann noch eine Frage. Muss die Datenbank auf einem Server sein oder kann ich sie auch lokal speichern, also ohne Serverressourcen? Beispielsweise auf einer Festplatte.
-
Deswegen sollte nicht der ganze Artikel, sondern nur der erste Satz verwendet werden. (Kurzbeschreibung)
Macht die Größe der Datei denn einen großen Unterschied?
-
Ich weiß, dass ist ein größeres Vorhaben.
Die Datei, die ich meine, ist die Oberste. Ich bin mir nicht 100% sicher, was sich in der XML Datei befindet. Was mein Ziel ist: Ich möchte zu nahezu jedem Wikipediaeintrag eine Kurzbeschreibung speichern, die sich auf Abruf anzeigen lässt. Der gesamte Wikipediaeintrag eines Artikels ist daher semioptimal. Wie gesagt, eine Kurzbeschreibung jedes Themas wäre das Ziel. Möglicherweise könnten die Daten in in einer Tabelle festgehalten werden. Zeile 1 der Themenname und Zeile 2 die Kurzerklärung.
Danke für eure Hilfe.
-
Hi!
Bin ein absoluter Anfänger und brauche dringend eure Hilfe.
Folgendes Problem:
Ich möchte die XML-Datei der Wikipedia Datenbank in meine SQL DB einbauen. Ich habe schon länger recherchiert, bin aber noch zu keiner Lösung gekommen.
Wenn jemand eine Idee hat, bitte antworten!
Und bitte nicht vergessen: Bin noch Anfänger.
Hier der Link zur XML-Datei : https://dumps.wikimedia.org/dewiki/latest/