Warum auch immer nutzt Neo4j als Lucene-Indexer den WhitespaceAnalyzer. Dieser hat jedoch viele Nachteile, dass es wünschenswert sein kann diesen abzuändern. Leider bringt Neo4j von Hause aus keine Möglichkeit mit, dies mit einfachen Mitteln vorzunehmen. Es scheint als wenn die Lucene Implementation nicht weit vorangeschritten ist. Es wird auch immer noch die Lucene Version 3.6 verwendet, obwohl bereits Lucene 4.10 die aktuellste ist. Nichtsdestotrotz in einem Projekt brauchte ich den...
Nun möchte ich euch gerne einmal zeigen wie mein derzeitiger Java-Code aussieht, welchen ich zum Importieren großer Datenmengen in Neo4j verwende. Dies stellt einen Real-Beispiel Import Code dar. Genutzt werden könnte er für eine bestimmte kostenpflichtige Datenbank aus dem Internet, welche ich hier nicht weiter erwähne.
Grundsätzlich brauch man sich keine Gedanken machen den Cache zu leeren. Denn der Cache läuft im Hintergrund und optimiert dabei die Query-Geschwindigkeiten. Daher ist in erster Linie ein Abschalten kontra-produktiv. Allerdings benötigt man für Benchmarks saubere Ergebnisse. Ohne weiteres ist dies in Neo4j leider nicht möglich. Neo4j nutzt den System-Cache und lässt sich nicht überzeugen dem System anzuweisen den Cache zu leeren. Das ist schade, weil die enorm Ergebnisse verfälscht....
Nachdem wir gesehen haben wie man Neo4j installiert und angefallene Daten wieder ganz einfach löschen kann, wollen wir jetzt schauen wie man Daten auf unterschiedlicher Weise importieren kann. Auch hier gibt es wieder mehrere Methoden. Wir wählen in diesem Tutorial den Weg über Groovy. Zunächst benötigen wir Groovy auf dem System. Danach wird gezeigt wie das Skript aussehen muss. Dieses Tutorial geht davon aus, dass Neo4j bereits installiert ist und Ubuntu eingesetzt wird. Ebenso verhält...
Nachdem wir gesehen haben wie man Neo4j installiert und angefallene Daten wieder ganz einfach löschen kann, wollen wir jetzt schauen wie man Daten auf unterschiedlicher Weise importieren kann. Auch hier gibt es wieder mehrere Methoden. Wir wählen in diesem Tutorial den Weg über den LOAD CSV Befehl. Dieser vereinfacht das Importieren enorm und ist mit Abstand das Einsteiger-freundlichste Verfahren Daten zu importieren. Dieses Tutorial geht davon aus, dass Neo4j bereits installiert ist und ein...
Die Indexierung in einer Datenbank ist enorm wichtig um performant Abfragen in dieser auszuführen. Bevor man Indizes setzt, sollte man sich jedoch im Klaren sein, dass diese zusätzlichen Festplattenspeicher brauchen und das Erzeugen der Indizes ebenso Zeit in Anspruch nimmt. Von klarem Mehrwert sind jedoch die Auswirkungen, wobei Abfragen nun um ein Vielfaches schneller erfolgen.
Die Konfiguration eines System ist ja bekanntlich ein sehr wichtiger Schlüssel zum Erfolg. Weist man einer Anwendung zu wenig Ressourcen zu, so kann sie sich nicht richtig entfalten. Daher zeige ich euch nun die beiden hauptsächlichen Stellschrauben, welche maßgeblich euren Import beschleunigen können.
Dieses Tutorial zeigt auf wie ihr eure Neo4j Datenbank leeren bzw. löschen könnt. Das ganze erfolgt per Konsole, weil dies einfach am saubersten ist. Natürlich können Programme wie WinSCP unter Windows das auch sehr einfach erledigen. Falls eingerichtet, dann greift ihr am besten dazu wenn es um das reine Löschen in diesem Tutorial geht.
Viele Wege führen ja bekanntlich nach Rom, aber dennoch sind einige davon steinig und schwer. Nun denn, wir schauen uns jetzt den wohl einfachsten und schnellsten Weg an, wie man Neo4j in nur wenigen Minuten auf einem Ubuntu installieren kann. Auch zeige ich wie ihr den Zugriff von Draußen auf den Neo4j-Browser gestatten könnt. Das ist ja sehr wichtig wenn ihr z.B. DigitalOcean verwendet und gar keine Oberfläche bzw. einen internen Browser (Firefox/Chrome) zur Verfügung habt. Denkt aber...
Grad haben wir kennengelernt wie man Batch-Import aufsetzt. Jetzt ändern wir eine Einstellung so um, dass Komma-separierte Daten verwendet werden können.