parsen, indexieren, finden
Damit Sie in den Datenbanken in prometheus überhaupt recherchieren können, müssen wir die Daten zunächst so aufbereiten, dass sie indexiert werden können und für die Suche zur Verfügung stehen. Die Datenbanken liefern uns zumeist XML-Files, die wir mithilfe der Open Source Software Nokogiri parsen, das heißt: die Dokumente werden quasi “gescannt” und in von uns definierte kleinere Einheiten, in Felder zerlegt. Um die einzelnen Felder der Datenbanken – Künstler, Titel, Standort etc. – zu adressieren, verwenden wir die standardisierte Abfragesprache XML Path Language, kurz XPath. Auf diese Weise bereiten wir die einzelnen Felder zur Erschließung der darin enthaltenen Inhalte zur Indexierung vor. Das Ganze geschieht mit Nokogiri und XPath in einem Prozess und vollständig automatisiert.