Sonderzeichen und Zeichenkodierung

Was steckt eigentlich dahinter, wenn plötzlich „f xFC; r“ statt „für“ in Textdateien oder Bildsammlungen zu lesen ist? Die Metadaten, die bei prometheus verarbeitet werden, werden mit einer ganz bestimmten Zeichenkodierung übermittelt. Innerhalb einer Datenbank muss diese Kodierung konsistent sein, andernfalls werden bestimmte Sonderzeichen falsch dargestellt. Die meisten der integrierten Datenbanken verwenden UTF-8, die restlichen 20 den ISO-Standard ISO-8859-1. Die Kodierung muss im Header des XML-Exports angegeben sein, so dass der Parser, der die Daten für die Suche in den Index schreibt, das Encoding auch richtig erkennt. Wenn die Zeichenkodierung nicht richtig angegeben ist, leidet nicht nur die Lesbarkeit des Textes. Es kann auch bedeuten, dass die Inhalte nicht gefunden oder nicht richtig weiterverarbeitet werden können.