Blog RSS

Wir haben mal in den vergangenen Tagen im Bildarchiv nach weihnachtlichen Begriffen gesucht und sehr viele Abbildungen gefunden. Unter den öffentlichen Bildsammlungen gibt es die zur „Bildserie 2014 / 52 – Weihnachtszeit. Geburt Christi“ sowie die zur kommenden Bildserie „Bildserie 2019 / 52 – Hans Baldung Grien. Maria mit dem Kind“. Eine kleine Auswahl unserer neuesten Suchergebnisse steht in der öffentlichen Bildsammlung „Weihnachten im Bildarchiv“ für alle mit einem persönlichen Zugang in prometheus bereit, nicht nur lesbar, sondern auch schreibbar. Sie können gerne weitere Bilder ergänzen.




Diese von Ihnen geschriebenen Kommentare an den Bildern in prometheus helfen allen beim Finden von relevanten Suchergebnissen. Wie?
Für den Austausch im Bildarchiv zu den Bildern und über die Bilder können Sie die Kommentarfunktion jeweils direkt am Bild nutzen. Seit einiger Zeit können Sie bei prometheus auch nach diesen Kommentaren suchen, die Sie oder andere zu einzelnen Bildern schreiben. Wenn Ihnen beim Suchergebnis Schlagwörter fehlen, ergänzen Sie einen Kommentar und dieser wird in den Suchindex integriert. Bei der nächsten Suche nach diesem Schlagwort wird Ihnen das Bild angezeigt. Durch diese Art der Optimierung des Retrieval können Sie von der Expertise der anderen profitieren und Ihre eigenen Kenntnisse einbringen. Sie können in den Kommentaren aber auch andere Auffälligkeiten vermerken, etwa wenn das Bild seitenverkehrt ist, und damit einen Hinweis an die Administratoren und Administratorinnen der Datenbank geben. In Kürze werden denen die Kommentare angezeigt, und zwar jeweils die, die ihre Datenbank betreffen.
Wenn schon Kommentare am Bild vorhanden sind, sehen Sie bei der Anzeige der Suchergebnisse sowohl in der Galerieansicht als auch in der Listenansicht direkt unter dem Bild nicht nur, ob das jeweilige Bild bewertet wurde und wie oft es bewertet wurde, sondern eben auch, ob es einen Kommentar dazu gibt. Mit einem Klick auf „Kommentar“ erhalten sie dann direkt die zusätzliche Information aus der Community.




Bei allen Bildern in prometheus sehen Sie unter der Anzeige den Menüpunkt „Verwandte Bilder“. Wenn Sie auf den Pfeil klicken, werden Ihnen bis zu fünf weitere Bilder angezeigt. Für diese Auswahl werden bei der Ähnlichkeitssuche folgende Felder mit einer Mindestlänge von vier Buchstaben berücksichtigt:
‘title’, ‘title_variants’, ‘keyword’, ‘keyword_artigo’, ‘description’, ‘material’, ‘technique’, ‘epoch’.
Bilder mit ähnlichen Metadaten in diesen Feldern sind bei uns also verwandte Bilder. Nah verwandt sind Bilder mit ähnlichem Titel und Titel Varianten, mit ähnlichen Schlagwörtern und Schlagwörtern bei ARTigo, mit Übereinstimmungen in Beschreibung, Material, Technik und Epoche.
Denn hier sollen möglichst diejenigen Treffer erscheinen, die für Sie eine große Relevanz haben, auch wenn sie nicht direkt in Ihren Suchergebnissen erscheinen. Haben die dort gezeigten Bilder für Sie die Relevanz, die Sie sich wünschen?




Haben Sie bei prometheus mal nach „kreuzigung“ gesucht? Wir haben es gerade getan und die Anfrage über das Suchfeld der einfachen Suche, über die Volltextsuche ergibt 7.525 Treffer. In dieser Trefferliste sind die Datensätze standardmäßig nach Relevanz sortiert. Doch wie ermittelt die Suchmaschine diese Relevanz?
Es gibt sogenannte „Volltext-Relevanz-Formeln“, die verschiedene Faktoren kombinieren, um einen Relevanz-Score für jeden Datensatz zu ermitteln. Die drei Faktoren term frequency, inverse document frequency und field-length norm werden während der Indexierung berechnet und gespeichert. Bei „term frequency“ wird ein Wert aus der Häufigkeit des Auftretens des Terms in einem Dokument ermittelt, bei „inverse document frequency“ die relative Häufigkeit des Vorkommens in allen Dokumenten des Index. Das Gewicht ist dabei höher, je seltener der Begriff vorkommt. Bei „field-length norm“ wird der Begriff im Verhältnis zur Feldlänge ausgewertet. Ist das Feld kürzer, dann ist das Gewicht höher, da die Wahrscheinlichkeit steigt, dass der Begriff etwa in einem knappen Titel-Feld tatsächlich inhaltlich relevant ist.
„Kreuzigung (Kaufmannsche Kreuzigung)“ als Titel ist daher relevanter als ein Titel „Kreuzigung“ und der wiederum relevanter als der Titel „Kreuzigung Christi“.
Wenn Sie mehrere Suchbegriffe eingeben, müssen auch die Gewichtungen kombiniert werden. Dazu wird das Vektorraummodell verwendet. Wir werden dieses Modell in einem späteren Newsletter näher beschreiben.




Im letzten Newsletter haben wir Sie ja schon über einige Suchmöglichkeiten informiert (Boolsche Operatoren, Unscharfe Suche, Wildcards). Damit Sie einen kleinen Einblick in das Retrieval erhalten, möchten wir Ihnen nun ein paar der Filter vorstellen, die wir innerhalb der Suchmaschine einsetzen, und zwar zur Vorverarbeitung der Metadaten. Dabei werden die Metadaten teilweise homogenisiert. Das bedeutet nicht, dass die Daten selbst abgeändert werden, jedoch werden bei der Indexierung verschiedene linguistische Analyseerfahren angewendet, um die Verschiedenartigkeit der Daten auszugleichen. Der Lowercase Filter zum Beispiel legt die Metadaten in Kleinbuchstaben im Index ab, und auch die Suchanfrage wird in Kleinbuchstaben umgewandelt, so dass es keine Rolle spielt, ob Sie einen Begriff groß oder klein schreiben. Durch den Einsatz des Umlautfilters werden “Aepfel” und “Äpfel” oder “Grundriss” und Grundriß" gleichermaßen gefunden. Und auch diakritische Zeichen (ASCII folding filter) werden normalisiert, so dass eine Suche nach “Cezanne” auch Treffer mit der korrekten Schreibweise “Cézanne” liefert. Das sind natürlich längst nicht alle Möglichkeiten, die einem die Suchmaschine zur Optimierung des Retrievals bietet. Wie werden Ihnen an dieser Stelle immer mal wieder einen kleinen Einblick in einzelne Retrieval- und auch Bewertungsmechanismen unserer Suchmaschine geben.




Mit dem Anstieg der Anzahl von Bildern im Bildarchiv steigt auch die Anzahl der Metadaten und damit steigt auch die Anzahl der Treffer bei Ihrer Suche. So kann es bei einer einfachen Suche nach Schlagwörtern unter Umständen zu viel sein, was Sie dort in der Liste an Ergebnissen sehen, oder Ihnen sogar auf den ersten Blick als nicht relevant erscheinen, weil möglicherweise der Suchbegriff aus einer längeren weiterführenden Beschreibung des Bildes resultiert. Für präzisere Suchergebnisse empfehlen wir Ihnen daher die erweiterte Suche, mit der Sie in unterschiedlichen Feldern wie “Künstler” oder “Titel” suchen können.
Die erweiterte Suche ermöglicht auch die Suche nach Kombinationen verschiedener Kategorien. Eine Verknüpfung erfolgt hier durch die booleschen Operatoren „und“, „oder“, „und nicht“, beispielsweise nach „Raffael oder Leonardo und nicht Madonna“. Bei allen Suchanfragen können Sie Ihre Suche über die Suchsyntax weiter differenzieren. Wenn Sie beispielsweise einen Suchbegriff mit ~ markieren, wird „unscharf“ gesucht, d.h. es werden auch Wörter ähnlicher Schreibweise mit in die Suche einbezogen. Geben Sie beispielsweise „Gaugun~“ ein, wird „Gauguin“ gefunden. Wenn Sie nicht sicher sind, ob van Gogh „Vincent“ oder „Vinzent“ heißt, können Sie mit Wildcard suchen: „Vin?ent“. Weitere spezielle Syntaxelemente finden Sie hier.




Weil Ihre Arbeit im Bildarchiv oft von Aufgaben und Fragestellungen zu wechselnden Themen bestimmt ist, steht Ihnen bei prometheus für den schnellen und direkten Zugriff auf Bilder und Bildsammlungen die Favoritenleiste am linken Bildschirmrand zur Verfügung. Dargestellt als Boxen können Sie Ihre Favoriten ein- und ausklappen und die Reihenfolge verändern. Icons und Überschriften zeigen Ihnen direkt, was Sie hier abgelegt haben. Wenn Sie Favoriten wieder löschen, löschen Sie nur die Verknüpfung mit dieser Seitenleiste. In den ursprünglichen Bereichen bleiben die Bilder oder Bildsammlungen erhalten.
In letzter Zeit kam es einige Male zu unübersichtlichen Favoritenleisten mit dort abgelegten Bildern aus Suchergebnislisten. Unser Tipp ist, in diesen Fällen zuerst eine Bildsammlung anzulegen und dann diese Sammlung in der Favoritenleiste abzulegen.




Bilddatenbank Nummer 99 ist seit dieser Woche bei prometheus integriert. Es ist die Sammlung des SMK, des Statens Museum for Kunst. Zur Sammlung gehört europäische Kunst von 1300-1800, aber auch dänische und nordische Kunst von 1750-1900. Hier sind Werke wie

„Fra Nyhavn | View of Nyhavn | View of Nyhavn, 1920“,

„C.W. Eckersberg. Parti i Dyrehaven | Study from the Deerpark near Copenhagen | Study from the Deerpark near Copenhagen, 1823-1826” und

“Lundbye, Johan Thomas. Sjællandsk landskab. Åben egn i det nordlige Sjælland | Zealand Landscape. Open Country in North Zealand | Siællandsk Landskab | Åben egn i det nordlige Sjælland | Zealand Landscape. Open Country in North Zealand, 1842”

zu finden.
Die Nationalgalerie Dänemarks sieht sich selbst „nur“ als Verwalter dieser Kunstwerke, Teil des kulturellen Erbes der Gesellschaft. Für sie gehört die Kunst selbst allen. Gemeinfreie Werke stehen daher nicht nur frei zum Download zur Verfügung. Eine kreative Weiternutzung ist im Projekt SMK Open ausdrücklich gewünscht. Die in diesem Zusammenhang zur Verfügung gestellte API haben wir sehr gerne für die Integration genutzt.




Wir freuen uns, dass wir in letzter Zeit auch immer mehr Datenbanken von ausländischen Institutionen integrieren konnten und in nächster Zeit weitere dazu kommen werden, wie die Sammlung des Statens Museum for Kunst aus Kopenhagen. Für eine noch bessere Integration anderssprachiger Bilddatenbanken (beispielsweise Amsterdam Museum oder Rijksmuseum Collection) arbeiten wir gerade daran, Metadaten von Bilddatenbanken, die nicht in Englisch oder Deutsch vorliegen, direkt mit einem Übersetzungstool zu verknüpfen. In einem weiteren Schritt werden die Informationen, etwa aus vorliegenden Beschreibungstexten, indexiert und damit auch durchsuchbar.




Informationssystem Graffiti in Deutschland steckt hinter dem Akronym InGriD und es ist ein von der Deutschen Forschungsgemeinschaft (DFG) gefördertes Kooperationsprojekt der Germanistischen Sprachwissenschaft der Universität Paderborn und des Fachgebiets Kunstgeschichte des Karlsruher Instituts für Technologie (KIT).
Dahinter steckt auch die neu bei prometheus integrierte Bilddatenbank, denn Aufgabe und Ziel des Projekts sind, Graffiti-Bildbestände zusammenzutragen, sie in einer Datenbank zu erfassen und der wissenschaftlichen Forschung zugänglich zu machen. Wissenschaftler und Wissenschaftlerinnen der Universität Paderborn und des Karlsruher Instituts für Technologie annotieren die Graffitis nach einer am Gegenstand entwickelten Ontologie, die sowohl sprach- als auch kunstwissenschaftliche Kategorien enthält. Auf diesem Wege entstehen hochwertige Forschungsdaten, die für wissenschaftliche Untersuchungen und Publikationen verwendet werden können.