Open Password Archiv Logo

Anzeige



Open Password – Montag, den 13. Juni 2022

# 1085

Open Science – Wissensgraphen – Linked Open Data – Ontologien – ZPID – Tina Trillitzsch – Linked Open Data Cloud – ZPID-Knowledge-Graphen – PSYNDEX – PubPsych – PsychArchives – Offener Wissensgraph – SPARQL – Semantic – Entitäten – Beziehungen – Eigenschaften – Semantisches Netz – Semantische Suchmaschine – Googles Knwledge Graph – Amazons Alexa – Wikidata – Psychologie – Resource Description and Access – Semantisches Modellieren -PsychPorta – PsychAuthors

KOALA – Gemeinschaftliche Open-Access-Finanzierung – Medienwissenschaften – Sozialwissenschaften – TIB – KIM – Article Processing Charges – Marco Tullney – Sören Auer – KOALA-Konsortien – Mindeststandards – Plan S – Preisstaffelung – BMBF

Open Science

Wissensgraphen, Linked Open Data und Ontologien für die psychologischen Datenbestände
des Leibniz-Instituts für Psychologie (ZPID)

Von Tina Trillitzsch

Tina Trillitzsch

___________________________________________________________________

Zusammenfassung
_____________________________________________________

Es wird immer wichtiger, wissenschaftliche Datenbestände als offene Wissensgraphen (Knowledge Graphs) im Semantic Web zur Verfügung zu stellen, um Open-Science-Prinzipien zu erfüllen und das Auffinden, Einordnen und Reproduzieren von Studien zu erleichtern. Offene Wissensgraphen machen die relevanten Daten von Studien und Publikationen für alle Interessierten frei verfügbar, für semantische Suchmaschinen verstehbar und ermöglichen die Verknüpfung mit eindeutigen Entitäten für verantwortliche Personen und Institutionen.

Dieser Beitrag erläutert die Kernbegriffe zum Thema und geht darauf ein, wie das Leibniz-Institut für Psychologie (ZPID) seine Datenbestände aus dem Bereich der Psychologie in dieser Form anbieten wird. Nach einem kurzen Abriss über Wissensgraphen und deren Möglichkeiten zur semantischen Darstellung von Informationen folgt eine Einführung von Linked Open Data, der Linked Open Data Cloud (LOD Cloud) und der Rolle eines künftigen ZPID-Knowledge-Graphen darin. Abschließend wird die grundlegende Rolle von Ontologien für Knowledge-Graphen erörtert und auf die eigene Ontologie des ZPID eingegangen. Diese befindet sich aktuell im Aufbau. Thematisiert werden Ziele, der aktuelle Stand sowie die Pläne für die weitere Entwicklung.

_____________________________________________________

Das ZPID und sein geplanter Wissensgraph zur Bereitstellung psychologischer Daten
_____________________________________________________

Das ZPID (Leibniz-Institut für Psychologie) ist eine Infrastruktureinrichtung für die Psychologie in den deutschsprachigen Ländern. Es pflegt die Literaturdatenbank PSYNDEX für psychologische Forschungsliteratur, das Suchportal PubPsych zum kostenlosen Durchsuchen von PSYNDEX und das Repositorium PsychArchives zur Langzeitarchivierung psychologierelevanter digitaler Forschungsobjekte wie Artikel, Forschungsdaten, Präsentationsfolien usw. Diese bisher weitgehend getrennten Datenbestände wird das ZPID in Zukunft als offenen Wissensgraphen bereitstellen und so besonders die Auffindbarkeit von psychologischen Informationen, Studien und Forschungsdaten erhöhen und ihre Nachnutzung erleichtern. Der Graph wird Daten mit semantischer Bedeutung anreichern und die isolierten “Datensilos” intern miteinander vernetzen, aber auch reichhaltige Verknüpfungen nach außen schaffen zu weiteren freien Datenbeständen und Normdateien im Netz. Interoperabel wird der Graph durch die Verwendung offener Standards und Formate wie RDF, SKOS und OWL sowie durch die Unterstützung des freien Wissensgraph-Schnittstellenstandards SPARQL. So können Nutzer*innen und andere Dienste in Zukunft Daten aus verschiedenen Quellen gemeinsam abfragen, zusammenfügen und flexibel in innovativen Anwendungen weiterverwenden. Zu diesem Zweck entwickelt das ZPID derzeit eine Ontologie, die als “Bauplan” für den Wissensgraph dienen wird.
_____________________________________________________

Was ist ein Knowledge Graph?
_____________________________________________________

Ein Knowledge Graph (zu Deutsch „Wissensgraph“) ist eine Methode, mit der man Daten in strukturierter Form speichert und dabei ausdrücklich ihre Bedeutung (Semantik) miterfasst. Zudem werden die Daten wie ein flexibles Spinnennetz gespeichert und miteinander verknüpft statt wie sonst üblich als starre Tabellen in einer Datenbank aneinanderzureihen.

Strukturiert heißt, die Informationen werden in einzelne, vordefinierte Elemente unterteilt. Miterfassung der Semantik, das bedeutet: Für jedes dieser erfassten Informationselemente wird genau beschrieben, um was für eine Art von Information es sich handelt (also etwa „Person“, „hat Vornamen“). Das geschieht am besten mehrsprachig, mit Erklärung und mit Synonymen.

Diese ausdrückliche Bedeutungs-Anreicherung der Daten benötigen wir, damit Computer sie wirklich „verstehen“ und sinnvoll durchsuchen und verknüpfen können – denn sie können die Bedeutung von Dingen nicht aus dem Kontext ableiten, wie dies die Menschen tun. Man muss ihnen alle Bedeutungen erst explizit nennen. Ein Beispiel für einen unstrukturierten Text ohne explizite semantische Information ist die folgende Aussage:

„[…] übernahm Michael Bosnjak […] die Leitung des ZPID.“ (Ausschnitt aus Wikipedia-Artikel zum ZPID)

Menschen wissen aus Erfahrung, was hier gemeint ist. Computer verstehen in diesem Ausschnitt viele Dinge nicht: Was ist ein „ZPID“? Was ein „Michael“, was eine “Leitung”? Ist hier eine Stromleitung gemeint oder die Führungsposition einer Organisation? Wie hängen diese Dinge miteinander zusammen? Daher müssen wir die Bedeutung „dazusagen“.
_____________________________________________________

Wie Semantik in Wissensgraphen abgebildet wird
_____________________________________________________

„Dinge“ werden als sogenannte Entitäten gespeichert: als Individuen eines bestimmten Typs. Diese Entitäten werden untereinander durch benannte Beziehungen verknüpft. Einfache Eigenschaften der Dinge (Text-Werte wie Jahreszahlen oder Namen) werden ebenfalls über Beziehungen mit ihren Entitäten verknüpft.

Damit wird etwa aus dem unstrukturierten Text „[…] übernahm Michael Bosnjak […] die Leitung des ZPID“ folgende semantische Struktur:

  • ZPID“ ist eine Entität vom Typ “Organisation”.
  • Diese ZPID-Organisations-Entität hat eine Beziehung zur Entität „Michael Bosnjak“ vom Typ Person, und zwar eine Beziehung vom Typ „hat Direktor*in einer Organisation“ (Zusätzlich bewahren wir eine englische Bezeichnung derselben Beziehung auf, ebenso eine genauere Erklärung und eventuelle Synonyme).
  • Die ZPID-Entität hat ferner eine Beziehung zum Datumswert „1972“, und der Typ dieser Beziehung ist „hat Gründungsjahr“

So fügen sich diese Informationen zusammen zu einem strukturierten, mit Bedeutung angereicherten Netz, einem „semantischen Netz“, mit Entitäten als Knotenpunkten. Die „Fäden“ bilden die Beziehungen zu anderen Entitäten oder zu Werten. Um etwas Neues zum „ZPID“ zu speichern, „spannt“ man davon ausgehend einen weiteren (benannten) Faden zu einem anderen Knoten oder einen neuen Datenwert.

Um die so gespeicherten Daten abzufragen, verwenden wir eine semantische Suchmaschine, die alle Verknüpfungen und ihre möglichen Namen und Erklärungen kennt. Sie „hangelt“ sich von Knoten (Entität) zu Knoten durch das Netz, immer entlang seiner Fäden, bis sie das Gesuchte findet und uns präsentiert.

Im Folgenden werden zwei Fragen gestellt, um zu zeigen, wie eine semantische Suchmaschine sie beantwortet, indem sie sich durch eine erweiterte Version unseres Netzes “hangelt”:

  • Wer ist Direktor des Leibniz-Instituts für Psychologie? – Alle Namen von Entitäten durchsuchen, über die Beziehung „hat Hauptnamen“ den passenden finden, von dort zum ZPID-Knoten selbst, dann über die Direktor-Beziehung zur Person M. Bosnjak.
  • Worüber schreibt M. Bosnjak? – Personen-Entität mit dem genannten Namen finden, schauen, ob sie mit Beziehung „ist Autor von“ mit Publikationen-Entitäten verknüpft ist; dann von dort prüfen, ob die Publikationen Beziehungen vom Typ „hat Thema“ haben und auflisten, welche Schlagwörter an deren Ende stehen.

Tina Trillitzsch ist Informatikerin im Bereich Informieren & Recherchieren am ZPID (Leibniz-Institut für Psychologie). Sie war in den Bereichen der Konzeptionierung von Informationsarchitekturen und der Frontend-Web-Entwicklung tätig und verfügt über langjährige Erfahrungen mit Literaturdatenbanken im Bereich der Psychologie. Derzeit entwickelt sie eine Ontologie zur semantischen Erschließung der Datenbestände des ZPID, unter anderem der Literaturdatenbank PSYNDEX. Ferner ist sie für die Entwicklung und Pflege der Hilfs- und Informations-Website psyndex.de zuständig.

Lesen Sie in der abschließenden Folge: Knowledge Graphen in “freier Wildbahn” – Pläne und Ziele nach Fertigstellung der Ontologie

Projekt KOALA

Suche nach gemeinschaftlicher
Open-Access-Finanzierung

(TIB) Ab sofort können sich Einrichtungen an gemeinschaftlicher Open-Access-Finanzierung in Medienwissenschaften und Sozialwissenschaften beteiligen

Im BMBF-geförderten Projekt KOALA („Konsortiale Open Access Lösungen aufbauen“) fällt der Startschuss für die erste Pledgingphase mit Publikationen aus den Bereichen Medienwissenschaften und Sozialwissenschaften. Ziel der beiden Projektpartner, der TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften und dem Kommunikations-, Informations-, Medienzentrum (KIM) der Universität Konstanz, ist es, gemeinsam eine nachhaltige, gemeinschaftliche Finanzierung von Open-Access-Zeitschriften und -Schriftenreihen aufzubauen, die den Betrieb ohne Kosten für Autoren ermöglicht.

In der sogenannten Pledgingphase verpflichten sich Unterstützer, Bibliotheken, Forschungseinrichtungen, Stiftungen, Museen, Vereine, Unternehmen und Einzelpersonen, zur Beteiligung an den Kosten der Finanzierung von Open-Access-Publikationen. Wenn die vorgegebene Zahl an Unterstützer erreicht wird, leisten diese einen nach ihrer Größe und dem Umfang der gebündelten Publikationen gestaffelten Beitrag. Sollten sich nicht genügend Unterstützer finden, kommt die Finanzierung durch KOALA nicht zustande.

_____________________________________________________

Wie funktioniert das KOALA-Modell?

_____________________________________________________

Traditionell finanzieren sich wissenschaftliche Zeitschriften und Schriftenreihen über (meist institutionelle) Abonnements oder den Verkauf von Einzelexemplaren. Dies schließt viele potenzielle Leser aus. Viele Open-Access-Zeitschriften stellen hingegen Autor Kosten in Rechnung, sie erheben sogenannte Article Processing Charges (APCs).

„Wir wollen den freien Zugang zu wissenschaftlichen Erkenntnissen ohne finanzielle Hürden. Deshalb bemühen wir uns um nachhaltige und faire Open-Access-Modelle“, sagt Marco Tullney, Projektleiter von KOALA. Prof. Dr. Sören Auer, Direktor der TIB, erklärt: „Die gemeinschaftliche Finanzierung von Open-Access-Publikationen durch breit aufgestellte Konsortien schließt an die umfangreichen und guten Erfahrungen mit Bibliothekskonsortien an. Dieses Instrument richten wir nun auf Open Access aus.“

Das Pilotportfolio von KOALA umfasst die folgenden beiden Bündel:

KOALA Medienwissenschaften 2023

KOALA Sozialwissenschaften 2023

_____________________________________________________

Was sind geeignete Zeitschriften und Schriftenreihen für KOALA?

_____________________________________________________

KOALA-Konsortien finanzieren Zeitschriften und Schriftenreihen, die einen unmittelbaren Zugang zu Volltexten ermöglichen und keine Publikationsgebühren verlangen. Als Kandidaten kommen also sowohl solche infrage, die bereits Open Access erscheinen, als auch solche, die derzeit nur für Abonnenten zugänglich sind und ihr Modell umstellen wollen. Auch Zeitschriften oder Schriftenreihen, die aktuell noch APCs erheben, diese Praxis jedoch aufgeben wollen, sind geeignet.

Zusätzlich zur Bereitschaft zum Open-Access-Publizieren setzt KOALA die Erfüllung einer Reihe von Mindeststandards voraus. Diese orientieren sich an Plan S, einer Strategie zur Förderung des freien Zugangs zu wissenschaftlichen Erkenntnissen, die mit öffentlichen Mitteln finanziert wurden, und anderen einschlägigen Initiativen. Die an KOALA beteiligten Redaktionen und Herausgeber erhalten umfangreiche Unterstützung bei der Umsetzung dieser Standards.

_____________________________________________________

Wie entstehen die Preise?

_____________________________________________________

Die Preise für die einzelnen Bündel werden auf Basis der Finanzbedarfe der Zeitschriften und Schriftenreihen ermittelt, die diese für einen nachhaltigen Betrieb ihrer Publikation an KOALA melden. Für jedes Bündel gibt es eine Preisstaffelung („Tiering“), der sich teilnehmende Unterstützer entsprechend ihrer Größe zuordnen können. Die Zeitschriften und Schriftenreihen erhalten dann über drei Jahre eine Finanzierung aus dem KOALA-Konsortium.

_____________________________________________________

Wie kann ich oder meine Einrichtung an der Finanzierung teilnehmen?

_____________________________________________________

Das Gros der Erwerbungsabteilungen der wissenschaftlichen Bibliotheken in Deutschland erhält in diesen Tagen per E-Mail Informationen zur Teilnahme am KOALA-Konsortium. Andere Interessierte mögen sich per Mail unter koala@tib.eu an das Projektteam wenden oder an einer der Informationsveranstaltungen teilnehmen.

_____________________________________________________

Werden noch weitere Zeitschriften aufgenommen?

_____________________________________________________

Die Zusammenstellung der Zeitschriften und Schriftenreihen für die aktuelle Pledgingphase ist final. Die Vorbereitungen für die nächste Finanzierungsrunde ab 2024 laufen bereits, interessierte Zeitschriften oder Schriftenreihen können sich gern melden, alle Disziplinen sind willkommen.

Das Projekt KOALA wird vom Bundesministerium für Bildung und Forschung (BMBF) über eine Laufzeit von zwei Jahren gefördert.

Open Password

Forum und Nachrichten
für die Informationsbranche
im deutschsprachigen Raum

Neue Ausgaben von Open Password erscheinen dreimal in der Woche.

Wer den E-Mai-Service kostenfrei abonnieren möchte – bitte unter www.password-online.de eintragen.

Die aktuelle Ausgabe von Open Password ist unmittelbar nach ihrem Erscheinen im Web abzurufen. www.password-online.de/archiv. Das gilt auch für alle früher erschienenen Ausgaben.

International Co-operation Partner:

Outsell (London)
Business Industry Information Association/BIIA (Hongkong)

Archiv & Touchpoint

Das Open Password Archiv Plus bündelt mehr als 1.100 Beiträge aus den Open Password Pushdiensten seit 2016.

 

Anzeige

Anzeige



Events & Termine mit Relevanz für die Informationsbranche

Open Password FAQ

FAQ + Hilfe

Sie können über die Kopfzeile die einzelnen Jahre per Klick ansteuern. Hierzu einfach auf die passende Jahreszahl klicken (siehe Pfeile)

Open Password Navigation Hilfe

Nach dem Klick auf die jeweilige Jahreszahl gelangen sie auf die Titelliste des jeweiligen Jahres. Hier dann auf den gewünschten Titel klicken. (Siehe Pfeile)

Open Password Archiv Titelübersicht

Wir sind bemüht die Beiträge schnellstmöglich in das Archiv zu übernehmen. Falls ein Beitrag per Klick nicht erreichbar ist zählen wir diese Klicks aus. Sie können aber auf der jeweiligen Seite die beschleunigte Einbindung auswählen.

Wir sind bemüht die Beiträge so schnell wie möglich in das Archiv einzubinden. Die Planung sieht die komplette Einbindung aller Beiträge bis zum Ende dieses Jahres (2022) vor.

Wir haben alle Pushdienste (Beiträge) der letzten Jahre als PDF vorliegen. Hier sind entsprechende Abbildungen und Bilder enthalten. Die PDFs zu den Pushdiensten werden ebenfalls Schritt für als Link mit in die Beiträge angelegt.

Wir sind bemüht Beiträge nach denen einen hohe Nachfrage besteht in der Anlage vorzuziehen. Hierfür werten wir die Zugriffe auf die Titellisten und die Klicks auf Beiträge regelmässig aus.

Beitrage die als Material benötigt werden, aber noch nicht im Archiv eingebunden sind können wie folgt angefordert werden.

1. Klicken sie auf den Beitrag aus der Titelliste
2. Füllen sie das Formular aus und fragen sie eine bevorzugte Einbindung an

Wir ziehen die Einbindung vor und senden eine Benachrichtigung sobald der Beitrag eingebunden wurde.