FAQ
Antworten auf die wichtigsten Fragen zu Open Data
Jede Veränderung wirft Fragen auf, so auch das Thema Open Data: „Was ist überhaupt Open Data und was verbirgt sich hinter schema.org?“
Um gemeinsam auf das Ziel von verfügbaren, offenen, touristischen Daten in Deutschland hinzuarbeiten, gilt es die Begrifflichkeiten zu definieren und zu verstehen. Für ein Grundverständnis haben wir Antworten auf die wichtigsten Fragen zusammengetragen.
Open Data
Open Data (Offene Daten) sind alle Datenbestände, die im Interesse der Allgemeinheit ohne Einschränkung zur Weiterverbreitung und zur Weiterverwendung zugänglich und nutzbar gemacht sind.
Daten müssen mit entsprechenden offenen Lizenzen ausgestattet werden, damit jeder Marktteilnehmer (z.B. Global Player, Startup, Leistungsträger) diese Daten möglichst uneingeschränkt nutzen kann. Die Daten müssen als strukturierte und verlinkte Daten im Internet zugänglich gemacht, um auch genutzt werden zu können. Open Data können also automatisch ausgelesen interpretiert und verwendet werden.
Mit Open Data wird die Voraussetzung für den Digitalen Wandel in Richtung Künstliche Intelligenz geschaffen. Wir sichern so den Tourismusstandort Deutschland, stärken die Wettbewerbsfähigkeit, fördern insbesondere touristische Regionen sowie digitale Innovationen im Tourismus bzw. darüber hinaus. Nicht zuletzt steigern wir die Markenpräsenz des Reiselandes Deutschland im In- und Ausland.
Nutzer sind alle Unternehmen wie Global Players, Startups, übergeordnete Organisationen, Partner und alle Akteure innerhalb und außerhalb des Tourismus, welche aus den Daten Produkte und Dienstleistungen für die Nutzer schaffen.
Interessant sind alle Daten mit Informationsgehalt in allen Content-Formaten (Bilder, Texte, Videos, Podcasts, etc.): Punkte wie POIs/Restaurants, Linien wie Touren/Wege, Flächen wie Regionen/Skigebiete, Dynamische Informationen wie Öffnungszeiten/Schneehöhen, Statistiken wie Besucherströme/Auslastungen und weitere Inhalte wie Geschichten, Rezepte oder Personen.
Daten müssen in der Content-Verwaltung getrennt vorliegen und in einer einheitlichen Ontologie wie bspw. schema.org beschrieben sein. Als Beispiel: eine Liste im Texteditor mit Wochentagen und Öffnungszeiten reicht nicht aus, weil sie maschinell nicht sauber interpretierbar ist. Wochentage müssen konkret ausgezeichnet werden, Uhrzeiten entsprechend. Je nach Content-Verwaltung werden die Daten also nach vorgegebenen Strukturen eingegeben, damit diese dann nutzergerecht ausgegeben werden können. Dazu muss das System die Möglichkeit bieten, die jeweiligen Datenrechte auf Content-Feldebene nach Formaten differenziert zu kennzeichnen.
Linked Open Data ist die weitestgehende Öffnung von Daten im Internet. Verlinkte Daten sind Teil der Linked Open Data Cloud und können so von Akteuren gefunden und genutzt werden.
Da offene Daten von allen über Schnittstellen zur Verfügung stehen, können die Daten genutzt werden, um neue digitale Produkte und Dienstleistungen zu entwickeln, welche der Allgemeinheit im Alltag oder im Urlaub nützlich sein können.
Da strukturierte offene Daten grundsätzlich von jedermann genutzt werden können, entsteht generell eine höhere Reichweite. Dazu kommt, dass strukturierte offene Daten von Suchmaschinen mit höherer Qualität bewertet werden.
Erste Referenzprojekte zeigen, dass Akteure mit strukturierten offenen Daten von deutlich mehr organischen Zugriffen bei den Suchmaschinen profitieren. Man löst sich also ein Stück weit von der Vorstellung, dass Content nur auf der eigenen Website zur Verfügung stehen muss. Dies gilt insbesondere für diejenigen Inhalte, die bereits in der Google Search Gallery definiert sind. Google zeigt dort, wie die Inhalte präferiert auf der Suchergebnisseite angezeigt werden können, was ein klares Signal ist, dass über die korrekte Auszeichnung dieser Inhaltstypen mehr als weniger Sichtbarkeit generiert werden kann.
Bestehende KPIs (Key Performance Indicators) wie Visits und Page Views greifen nicht mehr, wenn Contents und Daten von Drittanbietern frei genutzt werden können. Hier müssen neue KPIs entwickelt werden.
In der Open Data-Landschaft geht es um Contents zu den oben genannten Datentypen (wie z.B. POIs, Touren, Regioneninformationen, Dynamische Informationen etc.). Die DSVGO schützt personenbezogene Daten, welche nur mit einem Einverständnis veröffentlich werden dürfen. Problematisch kann es dann werden, wenn es sich um Kontaktdaten handelt.
Frei verfügbare Daten sind eine wesentliche Voraussetzung für die Weiterentwicklung neuer Technologien wie Conversational Interfaces, Mobilität und Internet of Things sowie der Entwicklung neuer touristischer Angebote und Services. Der Anwender und Gast wird davon profitieren.
GovData ist das Datenportal für Deutschland. Hier werden offene Daten der Verwaltungen von Bund, Ländern und Gemeinden veröffentlicht.
Beide Initiativen stehen im Austausch miteinander. Unterschiede zwischen den Initiativen bestehen in der Art der Aufbereitung der Daten. GovData stellt die Daten in tabellarischer Form zur Verfügung. Das Open Data-Projekt für den Deutschlandtourismus wird seine Daten in Form eines Knowledge Graphen aufbereiten und zur Verfügung stellen. Damit erfolgt eine erste, nutzungsorientierte Aufbereitung der Daten bereits vor der Distribution der Daten.
Knowledge Graph
In einem ersten Schritt müssen die Daten von den lokalen und regionalen „Datensilos“ einheitlich ausgezeichnet werden bzw. diese Einheitlichkeit über Schnittstellen realisiert werden.
Im nächsten Schritt werden die Daten über eine zentrale Graph-Datenbank (Knowledge Graph) verfügbar gemacht. Eine Graph-Datenbank zeichnet sich dadurch aus, dass sie die Daten für den Anwendungsbereich der Künstlichen Intelligenz semantisch eindeutig, strukturiert und leistungsstark zur Verfügung stellt. Interessierte Anwender können dann die Daten aus dem Knowledge Graph nutzen.
Der Begriff Knowledge Graph wurde von Google geprägt für die Wissensdatenbank, die von Google und seinen Diensten verwendet wird, um die Ergebnisse seiner Suchmaschine mit Informationen rund um den Suchbegriff aus einer Vielzahl von Quellen anzureichern. Die Informationen werden den Benutzern in einer Infobox neben den Suchergebnissen angezeigt oder via Google Voice Assistant ausgegeben.
Inzwischen hat sich der Begriff Knowledge Graph für entsprechende Produkte, auch von anderen Erstellern, durchgesetzt. Ein Knowledge Graph ist also eine Wissensbasis in Netzwerkform – ähnlich einem semantischen Netz, in dem einzelne Wissenspunkte und deren Beschreibung in eine semantische Beziehung gesetzt werden. Knowledge Graphen können die Grundlage für viele Anwendungen der Künstlichen Intelligenz sein. Der bekannteste Knowledge Graph ist der Knowledge Graph von Google.
Um alle strukturierten touristischen Daten an einem Ort verfügbar zu machen, z.B. für Anwendungen der Künstlichen Intelligenz oder auch andere Anwendungen, möchten die LMOs, die DZT sowie eine Vielzahl der touristischen Leistungsträger in Deutschland einen eigenen offenen touristischen Knowledge Graph schaffen.
Lizenztypen
Das geistige Eigentum von Daten wird von unterschiedlichen Gesetzen national unterschiedlich geregelt. Als Orientierung, an welche Bedingungen der Umgang mit entsprechenden Daten geknüpft ist oder eben wie offen eine Nutzung möglich ist, wurden deshalb für die digitale Welt aussagekräftige Lizenzen geschaffen.
Das bekannteste Lizenzsystem heißt Creative Commons. Deren brauchbarste Lizenztypen, die sich durchgesetzt haben für Akteure, welche Open Data nutzen wollen, sind:
- CC0: auf alle Rechte wird verzichtet, die Daten können beliebig, also komplett offen genutzt werden.
- CC-by: bei einer Verwendung der Daten muss auf den Urheber verwiesen werden.
- CC-by-sa: bei einer Verwendung der Daten muss auf den Urheber verwiesen werden. Das Werk darf nur unter der gleichen Lizenz weitergegeben werden.
Alle anderen Lizenztypen sind zu eingeschränkt, erschweren die Nutzung stark und sind wenig sinnvoll.
Weiterführende Informationen finden Sie in dem Fachbeitrag „Die rechtlichen Auswirkungen von Open Data“
Contentleistungen werden entweder selbst produziert oder eingekauft. Bei beiden Vorgehen ist zu empfehlen, dass mit den Urhebern vereinbart wird, dass die eingekauften Leistungen (Contents bzw. „Daten“) zeitlich und inhaltlich uneingeschränkt genutzt werden können.
Entsprechend muss darauf geachtet werden, dass Daten prioritär mit der CC0-Lizenz oder alternativ der CCby-Lizenz ausgezeichnet sind.
Weiterführende Informationen können Sie dem „Mustervertrag für eine Auftragsproduktion bei Fotografen“ entnehmen.
Bestehender Content sollte, wenn dieser strategisch und operativ relevant ist, wenn immer möglich auf die CC0-Lizenz aufgerüstet werden.
Nutzungsrechte
Durch die Umstellung auf Open Data wird man Ausschreibungen und Verträge zum Content-Einkauf überarbeiten müssen, um die entsprechenden Nutzungsrechte zu erhalten. Die Aufklärung der bestehenden Partner über diese Neuerung wird wichtig sein, da bisher ein uneingeschränktes Nutzungsrecht seinen Preis hatte. Erwartungsgemäß wird sich ein Teil der bestehenden Partner vorerst zurückhalten oder teurer anbieten, aber es werden sich auch neue Bewerber melden zu Konditionen, die vergleichbar sind mit den jetzigen. Mit der Zeit werden wohl auch bestehende Partner wieder zu ursprünglichen Preisen anbieten.
Daten und Inhalte können für Einsatzwecke verwendet werden, die nicht kontrolliert werden können. Die Gefahr besteht aber mit veröffentlichtem Content im Internet immer und die Erfahrung zeigt, dass sie in der Realität sehr klein ist. Aus unserer Sicht überwiegen die Möglichkeiten und Chancen durch Open Data die Risiken bei weitem.
Schema.org
Strukturierte Daten sind Daten, welche nach einem vorgegebenen de-facto Standard ausgezeichnet sind. Schema.org ist der bekannteste Standard, auf welchen sich die großen Suchmaschinen geeinigt haben.
Strukturierte Daten müssen für den Einsatz in semantischen Kontexten einer einheitlichen Auszeichnungssprache folgen. Eine etablierte Ontologie dafür ist „schema.org“. Schema.org ist eine Initiative der großen Suchmaschinen Bing, Google, Yahoo! und Yandex. Es stellt ein Beschreibungssystem zur Verfügung, damit Daten in einer bestimmten Struktur bereitgestellt werden können. Innerhalb von schema.org gibt es also Schemata, mit denen verschiedene Arten von Daten (zu einem Hotel, einer Veranstaltung, einem POI usw.) beschrieben werden können.
Das könnte Sie auch interessieren