"Digitale Bibliothek", Zukunft des digitalen Erbes?

Schriftgröße: 
Datenintegration mit Open Source Werkzeugen
Klaus-Georg Deck

Zuletzt geändert: 2017-03-17

Abstract


Hintergrund

Mit der fortschreitenden Digitalisierung des Wissens steht immer mehr Information in verschiedenen Formaten und auf unterschiedlichen Medien zur Verfügung. Für gezielte Einzelrecherchen ist digitalisierte Information leicht zugänglich, eine umfassende Auswertung von Daten aus unterschiedlichen Datenquellen ist wegen nicht vorhandener Standardisierung (z.B. Format, Kodierung, Struktur, Granularität) deutlich schwerer, wenn nicht sogar unmöglich. Dies betrifft umso mehr Projekte, die von vornherein mit großen Datenmengen aus unterschiedlichen Quellen operieren, besonders inter- und transdisziplinäre Forschungsvorhaben. In Industrie und Wirtschaft steht man im Data-Warehouse/-Business-Intelligence Umfeld nicht nur vor ähnlichen Herausforderungen, dort gibt es mit einer Vielfalt von entsprechenden ETL-Werkzeugen zum Extrahieren/Transformieren/Laden von Daten sogar die entsprechenden Lösungen.

 

Ziel

Im Workshop wird das Open Source Werkzeug „Pentaho Data Integration“ (PDI) vorgestellt und dessen Funktionalität mit den Teilnehmenden an verschiedenen Use-Cases erarbeitet.  

Es ist möglich, auf spezielle Wünsche einzugehen, sofern diese vorab an den Autor kommuniziert werden.

Nehmen Sie hierzu bitte rechtzeitig mit dem Autor Kontakt auf (Betreff: Digitale Bibliothek 2017: Workshop Datenintegration): Prof. Dr. Klaus-Georg Deck, klaus-georg.deck@mosbach.dhbw.de

 

Die Community-Edition von PDI stellt ein voll funktionsfähiges ETL-Werkzeug dar, das seit Jahren im IT-Bereich etabliert ist und sich nur unwesentlich von der kostenpflichtigen kommerziellen Lizenz unterscheidet. Neben dem Hauptanwendungsfeld zur kontrollierten Zusammenführung von heterogenen Daten aus verschiedenen Quellen wird es auch zur Qualitätsüberprüfung und –sicherung von bestehenden Datenbeständen sowie zur Datenmigration verwendet.

 

Ablauf des Workshops

  • Installation von PDI
  • Einsatzszenarien von PDI
  • Features und Funktionsumfang (Überblick)
  • Ablaufsteuerung (Jobs, Transformationen, Steps)
  • Datenquellen
  • Spezielle Use Cases

Die Teilnehmer können für die gemeinsame Arbeit gerne ihre eigenen Laptops mitbringen.

PRÄSENTATION:

Datenintegration mit Open Source Werkzeugen. (.pdf)

 Klaus-Georg Deck