UniKL Logo

Lehrgebiet Informationssysteme

FB Informatik

FB Informatik
 
LG IS
AG DBIS
AG HIS
Jobs / Tasks
Courses
Seminar
SS 2005
Aktuelles
Allgemeines
Organisation
Themen
  • SS 2007
  • Aktuelles Seminar:
  • WS 06/07
  • Archiv:
  • WS 06/07
  • SS 2006
  • WS 05/06
  • SS 2005
  • WS 04/05
  • SS 2004
  • WS 03/04
  • SS 2003
  • WS 02/03
  • SS 2002
  • more...
    Publications
    Contact
    Misc
    Impressum
    (C) AG DBIS
     

    Integriertes Seminar Datenbanken und Informationssysteme im Sommersemester 2005

    Thema: Data Streams

    Voraussetzung: Vorlesung Datenbankanwendung

    Ansprechpartner: Jürgen Göres

    Aktuelles

    Datum Ankündigung
    28. Februar 2005 Betreuer

    Die Zuordnung der Betreuer zu den Themen steht fest und kann der Themenliste entnommen werden. Die Seminaristen sollten baldmöglichst mit ihren Betreuern in Kontakt treten.
    4. Februar 2005 Einstiegsliteratur

    Als Grundlage für alle Themen finden sich in der Literaturliste zwei Papiere zu den Grundlagen von Data Streams. Sie vermitteln auch einen allgemeinen Überblick über die Themen und erleichtern so möglicherweise die Themenwahl.
    4. Februar 2005 Erweiterung der Teilnehmerzahl und vorgezogene Vorbesprechung

    Aufgrund des großen Interesses wurde die Zahl der Plätze auf 16 erhöht. Um trotz der daraus resultierenden größeren Zahl von Vortragsterminen den Teilnehmern genügend Zeit für die Bearbeitung des Themas zu bieten, erfolgt eine vorgezogene Vorbesprechung noch in diesem Semester, und zwar am Donnerstag, den 24. Februar, 14 Uhr im Seminarraum des Lehrgebiets (36/336). Bei dieser Gelegenheit können die Teilnehmer bereits Themen zur Bearbeitung auswählen. Wer an dieser Vorbesprechung nicht teilnehmen kann, kann zu Beginn des Sommersemesters aus den verbliebenen Themen auswählen.
    18. Januar 2005 Anmeldung

    Die Anmeldung für das Seminar ist ab dem 21. Januar durch Eintrag in eine Liste im Flur des Lehrgebietes Datenverwaltungssysteme (36/3) möglich.
    18. Januar 2005 Organisatorische Änderungen

    Organisation und Ablauf haben sich im Vergleich zu den vorangegangenen Seminaren geändert. Daher sollten insbesondere frühere Teilnehmer die geänderten allgemeinen Hinweise für Bearbeiter beachten.

    Allgemeines

    Die Arbeitsgruppen Datenbanken und Informationssysteme und Heterogene Informationssysteme bieten im Sommersemester 2005 ein Seminar zum Thema Data Streams an. Das Themenspektrum umfasst sowohl die Anwendungsseite als auch technologische Aspekte. Dieses Seminar ist als Bestandteil des Anwendungsblocks des Lehrgebiets Datenverwaltungssysteme im Hauptstudium Informatik ausgewiesen. Daneben bietet sich aufgrund der inhaltlichen Bezüge eine direkte Integration dieses Seminars mit dem ebenfalls in diesem Semester angebotenen ORDB-Praktikum im Rahmen des Hauptstudiums der Angewandten Informatik an.

    Organisation

    Themenbeschreibung

    Data Streams

    Klassische Datenbanksysteme eignen sich insbesondere für Anfragen auf einem weitgehend stabilen Datenbestand mit moderater Änderungshäufigkeit. Ständige Änderungen des Datenbestandes sind dagegen wegen des damit verbundenen Reorganisationsaufwandes keine besondere Stärke dieser Systeme. Während dies für viele Anwendungen aus dem Bereich betrieblicher Informationssysteme keine Einschränkung darstellt, hat das Entstehen neuer Anwendungen mit geändertem Nutzungsprofil ein neues Datenverarbeitungs- und Anfrageparadigma erforderlich gemacht. Gebäude- oder Netzwerküberwachung, Börsenapplikationen oder die Analyse von Clickstreams, also dem Nutzerverhalten auf Webseiten, produzieren permanente Ströme von Daten, die häufig direkt nach ihrem Entstehen ausgewertet werden müssen, um für die Anwendung von Nutzen zu sein. Das Speichern dieser Daten in konventionellen Datenbanken ist wegen der Unmittelbarkeit der Auswertung und auch aufgrund der enormen Menge an Daten häufig weder erforderlich noch mit vertretbarem technischen Aufwand zu realisieren. Zahlreiche Forschergruppen weltweit haben sich mit der Entwicklung von auf die Verarbeitung derartiger Datenströme optimierten Datenverwaltungssystemen beschäftigt. Zusätzlich zu neuen Konzepten sind so auch erste prototypische Data Stream Management Systems (DSMS) entstanden. Im Seminar Data Streams sollen zunächst die Grundkonzepte und Architekturen datenstromorientierter Datenverwaltungssysteme vorgestellt und in den Kontext bestehender Technologien eingeordnet werden. Anschließend werden die Besonderheiten der Anfrageverarbeitung wie persistente Queries, Anfragen auf Zeitfenstern oder Plan Sharing präsentiert. Ergänzt werden diese Grundlagen durch eine Vorstellung von bereits existierenden Systemen und der Schilderung von Anwendungsszenarien.

    Themenliste

    (Änderungen vorbehalten)

    Thema Vortragende(r) Betreuer Termin Ausarbeitung Folien
    1 Grundlagen und Abgrenzung Vorstellung des Streamkonzepts
    Unterschiede zu klassischen Datenverwaltungssystemen, XML- vs. relationale Ströme, reduzierte Präzision
    Benjamin Mock Stumm Freitag 17.06.2005 13:30, 36/336 Ausarbeitung (PDF) Folien (PDF)
    Folien (PPT)
    2 Anwendungen
    Sensornetze, Netzwerkmonitoring, Finanzapplikationen etc., "Killer-Applikationen", generischen DSMS oder Speziallösungen?
    entfällt entfällt    
    3 Vergleich mit Publish/Subscribe-Systemen
    Abgrenzung von Pub/Sub-Systemen, Scribe, Gryphon,...
    entfällt entfällt    
    4 Streamverarbeitung mit konventionellen DBMS
    Trigger, (hierarchische) Views etc., Grenzen dieser Systeme
    Christian Rensch Haustein Ausarbeitung (PDF) Folien (PDF)
    Folien (PPT)
    5 Verarbeitungsmodelle und Sprachen (1) Operatoren auf Data Streams
    Windowed Joins, Implizites und explizites Timestamping, Semantik von Block-Operationen, Kombination mit statischen Relationen/Dokumenten
    Yi Ou Mathis Freitag 24.06.2005 13:30, 36/336 Ausarbeitung (PDF) Folien (PPT)
    8 Anfrageverarbeitung und Optimierung (1) Plangenerierung, Optimierung und Anfrageverarbeitung
    Generierung und Optimierung von logischen und physischen Anfrageplänen, Grundlegende Konzepte zur Anfrageverarbeitung, direkte Kopplung von Operatoren, Entkopplung
    Sebastian Bächle Härder Ausarbeitung (PDF) Folien (PDF)
    9 Multi-Query-Optimierung
    Gemeinsame Nutzung von Teiloperationen und Datenstrukturen zwischen Anfragen, Pufferung von Ergebnissen, Globale QoS-Optimierung
    Julia Thiele Härder Ausarbeitung (PDF) Folien (PDF)
    6 Verarbeitungsmodelle und Sprachen (2) Anfragesprachen
    Imperative vs. deklarative Anfragesprachen, Sprachen für Tupel- und XML-Ströme
    Aurora(SQuAL), Hancock, CQL, StreaQuel, GSQL, ESL, ...
    Markus Wörz Göres Freitag 08.07.2005 13:30, 36/336 Ausarbeitung (PDF) Folien (PDF)
    7 Quality of Service
    QoS-Kriterien, Spezifikation der Dienstgüteanforderungen durch Anwendungen und Benutzer, Sprachmittel, Fenstersemantik als QoS-Kriterium, QoS-Garantien
    Christian Stamber Deßloch Ausarbeitung (PDF) Folien (PPT)
    10 Anfrageverarbeitung und Optimierung (2) Scheduling und Speicherverwaltung
    Strategien zur Verteilung von Rechenzeit und Speicher auf Operatoren und Anfragen, Operator-basierte, Graph-basierte und Hybridverfahren
    Jörg von Blon Göres Ausarbeitung (PDF) Folien (PPT)
    11 Approximation Synopsen und Approximation
    Zusammenfassungstechniken (Sketches, Histogramme, Wavelets, Reservoirs...) und ihr Einsatz als Approximationstechniken
    entfällt entfällt entfällt    
    12 Adaptierung transparente Adaptierung
    Anpassung an schwankende Datenraten und Anfragelasten ohne Reduzierung der Ergebnisgüte, Intra-Operator-Umordnung, Batch-Processing, Austausch von Planoperatoren, dynamische Anfrageoptimierung, Eddies, Inter-Operator-Umordnung, Lineage
    entfällt entfällt    
    13 verlustbehaftete Adaptierung
    Anpassung an schwankende Datenraten und Anfragelasten unter Verlust von Ergebnisgüte, Graceful Degradation, Load Shedding, Nutzung von Approximationstechniken, Berücksichtigung von QoS-Anforderungen, Globale QoS-Optimierung
    entfällt entfällt    
    14 XML-Ströme Verarbeitung von XML-Strömen
    Besonderheiten bei der Verarbeitung von XML-Strömen, XPath und andere Anfragesprachen auf Strömen, Systeme (SPEX, xmltk, ...)
    Katharina Bellon Mathis Freitag 22.07.2005 13:30, 36/336 Ausarbeitung (PDF) Folien (PDF)
    Folien (PPT)
    15 Data Mining Data Mining auf Streams
    Zielsetzung beim Data Mining auf Datenströmen, Statistiken, Alerting, Clustering, Decision Trees, Vorstellung von Verfahren
    Andreas Weiner Stumm Ausarbeitung (PDF) Folien (PDF)
    16 Existierende Ansätze Gegenüberstellung existierender Systeme und Architekturen
    generische vs. spezialisierte Systeme vs. Frameworks
    STREAM, Aurora, TelegraphCACQ, PIPES, SPEX, MAIDS, StreamMill etc.
    Marius Renn Göres Ausarbeitung (PDF) Folien (PDF)

    Literatur

    Einstiegsliteratur

    Themenbezogene Literatur wird vom jeweiligen Betreuer bekannt gegeben.

     


    JG, 21.06.05