UniKL Logo

Lehrgebiet Informationssysteme

FB Informatik

FB Informatik
 
LG IS
AG DBIS
AG HIS
Jobs / Tasks
Courses
Seminar
WS 2004/05
Aktuelles
Allgemeines
Organisation
Themen
  • SS 2007
  • Aktuelles Seminar:
  • WS 06/07
  • Archiv:
  • WS 06/07
  • SS 2006
  • WS 05/06
  • SS 2005
  • WS 04/05
  • SS 2004
  • WS 03/04
  • SS 2003
  • WS 02/03
  • SS 2002
  • more...
    Publications
    Contact
    Misc
    Impressum
    (C) AG DBIS
     

    Integriertes Seminar Datenbanken und Informationssysteme im Wintersemester 2004/05

    Thema: Data Streams

    Voraussetzung: Vorlesung Datenbankanwendung

    Ansprechpartner: Jürgen Göres

    Aktuelles

    Datum Ankündigung
    2. Februar 2005 Verschiebung eines Vortrags

    Der zweite Vortrag "Operatoren auf Data Streams" wird auf den zweiten Vortragstermin am 11. Februar verschoben.
    jg
    19. Januar 2005 Informatikkolloquium Data Streams (2)

    Der zweite eingeladene Vortrag von Prof. Dr. R. Manthey (Universität Bonn) findet am Montag, den 24. Januar um 17:15 in 46/280 statt. Das Thema lautet "Datenbankgestützte Analyse großer Datenströme mit regelbasierten Methoden". Die Teilnahme ist für die Seminaristen verpflichtend.
    jg
    10. Dezember 2004 Informatikkolloquium Data Streams

    Der erste eingeladene Vortrag von Prof. Dr. B. Seeger (Uni Marburg) findet am Montag, den 13. Dezember um 17:15 in 46/280 statt. Das Thema lautet "PIPES: Eine Infrastruktur für die Anfrageverarbeitung auf Datenströmen".
    jg
    29. Oktober 2004 Vortragstermine

    Die Seminarvorträge finden voraussichtlich an zwei Blockterminen am 4. und 11. Februar 2005 ab 13:30 Uhr im Seminarraum des Lehrgebiets statt.
    jg
    29. Oktober 2004 Informatikkolloquium Data Streams

    Im Laufe des Semesters finden im Rahmen des Informatik-Kolloquiums zwei Vorträge zum Thema Data Streams statt. Der Besuch dieser Vorträge ist verpflichtend für die Seminarteilnehmer. Die genauen Termine stehen noch nicht fest, werden aber rechtzeitig bekannt gegeben.
    jg
    20. Oktober 2004 Vorbesprechung

    Die Vorbesprechung für das Seminar zum Thema Data Streams findet am Freitag, dem 29. Oktober um 14:00 im Seminarraum des Lehrgebietes (36/336) statt. Da unter anderem die Themen vergeben werden, ist Anwesenheit aller Teilnehmer erforderlich.
    jg
    27. Juli 2004 Anmeldung

    Die Anmeldung für das Seminar ist ab dem 27. Juli durch Eintrag in eine Liste im Flur des Lehrgebietes Datenverwaltungssysteme (36/3) möglich.
    jg
    12. Juli 2004 Organisatorische Änderungen

    Organisation und Ablauf haben sich im Vergleich zu den vorangegangenen Seminaren geändert. Daher sollten insbesondere frühere Teilnehmer die geänderten allgemeinen Hinweise für Bearbeiter beachten.
    jg

    Allgemeines

    Die Arbeitsgruppen Datenbanken und Informationssysteme und Heterogene Informationssysteme bieten im Wintersemester 2004/05 ein Seminar zum Thema Data Streams an. Das Themenspektrum umfasst sowohl die Anwendungsseite als auch technologische Aspekte. Dieses Seminar ist als Bestandteil des Anwendungsblocks des Lehrgebiets Datenverwaltungssysteme im Hauptstudium Informatik ausgewiesen. Daneben bietet sich aufgrund der inhaltlichen Bezüge eine direkte Integration dieses Seminars mit dem ebenfalls in diesem Semester angebotenen Praktikum DB-Aspekte des E-Commerce im Rahmen des Hauptstudiums der Angewandten Informatik an. Alternativ kann das Seminar auch mit dem ORDB-Praktikum vom Sommersemester 2004 integriert werden.

    Organisation

    • Das Seminar ist auf maximal 12 Teilnehmer beschränkt. Zusätzlich Anmeldungen werden in eine Warteliste aufgenommen. Interessenten, die keinen sicheren Platz erhalten haben, können für den Fall des Abspringens anderer Teilnehmer an der Vorbesprechung teilnehmen, sollten sich aber um Alternativen bemühen.
    • Aktuelle Anmeldungen: 3
    • Detaillierte Informationen zur Organisation und Durchführung finden sich in den allgemeinen Hinweisen für Bearbeiter.

    Themenbeschreibung

    Data Streams

    Klassische Datenbanksysteme eignen sich insbesondere für Anfragen auf einem weitgehend stabilen Datenbestand mit moderater Änderungshäufigkeit. Ständige Änderungen des Datenbestandes sind dagegen wegen des damit verbundenen Reorganisationsaufwandes keine besondere Stärke dieser Systeme. Während dies für viele Anwendungen aus dem Bereich betrieblicher Informationssysteme keine Einschränkung darstellt, hat das Entstehen neuer Anwendungen mit geändertem Nutzungsprofil ein neues Datenverarbeitungs- und Anfrageparadigma erforderlich gemacht. Gebäude- oder Netzwerküberwachung, Börsenapplikationen oder die Analyse von Clickstreams, also dem Nutzerverhalten auf Webseiten, produzieren permanente Ströme von Daten, die häufig direkt nach ihrem Entstehen ausgewertet werden müssen, um für die Anwendung von Nutzen zu sein. Das Speichern dieser Daten in konventionellen Datenbanken ist wegen der Unmittelbarkeit der Auswertung und auch aufgrund der enormen Menge an Daten häufig weder erforderlich noch mit vertretbarem technischen Aufwand zu realisieren. Zahlreiche Forschergruppen weltweit haben sich mit der Entwicklung von auf die Verarbeitung derartiger Datenströme optimierten Datenverwaltungssystemen beschäftigt. Zusätzlich zu neuen Konzepten sind so auch erste prototypische Data Stream Management Systems (DSMS) entstanden. Im Seminar Data Streams sollen zunächst die Grundkonzepte und Architekturen datenstromorientierter Datenverwaltungssysteme vorgestellt und in den Kontext bestehender Technologien eingeordnet werden. Anschließend werden die Besonderheiten der Anfrageverarbeitung wie persistente Queries, Anfragen auf Zeitfenstern oder Plan Sharing präsentiert. Ergänzt werden diese Grundlagen durch eine Vorstellung von bereits existierenden Systemen und der Schilderung von Anwendungsszenarien.

    Themenliste

    (Änderungen vorbehalten)

    Thema Vortragende(r) Betreuer Termin Ausarbeitung Folien
    1 Grundlagen Vorstellung des Streamkonzepts
    Unterschiede zu klassischen Datenverwaltungssystemen, XML- vs. relationale Ströme, reduzierte Präzision
    Thomas Jörg Andreas Bühmann Freitag, 04.02.2005
    13:30
    36/336
    Ausarbeitung Folien
    3 Operatoren und Sprachen Operatoren auf Data Streams
    Windowed Joins, Implizites und explizites Timestamping, Semantik von Block-Operationen, Kombination mit statischen Relationen/Dokumenten
    Marc Fleming Boris Stumm Freitag, 11.02.2005
    13:30
    36/336
    Ausarbeitung  
    4 Anfragesprachen
    prozedurale Sprachen: Aurora, Hancock
    deklarative Sprachen: CQL, StreaQuel, GSQL
    QoS-Spezifikation
    Sebastian Glöckner Christian Mathis Ausarbeitung Folien
    2 Grundlagen Architekturen, Systeme und Anwendungen
    Sensornetze, Netzwerkmonitoring, Finanzapplikationen etc., "Killer-Applikationen", generische DSMS oder Speziallösungen?
    entfällt entfällt entfällt    
    5 Anfragebearbeitung Sampling und Approximation
    Zusammenfassungstechniken (Sketches, Histogramme, Wavelets, Reservoirs...), Approximation als Mittel zur Behebung von Überlast, Batch-Processing
    entfällt entfällt    
    6 Adaptierung und Optimierung
    Anpassung an schwankende Datenraten, Intra-Operator-Umordnung, dynamische Anfrageoptimierung, dynamische Verteilung von Ressourcen (Speicher, Rechenzeit) auf Operatoren (unter Berücksichtigung von gewünschter und Verlust von möglicher Präzision), Graceful Degradation, Load Shedding, Multi-Query-Optimierung, Eddies
    entfällt entfällt    

    Literatur

    Wird vom jeweiligen Betreuer bekannt gegeben.

     


    JG, 02.11.04