|
|
Thema: Data Streams
Voraussetzung: Vorlesung Datenbankanwendung
Ansprechpartner: Jürgen
Göres
Datum |
Ankündigung |
2. Februar 2005 |
Verschiebung eines Vortrags
Der zweite Vortrag "Operatoren auf Data Streams" wird auf
den zweiten Vortragstermin am 11. Februar verschoben.
|
19. Januar 2005 |
Informatikkolloquium Data Streams (2)
Der zweite eingeladene Vortrag von Prof. Dr. R. Manthey
(Universität Bonn) findet am Montag, den 24. Januar um 17:15
in 46/280 statt. Das Thema lautet "Datenbankgestützte Analyse
großer Datenströme mit regelbasierten Methoden". Die
Teilnahme ist für die Seminaristen verpflichtend.
|
10. Dezember 2004 |
Informatikkolloquium Data Streams
Der erste eingeladene Vortrag von Prof. Dr. B. Seeger (Uni
Marburg) findet am Montag, den 13. Dezember um 17:15 in
46/280 statt. Das Thema lautet "PIPES: Eine Infrastruktur für
die Anfrageverarbeitung auf Datenströmen".
|
29. Oktober 2004 |
Vortragstermine
Die Seminarvorträge finden voraussichtlich an zwei
Blockterminen am 4. und 11. Februar 2005 ab 13:30 Uhr im
Seminarraum des Lehrgebiets statt.
|
29. Oktober 2004 |
Informatikkolloquium Data Streams
Im Laufe des Semesters finden im Rahmen des
Informatik-Kolloquiums zwei Vorträge zum Thema Data Streams
statt. Der Besuch dieser Vorträge ist verpflichtend für die
Seminarteilnehmer. Die genauen Termine stehen noch nicht
fest, werden aber rechtzeitig bekannt gegeben.
|
20. Oktober 2004 |
Vorbesprechung
Die Vorbesprechung für das Seminar zum Thema Data Streams
findet am Freitag, dem 29. Oktober um 14:00 im Seminarraum
des Lehrgebietes (36/336) statt. Da unter anderem die Themen
vergeben werden, ist Anwesenheit aller Teilnehmer
erforderlich.
|
27. Juli 2004 |
Anmeldung
Die Anmeldung für das Seminar ist ab dem 27. Juli durch
Eintrag in eine Liste im Flur des Lehrgebietes
Datenverwaltungssysteme (36/3) möglich.
|
12. Juli 2004 |
Organisatorische Änderungen
Organisation und Ablauf haben sich im Vergleich zu den
vorangegangenen Seminaren geändert. Daher sollten
insbesondere frühere Teilnehmer die geänderten allgemeinen Hinweise für
Bearbeiter beachten.
|
Die Arbeitsgruppen Datenbanken und Informationssysteme und
Heterogene Informationssysteme bieten im Wintersemester
2004/05 ein Seminar zum Thema Data Streams an. Das
Themenspektrum umfasst sowohl die Anwendungsseite als auch
technologische Aspekte. Dieses Seminar ist als Bestandteil des
Anwendungsblocks des Lehrgebiets Datenverwaltungssysteme
im Hauptstudium Informatik ausgewiesen. Daneben bietet sich
aufgrund der inhaltlichen Bezüge eine direkte Integration dieses
Seminars mit dem ebenfalls in diesem Semester angebotenen Praktikum DB-Aspekte des
E-Commerce im Rahmen des Hauptstudiums der Angewandten
Informatik an. Alternativ kann das Seminar auch mit dem ORDB-Praktikum vom
Sommersemester 2004 integriert werden.
- Das Seminar ist auf maximal 12 Teilnehmer beschränkt.
Zusätzlich Anmeldungen werden in eine Warteliste aufgenommen.
Interessenten, die keinen sicheren Platz erhalten haben, können
für den Fall des Abspringens anderer Teilnehmer an der
Vorbesprechung teilnehmen, sollten sich aber um Alternativen
bemühen.
- Aktuelle Anmeldungen: 3
- Detaillierte Informationen zur Organisation und Durchführung
finden sich in den allgemeinen Hinweisen für
Bearbeiter.
Data Streams
Klassische Datenbanksysteme eignen sich insbesondere für
Anfragen auf einem weitgehend stabilen Datenbestand mit moderater
Änderungshäufigkeit. Ständige Änderungen des Datenbestandes sind
dagegen wegen des damit verbundenen Reorganisationsaufwandes keine
besondere Stärke dieser Systeme. Während dies für viele Anwendungen
aus dem Bereich betrieblicher Informationssysteme keine
Einschränkung darstellt, hat das Entstehen neuer Anwendungen mit
geändertem Nutzungsprofil ein neues Datenverarbeitungs- und
Anfrageparadigma erforderlich gemacht. Gebäude- oder
Netzwerküberwachung, Börsenapplikationen oder die Analyse von
Clickstreams, also dem Nutzerverhalten auf Webseiten, produzieren
permanente Ströme von Daten, die häufig direkt nach ihrem Entstehen
ausgewertet werden müssen, um für die Anwendung von Nutzen zu sein.
Das Speichern dieser Daten in konventionellen Datenbanken ist wegen
der Unmittelbarkeit der Auswertung und auch aufgrund der enormen
Menge an Daten häufig weder erforderlich noch mit vertretbarem
technischen Aufwand zu realisieren. Zahlreiche Forschergruppen
weltweit haben sich mit der Entwicklung von auf die Verarbeitung
derartiger Datenströme optimierten Datenverwaltungssystemen
beschäftigt. Zusätzlich zu neuen Konzepten sind so auch erste
prototypische Data Stream Management Systems (DSMS)
entstanden. Im Seminar Data Streams sollen zunächst die
Grundkonzepte und Architekturen datenstromorientierter
Datenverwaltungssysteme vorgestellt und in den Kontext bestehender
Technologien eingeordnet werden. Anschließend werden die
Besonderheiten der Anfrageverarbeitung wie persistente Queries,
Anfragen auf Zeitfenstern oder Plan Sharing präsentiert. Ergänzt
werden diese Grundlagen durch eine Vorstellung von bereits
existierenden Systemen und der Schilderung von
Anwendungsszenarien.
(Änderungen vorbehalten)
Thema |
Vortragende(r) |
Betreuer |
Termin |
Ausarbeitung |
Folien |
1 |
Grundlagen |
Vorstellung des Streamkonzepts
Unterschiede zu klassischen Datenverwaltungssystemen, XML- vs.
relationale Ströme, reduzierte Präzision |
Thomas Jörg |
Andreas
Bühmann |
Freitag, 04.02.2005
13:30
36/336 |
Ausarbeitung |
Folien |
3 |
Operatoren und Sprachen |
Operatoren auf Data Streams
Windowed Joins, Implizites und explizites Timestamping,
Semantik von Block-Operationen, Kombination mit statischen
Relationen/Dokumenten |
Marc
Fleming |
Boris
Stumm |
Freitag, 11.02.2005
13:30
36/336 |
Ausarbeitung |
|
4 |
Anfragesprachen
prozedurale Sprachen: Aurora, Hancock
deklarative Sprachen: CQL, StreaQuel, GSQL
QoS-Spezifikation |
Sebastian
Glöckner |
Christian
Mathis |
Ausarbeitung |
Folien |
2 |
Grundlagen |
Architekturen, Systeme und Anwendungen
Sensornetze, Netzwerkmonitoring, Finanzapplikationen etc.,
"Killer-Applikationen", generische DSMS oder
Speziallösungen? |
entfällt
|
entfällt
|
entfällt |
|
|
5 |
Anfragebearbeitung |
Sampling und Approximation
Zusammenfassungstechniken (Sketches, Histogramme, Wavelets,
Reservoirs...), Approximation als Mittel zur Behebung von
Überlast, Batch-Processing |
entfällt |
entfällt |
|
|
6 |
Adaptierung und Optimierung
Anpassung an schwankende Datenraten, Intra-Operator-Umordnung,
dynamische Anfrageoptimierung, dynamische Verteilung von
Ressourcen (Speicher, Rechenzeit) auf Operatoren (unter
Berücksichtigung von gewünschter und Verlust von möglicher
Präzision), Graceful Degradation, Load Shedding,
Multi-Query-Optimierung, Eddies |
entfällt |
entfällt |
|
|
Literatur
Wird vom jeweiligen Betreuer bekannt gegeben.
JG, 02.11.04
|