|
|
Integriertes Seminar Datenbanken und
Informationssysteme im Sommersemester 2005
Thema: Data Streams
Voraussetzung: Vorlesung Datenbankanwendung
Ansprechpartner: Jürgen Göres
Datum |
Ankündigung |
28. Februar 2005 |
Betreuer
Die Zuordnung der Betreuer zu den Themen steht fest und kann der Themenliste entnommen werden. Die Seminaristen sollten baldmöglichst mit ihren Betreuern in Kontakt treten.
|
4. Februar 2005 |
Einstiegsliteratur
Als Grundlage für alle Themen finden sich in der Literaturliste zwei Papiere zu den Grundlagen von Data Streams. Sie vermitteln auch einen allgemeinen Überblick über die Themen und erleichtern so möglicherweise die Themenwahl.
|
4. Februar 2005 |
Erweiterung der Teilnehmerzahl und vorgezogene Vorbesprechung
Aufgrund des großen Interesses wurde die Zahl der Plätze auf 16 erhöht. Um trotz
der daraus resultierenden größeren Zahl von Vortragsterminen den Teilnehmern genügend Zeit für die Bearbeitung
des Themas zu bieten, erfolgt eine vorgezogene Vorbesprechung noch in diesem Semester, und zwar am Donnerstag, den 24. Februar, 14 Uhr im Seminarraum des Lehrgebiets (36/336).
Bei dieser Gelegenheit können die Teilnehmer bereits Themen zur Bearbeitung auswählen. Wer an dieser Vorbesprechung nicht teilnehmen kann, kann zu Beginn des Sommersemesters aus den verbliebenen Themen auswählen.
|
18. Januar 2005 |
Anmeldung
Die Anmeldung für das Seminar ist ab dem 21. Januar durch Eintrag in eine Liste im Flur des
Lehrgebietes Datenverwaltungssysteme (36/3) möglich.
|
18. Januar 2005 |
Organisatorische Änderungen
Organisation und Ablauf haben sich im Vergleich zu den vorangegangenen Seminaren geändert.
Daher sollten insbesondere frühere Teilnehmer die geänderten allgemeinen
Hinweise für Bearbeiter beachten.
|
Die Arbeitsgruppen Datenbanken und
Informationssysteme und Heterogene Informationssysteme
bieten im Sommersemester 2005 ein Seminar zum Thema Data Streams
an. Das Themenspektrum umfasst sowohl die Anwendungsseite als auch technologische Aspekte.
Dieses Seminar ist als Bestandteil des Anwendungsblocks des Lehrgebiets Datenverwaltungssysteme
im Hauptstudium Informatik ausgewiesen. Daneben bietet sich
aufgrund der inhaltlichen Bezüge eine direkte Integration dieses
Seminars mit dem ebenfalls in diesem Semester angebotenen ORDB-Praktikum im Rahmen des Hauptstudiums der Angewandten
Informatik an.
Data Streams
Klassische Datenbanksysteme eignen sich insbesondere für Anfragen
auf einem weitgehend stabilen Datenbestand mit moderater Änderungshäufigkeit.
Ständige Änderungen des Datenbestandes sind dagegen wegen des damit verbundenen
Reorganisationsaufwandes keine besondere Stärke dieser Systeme. Während dies
für viele Anwendungen aus dem Bereich betrieblicher Informationssysteme keine
Einschränkung darstellt, hat das Entstehen neuer Anwendungen mit geändertem
Nutzungsprofil ein neues Datenverarbeitungs- und Anfrageparadigma erforderlich gemacht.
Gebäude- oder Netzwerküberwachung, Börsenapplikationen oder die Analyse von Clickstreams,
also dem Nutzerverhalten auf Webseiten, produzieren permanente Ströme von Daten,
die häufig direkt nach ihrem Entstehen ausgewertet werden müssen, um für die Anwendung
von Nutzen zu sein. Das Speichern dieser Daten in konventionellen Datenbanken ist wegen
der Unmittelbarkeit der Auswertung und auch aufgrund der enormen Menge an Daten häufig
weder erforderlich noch mit vertretbarem technischen Aufwand zu realisieren. Zahlreiche
Forschergruppen weltweit haben sich mit der Entwicklung von auf die Verarbeitung derartiger
Datenströme optimierten Datenverwaltungssystemen beschäftigt. Zusätzlich zu neuen Konzepten
sind so auch erste prototypische Data Stream Management Systems (DSMS) entstanden.
Im Seminar Data Streams sollen zunächst die Grundkonzepte und Architekturen
datenstromorientierter Datenverwaltungssysteme vorgestellt und in den Kontext bestehender
Technologien eingeordnet werden. Anschließend werden die Besonderheiten der
Anfrageverarbeitung wie persistente Queries, Anfragen auf Zeitfenstern oder Plan Sharing
präsentiert. Ergänzt werden diese Grundlagen durch eine Vorstellung von bereits
existierenden Systemen und der Schilderung von Anwendungsszenarien.
(Änderungen vorbehalten)
Thema |
Vortragende(r) |
Betreuer |
Termin |
Ausarbeitung |
Folien |
1 |
Grundlagen und Abgrenzung |
Vorstellung des Streamkonzepts
Unterschiede zu klassischen Datenverwaltungssystemen, XML- vs. relationale Ströme, reduzierte Präzision
|
Benjamin Mock |
Stumm |
Freitag 17.06.2005 13:30, 36/336 |
Ausarbeitung (PDF) |
Folien (PDF) Folien (PPT) |
2 |
Anwendungen
Sensornetze, Netzwerkmonitoring, Finanzapplikationen etc., "Killer-Applikationen",
generischen DSMS oder Speziallösungen?
|
entfällt |
entfällt |
|
|
3 |
Vergleich mit Publish/Subscribe-Systemen Abgrenzung von Pub/Sub-Systemen, Scribe, Gryphon,... |
entfällt |
entfällt |
|
|
4 |
Streamverarbeitung mit konventionellen DBMS Trigger, (hierarchische) Views etc., Grenzen dieser Systeme |
Christian Rensch |
Haustein |
Ausarbeitung (PDF) |
Folien (PDF) Folien (PPT) |
5 |
Verarbeitungsmodelle und Sprachen (1) |
Operatoren auf Data Streams
Windowed Joins, Implizites und explizites Timestamping, Semantik von Block-Operationen, Kombination mit statischen Relationen/Dokumenten
|
Yi Ou |
Mathis |
Freitag 24.06.2005 13:30, 36/336 |
Ausarbeitung (PDF) |
Folien (PPT) |
8 |
Anfrageverarbeitung und Optimierung (1) |
Plangenerierung, Optimierung und Anfrageverarbeitung
Generierung und Optimierung von logischen und physischen Anfrageplänen, Grundlegende Konzepte zur Anfrageverarbeitung, direkte Kopplung von Operatoren, Entkopplung
|
Sebastian Bächle |
Härder |
Ausarbeitung (PDF) |
Folien (PDF) |
9 |
Multi-Query-Optimierung
Gemeinsame Nutzung von Teiloperationen und Datenstrukturen zwischen Anfragen, Pufferung von Ergebnissen, Globale QoS-Optimierung
|
Julia Thiele |
Härder |
Ausarbeitung (PDF) |
Folien (PDF) |
6 |
Verarbeitungsmodelle und Sprachen (2) |
Anfragesprachen Imperative vs. deklarative Anfragesprachen, Sprachen für Tupel- und XML-Ströme Aurora(SQuAL), Hancock, CQL, StreaQuel, GSQL, ESL, ...
|
Markus Wörz |
Göres |
Freitag 08.07.2005 13:30, 36/336 |
Ausarbeitung (PDF) |
Folien (PDF) |
7 |
Quality of Service QoS-Kriterien, Spezifikation der Dienstgüteanforderungen durch Anwendungen und Benutzer, Sprachmittel, Fenstersemantik als QoS-Kriterium, QoS-Garantien |
Christian Stamber |
Deßloch |
Ausarbeitung (PDF) |
Folien (PPT) |
10 |
Anfrageverarbeitung und Optimierung (2) |
Scheduling und Speicherverwaltung
Strategien zur Verteilung von Rechenzeit und Speicher auf Operatoren und Anfragen, Operator-basierte, Graph-basierte und Hybridverfahren
|
Jörg von Blon |
Göres |
Ausarbeitung (PDF) |
Folien (PPT) |
11 |
Approximation |
Synopsen und Approximation
Zusammenfassungstechniken (Sketches, Histogramme, Wavelets, Reservoirs...) und ihr Einsatz als Approximationstechniken
|
entfällt |
entfällt |
entfällt |
|
|
12 |
Adaptierung |
transparente Adaptierung
Anpassung an schwankende Datenraten und Anfragelasten ohne Reduzierung der Ergebnisgüte, Intra-Operator-Umordnung, Batch-Processing, Austausch von Planoperatoren, dynamische Anfrageoptimierung, Eddies, Inter-Operator-Umordnung, Lineage
|
entfällt |
entfällt |
|
|
13 |
verlustbehaftete Adaptierung
Anpassung an schwankende Datenraten und Anfragelasten unter Verlust von Ergebnisgüte, Graceful Degradation, Load Shedding, Nutzung von Approximationstechniken, Berücksichtigung von QoS-Anforderungen, Globale QoS-Optimierung
|
entfällt |
entfällt |
|
|
14 |
XML-Ströme |
Verarbeitung von XML-Strömen
Besonderheiten bei der Verarbeitung von XML-Strömen, XPath und andere Anfragesprachen auf Strömen, Systeme (SPEX, xmltk, ...)
|
Katharina Bellon |
Mathis |
Freitag 22.07.2005 13:30, 36/336 |
Ausarbeitung (PDF) |
Folien (PDF) Folien (PPT) |
15 |
Data Mining |
Data Mining auf Streams Zielsetzung beim Data Mining auf Datenströmen, Statistiken, Alerting, Clustering, Decision Trees, Vorstellung von Verfahren
|
Andreas Weiner |
Stumm |
Ausarbeitung (PDF) |
Folien (PDF) |
16 |
Existierende Ansätze |
Gegenüberstellung existierender Systeme und Architekturen generische vs. spezialisierte Systeme vs. Frameworks STREAM, Aurora, TelegraphCACQ, PIPES, SPEX, MAIDS, StreamMill etc. |
Marius Renn |
Göres |
Ausarbeitung (PDF) |
Folien (PDF) |
Einstiegsliteratur
Themenbezogene Literatur wird vom jeweiligen Betreuer bekannt gegeben.
JG, 21.06.05
|