|
|
Proseminar der Arbeitsgruppe Datenbanken und Informationssysteme im Wintersemester 2004/2005
Thema: Information Retrieval
Allgemeines
Im Rahmen des Proseminars bearbeitet jeder Student eines der angebotenen Themen (siehe Themen-Tabelle unten) anhand der angegebenen Literatur.
Die Ergebnisse der Arbeit werden in einer Ausarbeitung zusammengefasst und im Rahmen eines Vortrags präsentiert.
Ansprechpartner: Philipp Dopichaj
Aktuelles
- Scheine — Die Proseminarscheine können ab sofort im
Sekretariat der AG DBIS abgeholt werden.
- Vortragstermine — Die Vorträge finden
an drei Blockterminen am 14., 21. und 28. Januar 2005
(jeweils Freitag) ab 15.30 Uhr statt.
- Abgabetermin — Der Abgabetermin für die Ausarbeitungen
ist der 5. Januar 2005.
Organisatorisches
- Vortragsdauer ca. 25 Minuten;
- Ausarbeitung von ca. 10 Seiten Umfang;
- Ausarbeitung liegt mindestens 2 Wochen vor dem ersten Vortragstermin dem Betreuer/der Betreuerin als PDF- oder PostScript-Datei vor.
- Die Vorträge werden zu mehreren Blockterminen gehalten.
Literatur
0 |
Lehner, W.: Richtlinien
zur Vorbereitung von Seminarvorträgen |
A |
Henrich, A.: Information Retrieval, Foliensammlung, 1999 |
B |
Ferber, R.: Information Retrieval – Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003 (Signatur: WIR 089/100) |
C |
Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval, Addison-Wesley, 1999 |
D |
Salton, G., McGill, M.J., Information Retrieval – Grundlegendes für Informationswissenschaftler, McGraw-Hill, 1987
(Signatur: INF 535/042) |
Themen
Die zu jedem Thema angegebenen Stichpunkte dienen nur dazu, den Inhalt
des Themas zu verdeutlichen; sie sind nicht als
Gliederungspunkte zu sehen.
Thema |
Literatur |
Vortragende(r) |
Betreuer |
Termin |
1 |
Information Retrieval – Einführung Motivation, Begriffsdefinitionen, grundsätzliche Vorgehensweise |
A: 7–27, 39 B: 1–31 C: 1–10 D: 1–25 |
Otmar Ginkel |
Andreas Bühmann |
Freitag, 14. 01. 2005, 15.30 Uhr, 36/336 |
2 |
Retrieval-Evaluierung Effizienz vs. Effektivität, Precision und Recall, Experimente und Testkollektionen |
A: 41–73, 94–136 B: 83–100 C: 73–97 D: 167–198 |
Christophe Faust |
Boris Stumm |
3 |
Aufbereitung von Text-Dokumenten zur Verbesserung der IR-Qualität Berücksichtigung der Vagheit in Sprache, Stoppworteliminierung, Stamm- und/oder Grundformreduktion (Porters Algorithmus), Mehrwortgruppenidentifikation |
A: 137–202 B: 39–47 C: 163–170, 433–436 D: 57–81 |
Siegfried Wirth |
Jürgen Göres |
4 |
Terminologische Kontrolle und Klassifikation Aufbau und Einsatz eines Thesaurus, Cluster-Bildung bei Dokumenten, Nutzung von Klassifikationen, Dezimalklassifikation, Hierarchische Klassifikationen, Semantische Netze |
A: 203–232 B: 47–61 C: 123–139,
170–173 D: 81–93, 228–251 |
Heinesch Daniel |
Michael Haustein |
5 |
Pattern Matching in Texten Exaktes String-Matching, Approximatives String-Matching |
A: 233–247, 312–340 C: 104–106, 209–222 |
Pascal Hahn |
Christian Mathis |
Freitag, 21. 01. 2005, 15.30 Uhr, 36/336 |
6 |
Einfache IR-Modelle Grundlegendes IR-Modell, Wortsuche, Invertierte Dateien, weitere Text-Indexe |
A: 341–383 C: 19–25, 191–207 |
Luc Beni |
Philipp Dopichaj |
7 |
Boolesches Retrieval und weitere IR-Modelle Retrieval-Modell, Invertierte Listen, Coordination-Level-Match, Fuzzy-Set-Modell, Logikbasierte Modelle |
A: 384–428 B: 33–38, 195–206 C: 19–27, 99–104, 207–208 |
Petry Claude |
8 |
Das Vektorraummodell Basismodell, Implementierung, Relevanz-Feedback, Varianten |
A: 28–33, 429–456, 491–505 B: 61–83, 181–184 C: 19–30, 117–123 |
Matthias Burkhart |
Freitag, 28. 01. 2005, 15.30 Uhr, 36/336 |
9 |
Benutzerschnittstellen und Visualisierung Mensch-Computer-Interaktion, Interaktionsmodelle, Einstiegsmöglichkeiten, Anfragespezifikation, Kontexte, Nutzung von Relevanzbeurteilungen |
C: 257–323 |
Christoph R. Hartel |
10 |
Suchmaschinen im Internet Architektur von Suchmaschinen, Benutzungsschnittstellen, Ranking und Zugriffsstrukturen, Meta-Suchmaschinen |
A: 580–610 B: 285–308 C: 367–395 |
Sebastian Gohr |
Mögliche weitere Themen
Thema |
Literatur |
11 |
Probabilistisches IR und weitere IR-Modelle
|
A: 506–549 B: 185–194 C: 30–71 |
12 |
Multi-Media-IR
|
C: 325–366 |
13 |
Digitale Bibliotheken
|
B: 316–321 C: 415–432 |
14 |
IR-Systeme
|
B: 207–222 C: 397–413 |
Stand: 02. 02. 2005
|