|
|
Proseminar der Arbeitsgruppe Datenbanken und Informationssysteme im Wintersemester 2003/2004
Thema: Information Retrieval
Allgemeines
Im Rahmen des Proseminars bearbeitet jede(r) Studierende eines der angebotenen Themen (siehe Themen-Tabelle unten) anhand der angegebenen Literatur.
Die Ergebnisse der Arbeit werden in einer Ausarbeitung zusammengefasst und im Rahmen eines Vortrags präsentiert.
Aktuelles
- Das Proseminar ist abgeschlossen, und die AGen DBIS und HIS bedanken sich bei allen Teilnehmern.
- Die Scheine können ab Montag, 16.02.04, im Sekretariat der AGen DBIS/HIS (36/332) abgeholt werden.
Organisatorisches
- Vortragsdauer ca. 30 Minuten;
- Ausarbeitung von ca. 10 Seiten Umfang;
- Ausarbeitung liegt mindestens 2 Wochen vor dem Vortrag dem/der BetreuerIn vor.
- Die Vorträge werden zu mehreren Blockterminen gehalten.
Literatur
0 |
Lehner, W.: Richtlinien
zur Vorbereitung von Seminarvorträgen |
A |
Henrich, A.: Information Retrieval, Foliensammlung, 1999 |
B |
Ferber, R.: Information Retrieval - Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003 |
C |
Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval, Addison-Wesley, 1999 |
D |
Salton, G., McGill, M.J., Information Retrieval - Grundlegendes für Informationswissenschaftler, McGraw-Hill, 1987 |
Themen
Thema |
Literatur |
Vortragende(r) |
Betreuer |
Termin |
1 |
Information Retrieval - Einführung Motivation, Begriffsdefintionen, grundsätzliche Vorgehensweise |
A: 7-27, 39 B: 1-31 C: 1-10 D: 1-25 |
Martin Edbauer |
Ulrich Marder |
Do., 05.02.04 10:00-11:30 36/336 |
2 |
Retrieval-Evaluierung Effizienz vs. Effektivität, Precision und Recall, Experimente und Testkollektionen |
A: 41-73, 94-136 B: 83-100 C: 73-97 D: 167-198 |
Simon Gesierich |
3 |
Aufbereitung von Text-Dokumenten zur Verbesserung der IR-Qualität Berücksichtigung der Vagheit in Sprache, Stoppworteliminierung, Stamm- und/oder Grundformreduktion (Porter's Algorithmus), Mehrwortgruppenidentifikation |
A: 137-202 B: 39-47 C: 163-170, 433-436 D: 57-81 |
Julia Thiele |
4 |
Terminologische Kontrolle und Klassifikation Aufbau und Einsatz eines Thesaurus, Cluster-Bildung bei Dokumenten, Nutzung von Klassifikationen, Dezimalklassifikation, Hierarchische Klassifikationen, Semantische Netze |
A: 203-232 B: 47-61 C: 123-139, 170-190 D: 81-93, 228-251 |
entfällt |
|
5 |
Pattern Matching in Texten Exaktes String-Matching, Approximatives String-Matching |
A: 233-247, 312-340 C: 104-106, 209-222 |
Mark Mildner |
Do., 12.02.04 10:00-11:00 36/336 |
6 |
Einfache IR-Modelle Grundlegendes IR-Modell, Wortsuche, Invertierte Dateien, weitere Text-Indexe |
A: 341-383 C: 19-25, 191-207 |
Tom Roos |
7 |
Boolesches Retrieval und weitere IR-Modelle Retrieval-Modell, Invertierte Listen, Coordination-Level-Match, Fuzzy-Set-Modell, Logikbasierte Modelle |
A: 384-428 B: 33-38, 195-206 C: 19-27, 99-104, 207-208 |
entfällt |
|
8 |
Das Vektorraummodell Basismodell, Implementierung, Relevanz-Feedback, Varianten |
A: 28-33, 429-456, 491-505 B: 61-83, 181-184 C: 19-30, 117-123 |
entfällt |
|
9 |
Benutzerschnittstellen und Visualisierung Mensch-Computer-Interaktion, Interaktionsmodelle, Einstiegsmöglichkeiten, Anfragespezifikation, Kontexte, Nutzung von Relevanzbeurteilungen |
C: 257-323 |
entfällt |
|
10 |
Suchmaschinen im Internet Architektur von Suchmaschinen, Benutzungsschnittstellen, Ranking und Zugriffsstrukturen, Meta-Suchmaschinen |
A: 580-610 B: 285-308 C: 367-395 |
entfällt |
|
Mögliche weitere Themen
Thema |
Literatur |
11 |
Probabilistisches IR und weitere IR-Modelle
|
A: 506-549 B: 185-194 C: 30-71 |
12 |
Multi-Media-IR
|
C: 325-366 |
13 |
Digitale Bibliotheken
|
B: 316-321 C: 415-432 |
14 |
IR-Systeme
|
B: 207-222 C: 397-413 |
Stand: 12.02.2004
|