|
|
Proseminar der Arbeitsgruppe Datenbanken und Informationssysteme im Wintersemester 2001/2002
Thema: Information Retrieval
Allgemeines
Im Rahmen des Proseminars bearbeitet jede(r) Studierende eines der angebotenen Themen (siehe Themen-Tabelle unten) anhand der angegebenen Literatur.
Die Ergebnisse der Arbeit werden in einer Ausarbeitung zusammengefasst und im Rahmen eines Vortrags präsentiert.
Aktuelles
- Die Anmeldung kann bis zum Ende der ersten Woche der Vorlesungszeit des Wintersemesters 2001/2002
durch Eintragung in die Liste am schwarzen Brett der AB DBIS (Geb. 36, 1. Stock)
erfolgen.
- Am Mittwoch, den 7. November, findet um 15.00 Uhr in 36/336 eine Vorbesprechung statt.
Inhalte werden Organisation/Ablauf, Themenzuordnung sowie Terminvereinbarung sein.
Organisatorisches
- Vortragsdauer ca. 30 Minuten;
- Ausarbeitung von ca. 10 Seiten Umfang;
- Ausarbeitung liegt mindestens 2 Wochen vor dem Vortrag dem/der BetreuerIn vor.
- Die Vorträge werden zu mehreren Blockterminen gehalten.
Literatur
A |
Henrich, A.: Information Retrieval, Foliensammlung, 1999 |
B |
Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval, Addison-Wesley, 1999 |
C |
Salton, G., McGill, M.J., Information Retrieval - Grundlegendes für Informationswissenschaftler, McGraw-Hill, 1987 |
Themen
Thema |
Literatur |
Vortragende(r) |
Betreuer |
Termin |
1 |
Information Retrieval - Einführung Motivation, Begriffsdefintionen, grundsätzliche Vorgehensweise |
A: 7-27, 39 B: 1-10 C: 1-25 |
|
|
|
2 |
Retrieval-Evaluierung Effizienz vs. Effektivität, Precision und Recall, Experimente und Testkollektionen |
A: 41-73, 94-136 B: 73-97 C: 167-198 |
|
|
|
3 |
Aufbereitung von Text-Dokumenten zur Verbesserung der IR-Qualität Berücksichtigung der Vagheit in Sprache, Stoppworteliminierung, Stamm- und/oder Grundformreduktion (Porter's Algorithmus), Mehrwortgruppenidentifikation |
A: 137-202 B: 163-170, 433-436 C: 57-81 |
|
|
|
4 |
Terminologische Kontrolle und Klassifikation Aufbau und Einsatz eines Thesaurus, Cluster-Bildung bei Dokumenten, Nutzung von Klassifikationen, Dezimalklassifikation, Hierarchische Klassifikationen |
A: 203-232 B: 123-139, 170-190 C: 81-93, 228-251 |
|
|
|
5 |
Pattern Matching in Texten Exaktes String-Matching, Approximatives String-Matching |
A: 233-247, 312-340 B: 104-106, 209-222 |
|
|
|
6 |
Einfache IR-Modelle Grundlegendes IR-Modell, Wortsuche, Invertierte Dateien, weitere Text-Indexe |
A: 341-383 B: 19-25, 191-207 |
|
|
|
7 |
Boolesches Retrieval und weitere IR-Modelle Retrieval-Modell, Invertierte Listen, Coordination-Level-Match,Fuzzy-Set-Modell |
A: 384-428 B: 19-27, 99-104, 207-208 |
|
|
|
8 |
Das Vektorraummodell Basismodell, Implementierung, Relevanz-Feedback, Varianten |
A: 28-33, 429-456, 491-505 B: 19-30, 117-123 |
|
|
|
9 |
Benutzerschnittstellen und Visualisierung Mensch-Computer-Interaktion, Interaktionsmodelle, Einstiegsmöglichkeiten, Anfragespezifikation, Kontexte, Nutzung von Relevanzbeurteilungen |
B: 257-323 |
|
|
|
10 |
Suchmaschinen im Internet Architektur von Suchmaschinen, Benutzungsschnittstellen, Ranking und Zugriffsstrukturen, Meta-Suchmaschinen |
A: 580-610 B: 367-395 |
|
|
|
Mögliche, weitere Themen
Thema |
Literatur |
11 |
Probabilistisches IR und weitere IR-Modelle
|
A: 506-549 B: 30-71 |
12 |
Multi-Media-IR
|
B: 325-366 |
13 |
Digitale Bibliotheken
|
B: 415-432 |
14 |
IR-Systeme
|
B: 397-413 |
|