|
|
Proseminar des Lehrgebiets Datenverwaltungssysteme im Wintersemester 2005/2006
Thema: Information Retrieval
Allgemeines
im Rahmen des Proseminars bearbeitet jeder Student eines der angebotenen Themen (siehe Themen-Tabelle unten) anhand der angegebenen Literatur.
Die Ergebnisse der Arbeit werden in einer Ausarbeitung zusammengefasst und im Rahmen eines Vortrags präsentiert.
Ansprechpartner: Philipp Dopichaj
Aktuelles
- Scheine — Die Proseminarscheine können ab sofort im
Sekretariat der AG DBIS (36/332) abgeholt werden.
- Vortragstermine — Die Vorträge finden
an drei Blockterminen am 1., 8. und 15. Februar 2006
(jeweils Mittwoch) ab 15.30 Uhr im Seminarraum des Lehrgebiets (36/336) statt.
- Abgabetermin — Der Abgabetermin für die Ausarbeitungen
ist der 18. Januar 2006.
- Das Proseminar ist abgeschlossen, und die AGen DBIS und HIS bedanken sich bei allen Teilnehmern.
Organisatorisches
- Vortragsdauer ca. 25 Minuten;
- Ausarbeitung von ca. 10 Seiten Umfang;
- Ausarbeitung liegt mindestens 2 Wochen vor dem ersten Vortragstermin dem Betreuer/der Betreuerin als PDF- oder PostScript-Datei vor.
- Die Vorträge werden zu mehreren Blockterminen gehalten.
Literatur
0 |
Lehner, W.: Richtlinien
zur Vorbereitung von Seminarvorträgen |
A |
Henrich, A.: Information Retrieval, Foliensammlung, 1999 |
B |
Ferber, R.: Information Retrieval – Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003 (Signatur: WIR 089/100) |
C |
Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval, Addison-Wesley, 1999 |
D |
Salton, G., McGill, M.J., Information Retrieval – Grundlegendes für Informationswissenschaftler, McGraw-Hill, 1987
(Signatur: INF 535/042) |
Themen
Die zu jedem Thema angegebenen Stichpunkte dienen nur dazu, den Inhalt
des Themas zu verdeutlichen; sie sind nicht als
Gliederungspunkte zu sehen.
Thema |
Literatur |
Vortragende(r) |
Betreuer |
Termin |
1 |
Information Retrieval – Einführung Motivation, Begriffsdefinitionen, grundsätzliche Vorgehensweise |
A: 7–27, 39 B: 1–31 C: 1–10 D: 1–25 |
Dennis Pospich |
Härder |
1. 2. 2006 |
2 |
Retrieval-Evaluierung Effizienz vs. Effektivität, Precision und Recall, Experimente und Testkollektionen |
A: 41–73, 94–136 B: 83–100 C: 73–97 D: 167–198 |
Bernd Amann |
Deßloch |
3 |
Aufbereitung von Text-Dokumenten zur Verbesserung der IR-Qualität Berücksichtigung der Vagheit in Sprache, Stoppworteliminierung, Stamm- und/oder Grundformreduktion (Porters Algorithmus), Mehrwortgruppenidentifikation |
A: 137–202 B: 39–47 C: 163–170, 433–436 D: 57–81 |
Volker Hudlet |
Bühmann |
4 |
Terminologische Kontrolle und Klassifikation Aufbau und Einsatz eines Thesaurus, Cluster-Bildung bei Dokumenten, Nutzung von Klassifikationen, Dezimalklassifikation, Hierarchische Klassifikationen, Semantische Netze |
A: 203–232 B: 47–61 C: 123–139,
170–173 D: 81–93, 228–251 |
Jan-Felix Weber |
Bühmann |
8. 2. 2006 |
5 |
Pattern Matching in Texten Exaktes String-Matching, Approximatives String-Matching |
A: 233–247, 312–340 C: 104–106, 209–222 |
Qian Fu |
Stumm |
6 |
Einfache IR-Modelle Grundlegendes IR-Modell, Wortsuche, Invertierte Dateien, weitere Text-Indexe |
A: 341–383 C: 19–25, 191–207 |
Daniel Schall |
Dopichaj |
7 |
Boolesches Retrieval und weitere IR-Modelle Retrieval-Modell, Invertierte Listen, Coordination-Level-Match, Fuzzy-Set-Modell, Logikbasierte Modelle |
A: 384–428 B: 33–38, 195–206 C: 19–27, 99–104, 207–208 |
Markus Messner-Chaney |
Mathis |
15. 2. 2006 |
8 |
Das Vektorraummodell Basismodell, Implementierung, Relevanz-Feedback, Varianten |
A: 28–33, 429–456, 491–505 B: 61–83, 181–184 C: 19–30, 117–123 |
entfällt |
|
9 |
Benutzerschnittstellen und Visualisierung Mensch-Computer-Interaktion, Interaktionsmodelle, Einstiegsmöglichkeiten, Anfragespezifikation, Kontexte, Nutzung von Relevanzbeurteilungen |
C: 257–323 |
Julian Kallenborn |
Dopichaj |
10 |
Suchmaschinen im Internet Architektur von Suchmaschinen, Benutzungsschnittstellen, Ranking und Zugriffsstrukturen, Meta-Suchmaschinen |
A: 580–610 B: 285–308 C: 367–395 |
Matthias Wolf |
Mathis |
12 |
Multi-Media-IR
|
C: 325–366 |
entfällt |
|
|
13 |
Digitale Bibliotheken
|
B: 316–321 C: 415–432 |
entfällt |
|
|
Stand: 23. 02. 2006
|