UniKL Logo

Lehrgebiet Informationssysteme

FB Informatik

FB Informatik
 
LG IS
AG DBIS
AG HIS
Jobs / Tasks
Courses
Proseminar
WS 2001/02
Aktuelles
Material
Archiv:
  • WS 04/05
  • WS 03/04
  • WS 01/02
  • Publications
    Contact
    Misc
    Impressum
    (C) AG DBIS
     

    Proseminar der Arbeitsgruppe Datenbanken und Informationssysteme im Wintersemester 2001/2002

    Thema: Information Retrieval


    Allgemeines

    Im Rahmen des Proseminars bearbeitet jede(r) Studierende eines der angebotenen Themen (siehe Themen-Tabelle unten) anhand der angegebenen Literatur. Die Ergebnisse der Arbeit werden in einer Ausarbeitung zusammengefasst und im Rahmen eines Vortrags präsentiert.

    Aktuelles

    • Die Anmeldung kann bis zum Ende der ersten Woche der Vorlesungszeit des Wintersemesters 2001/2002 durch Eintragung in die Liste am schwarzen Brett der AB DBIS (Geb. 36, 1. Stock) erfolgen.
    • Am Mittwoch, den 7. November, findet um 15.00 Uhr in 36/336 eine Vorbesprechung statt. Inhalte werden Organisation/Ablauf, Themenzuordnung sowie Terminvereinbarung sein.

    Organisatorisches

    • Vortragsdauer ca. 30 Minuten;
    • Ausarbeitung von ca. 10 Seiten Umfang;
    • Ausarbeitung liegt mindestens 2 Wochen vor dem Vortrag dem/der BetreuerIn vor.
    • Die Vorträge werden zu mehreren Blockterminen gehalten.

    Literatur

    A Henrich, A.: Information Retrieval, Foliensammlung, 1999
    B Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval, Addison-Wesley, 1999
    C Salton, G., McGill, M.J., Information Retrieval - Grundlegendes für Informationswissenschaftler, McGraw-Hill, 1987

    Themen

    Thema Literatur Vortragende(r) Betreuer Termin
    1 Information Retrieval - Einführung
    Motivation, Begriffsdefintionen, grundsätzliche Vorgehensweise
    A: 7-27, 39
    B: 1-10
    C: 1-25
         
    2 Retrieval-Evaluierung
    Effizienz vs. Effektivität, Precision und Recall, Experimente und Testkollektionen
    A: 41-73, 94-136
    B: 73-97
    C: 167-198
         
    3 Aufbereitung von Text-Dokumenten zur Verbesserung der IR-Qualität
    Berücksichtigung der Vagheit in Sprache, Stoppworteliminierung, Stamm- und/oder Grundformreduktion (Porter's Algorithmus), Mehrwortgruppenidentifikation
    A: 137-202
    B: 163-170, 433-436
    C: 57-81
         
    4 Terminologische Kontrolle und Klassifikation
    Aufbau und Einsatz eines Thesaurus, Cluster-Bildung bei Dokumenten, Nutzung von Klassifikationen, Dezimalklassifikation, Hierarchische Klassifikationen
    A: 203-232
    B: 123-139, 170-190
    C: 81-93, 228-251
         
    5 Pattern Matching in Texten
    Exaktes String-Matching, Approximatives String-Matching
    A: 233-247, 312-340
    B: 104-106, 209-222
         
    6 Einfache IR-Modelle
    Grundlegendes IR-Modell, Wortsuche, Invertierte Dateien, weitere Text-Indexe
    A: 341-383
    B: 19-25, 191-207
         
    7 Boolesches Retrieval und weitere IR-Modelle
    Retrieval-Modell, Invertierte Listen, Coordination-Level-Match,Fuzzy-Set-Modell
    A: 384-428
    B: 19-27, 99-104, 207-208
         
    8 Das Vektorraummodell
    Basismodell, Implementierung, Relevanz-Feedback, Varianten
    A: 28-33, 429-456, 491-505
    B: 19-30, 117-123
         
    9 Benutzerschnittstellen und Visualisierung
    Mensch-Computer-Interaktion, Interaktionsmodelle, Einstiegsmöglichkeiten, Anfragespezifikation, Kontexte, Nutzung von Relevanzbeurteilungen
    B: 257-323      
    10 Suchmaschinen im Internet
    Architektur von Suchmaschinen, Benutzungsschnittstellen, Ranking und Zugriffsstrukturen, Meta-Suchmaschinen
    A: 580-610
    B: 367-395
         

    Mögliche, weitere Themen

    Thema Literatur
    11 Probabilistisches IR und weitere IR-Modelle
    A: 506-549
    B: 30-71
    12 Multi-Media-IR
    B: 325-366
    13 Digitale Bibliotheken
    B: 415-432
    14 IR-Systeme
    B: 397-413