UniKL Logo

Lehrgebiet Informationssysteme

FB Informatik

FB Informatik
 
LG IS
AG DBIS
AG HIS
Jobs / Tasks
Courses
Proseminar
WS 2003/04
Aktuelles
Material
Archiv:
  • WS 04/05
  • WS 03/04
  • WS 01/02
  • Publications
    Contact
    Misc
    Impressum
    (C) AG DBIS
     

    Proseminar der Arbeitsgruppe Datenbanken und Informationssysteme im Wintersemester 2003/2004

    Thema: Information Retrieval


    Allgemeines

    Im Rahmen des Proseminars bearbeitet jede(r) Studierende eines der angebotenen Themen (siehe Themen-Tabelle unten) anhand der angegebenen Literatur. Die Ergebnisse der Arbeit werden in einer Ausarbeitung zusammengefasst und im Rahmen eines Vortrags präsentiert.

    Aktuelles

    • Das Proseminar ist abgeschlossen, und die AGen DBIS und HIS bedanken sich bei allen Teilnehmern.
    • Die Scheine können ab Montag, 16.02.04, im Sekretariat der AGen DBIS/HIS (36/332) abgeholt werden.

    Organisatorisches

    • Vortragsdauer ca. 30 Minuten;
    • Ausarbeitung von ca. 10 Seiten Umfang;
    • Ausarbeitung liegt mindestens 2 Wochen vor dem Vortrag dem/der BetreuerIn vor.
    • Die Vorträge werden zu mehreren Blockterminen gehalten.

    Literatur

    0 Lehner, W.: Richtlinien zur Vorbereitung von Seminarvorträgen
    A Henrich, A.: Information Retrieval, Foliensammlung, 1999
    B Ferber, R.: Information Retrieval - Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003
    C Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval, Addison-Wesley, 1999
    D Salton, G., McGill, M.J., Information Retrieval - Grundlegendes für Informationswissenschaftler, McGraw-Hill, 1987

    Themen

    Thema Literatur Vortragende(r) Betreuer Termin
    1 Information Retrieval - Einführung
    Motivation, Begriffsdefintionen, grundsätzliche Vorgehensweise
    A: 7-27, 39
    B: 1-31
    C: 1-10
    D: 1-25
    Martin Edbauer
    Ulrich Marder
    Do., 05.02.04
    10:00-11:30
    36/336
    2 Retrieval-Evaluierung
    Effizienz vs. Effektivität, Precision und Recall, Experimente und Testkollektionen
    A: 41-73, 94-136
    B: 83-100
    C: 73-97
    D: 167-198
    Simon Gesierich
    3 Aufbereitung von Text-Dokumenten zur Verbesserung der IR-Qualität
    Berücksichtigung der Vagheit in Sprache, Stoppworteliminierung, Stamm- und/oder Grundformreduktion (Porter's Algorithmus), Mehrwortgruppenidentifikation
    A: 137-202
    B: 39-47
    C: 163-170, 433-436
    D: 57-81
    Julia Thiele
    4 Terminologische Kontrolle und Klassifikation
    Aufbau und Einsatz eines Thesaurus, Cluster-Bildung bei Dokumenten, Nutzung von Klassifikationen, Dezimalklassifikation, Hierarchische Klassifikationen, Semantische Netze
    A: 203-232
    B: 47-61
    C: 123-139, 170-190
    D: 81-93, 228-251
    entfällt  
    5 Pattern Matching in Texten
    Exaktes String-Matching, Approximatives String-Matching
    A: 233-247, 312-340
    C: 104-106, 209-222
    Mark Mildner Do., 12.02.04
    10:00-11:00
    36/336
    6 Einfache IR-Modelle
    Grundlegendes IR-Modell, Wortsuche, Invertierte Dateien, weitere Text-Indexe
    A: 341-383
    C: 19-25, 191-207
    Tom Roos
    7 Boolesches Retrieval und weitere IR-Modelle
    Retrieval-Modell, Invertierte Listen, Coordination-Level-Match, Fuzzy-Set-Modell, Logikbasierte Modelle
    A: 384-428
    B: 33-38, 195-206
    C: 19-27, 99-104, 207-208
    entfällt  
    8 Das Vektorraummodell
    Basismodell, Implementierung, Relevanz-Feedback, Varianten
    A: 28-33, 429-456, 491-505
    B: 61-83, 181-184
    C: 19-30, 117-123
    entfällt  
    9 Benutzerschnittstellen und Visualisierung
    Mensch-Computer-Interaktion, Interaktionsmodelle, Einstiegsmöglichkeiten, Anfragespezifikation, Kontexte, Nutzung von Relevanzbeurteilungen
    C: 257-323 entfällt  
    10 Suchmaschinen im Internet
    Architektur von Suchmaschinen, Benutzungsschnittstellen, Ranking und Zugriffsstrukturen, Meta-Suchmaschinen
    A: 580-610
    B: 285-308
    C: 367-395
    entfällt  

    Mögliche weitere Themen

    Thema Literatur
    11 Probabilistisches IR und weitere IR-Modelle
    A: 506-549
    B: 185-194
    C: 30-71
    12 Multi-Media-IR
    C: 325-366
    13 Digitale Bibliotheken
    B: 316-321
    C: 415-432
    14 IR-Systeme
    B: 207-222
    C: 397-413

    Stand: 12.02.2004