UniKL Logo

Lehrgebiet Informationssysteme

FB Informatik

FB Informatik
 
LG IS
AG DBIS
AG HIS
Jobs / Tasks
Courses
Proseminar
WS 2005/06
Aktuelles
Material
Archiv:
  • WS 04/05
  • WS 03/04
  • WS 01/02
  • Publications
    Contact
    Misc
    Impressum
    (C) AG DBIS
     

    Proseminar des Lehrgebiets Datenverwaltungssysteme im Wintersemester 2005/2006

    Thema: Information Retrieval


    Allgemeines

    im Rahmen des Proseminars bearbeitet jeder Student eines der angebotenen Themen (siehe Themen-Tabelle unten) anhand der angegebenen Literatur. Die Ergebnisse der Arbeit werden in einer Ausarbeitung zusammengefasst und im Rahmen eines Vortrags präsentiert.

    Ansprechpartner: Philipp Dopichaj

    Aktuelles

    • Scheine — Die Proseminarscheine können ab sofort im Sekretariat der AG DBIS (36/332) abgeholt werden.
    • Vortragstermine — Die Vorträge finden an drei Blockterminen am 1., 8. und 15. Februar 2006 (jeweils Mittwoch) ab 15.30 Uhr im Seminarraum des Lehrgebiets (36/336) statt.
    • Abgabetermin — Der Abgabetermin für die Ausarbeitungen ist der 18. Januar 2006.
    • Das Proseminar ist abgeschlossen, und die AGen DBIS und HIS bedanken sich bei allen Teilnehmern.

    Organisatorisches

    • Vortragsdauer ca. 25 Minuten;
    • Ausarbeitung von ca. 10 Seiten Umfang;
    • Ausarbeitung liegt mindestens 2 Wochen vor dem ersten Vortragstermin dem Betreuer/der Betreuerin als PDF- oder PostScript-Datei vor.
    • Die Vorträge werden zu mehreren Blockterminen gehalten.

    Literatur

    0 Lehner, W.: Richtlinien zur Vorbereitung von Seminarvorträgen
    A Henrich, A.: Information Retrieval, Foliensammlung, 1999
    B Ferber, R.: Information Retrieval – Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003 (Signatur: WIR 089/100)
    C Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval, Addison-Wesley, 1999
    D Salton, G., McGill, M.J., Information Retrieval – Grundlegendes für Informationswissenschaftler, McGraw-Hill, 1987 (Signatur: INF 535/042)

    Themen

    Die zu jedem Thema angegebenen Stichpunkte dienen nur dazu, den Inhalt des Themas zu verdeutlichen; sie sind nicht als Gliederungspunkte zu sehen.

    Thema Literatur Vortragende(r) Betreuer Termin
    1 Information Retrieval – Einführung
    Motivation, Begriffsdefinitionen, grundsätzliche Vorgehensweise
    A: 7–27, 39
    B: 1–31
    C: 1–10
    D: 1–25
    Dennis Pospich Härder 1. 2. 2006
    2 Retrieval-Evaluierung
    Effizienz vs. Effektivität, Precision und Recall, Experimente und Testkollektionen
    A: 41–73, 94–136
    B: 83–100
    C: 73–97
    D: 167–198
    Bernd Amann Deßloch
    3 Aufbereitung von Text-Dokumenten zur Verbesserung der IR-Qualität
    Berücksichtigung der Vagheit in Sprache, Stoppworteliminierung, Stamm- und/oder Grundformreduktion (Porters Algorithmus), Mehrwortgruppenidentifikation
    A: 137–202
    B: 39–47
    C: 163–170, 433–436
    D: 57–81
    Volker Hudlet Bühmann
    4 Terminologische Kontrolle und Klassifikation
    Aufbau und Einsatz eines Thesaurus, Cluster-Bildung bei Dokumenten, Nutzung von Klassifikationen, Dezimalklassifikation, Hierarchische Klassifikationen, Semantische Netze
    A: 203–232
    B: 47–61
    C: 123–139, 170–173
    D: 81–93, 228–251
    Jan-Felix Weber Bühmann 8. 2. 2006
    5 Pattern Matching in Texten
    Exaktes String-Matching, Approximatives String-Matching
    A: 233–247, 312–340
    C: 104–106, 209–222
    Qian Fu Stumm
    6 Einfache IR-Modelle
    Grundlegendes IR-Modell, Wortsuche, Invertierte Dateien, weitere Text-Indexe
    A: 341–383
    C: 19–25, 191–207
    Daniel Schall Dopichaj
    7 Boolesches Retrieval und weitere IR-Modelle
    Retrieval-Modell, Invertierte Listen, Coordination-Level-Match, Fuzzy-Set-Modell, Logikbasierte Modelle
    A: 384–428
    B: 33–38, 195–206
    C: 19–27, 99–104, 207–208
    Markus Messner-Chaney Mathis 15. 2. 2006
    8 Das Vektorraummodell
    Basismodell, Implementierung, Relevanz-Feedback, Varianten
    A: 28–33, 429–456, 491–505
    B: 61–83, 181–184
    C: 19–30, 117–123
    entfällt
    9 Benutzerschnittstellen und Visualisierung
    Mensch-Computer-Interaktion, Interaktionsmodelle, Einstiegsmöglichkeiten, Anfragespezifikation, Kontexte, Nutzung von Relevanzbeurteilungen
    C: 257–323 Julian Kallenborn Dopichaj
    10 Suchmaschinen im Internet
    Architektur von Suchmaschinen, Benutzungsschnittstellen, Ranking und Zugriffsstrukturen, Meta-Suchmaschinen
    A: 580–610
    B: 285–308
    C: 367–395
    Matthias Wolf Mathis
    12 Multi-Media-IR
    C: 325–366 entfällt
    13 Digitale Bibliotheken
    B: 316–321
    C: 415–432
    entfällt

    Stand: 23. 02. 2006