Proseminar SS 02

Intelligentes Suchen in Informationssystemen: Web-Mining


Einstimmungsliteratur:
IEEE CS Data Engineering Bulletin March 2002, 
Special Issue on Organizing and Discovering the Semantic Web
http://www.research.microsoft.com/research/db/debull/
IEEE CS Data Engineering Bulletin September 2000,
Special issue on Next-Generation Web Search
http://www.research.microsoft.com/research/db/debull/
C. Manning, H. Schuetze:
Foundations of Statistical Natural Language Processing,
Chapters 2, 15, and 16, MIT Press, 1999
http://nlp.stanford.edu/fsnlp/

Wegen der hohen Anzahl von Anmeldungen wurde das Proseminar um zwei Zusatztermine am 14.Mai und 9.Juli erweitert.


Di, 23. April HS 001 Geb. 45
Überblick über die Datenbank-,
Information-Retrieval- und Data-Mining-Technologie
Vortrag von Gerhard Weikum

Di, 14. Mai: Search Engines
1) Web Search Engines
S. Brin, L. Page:
The Anatomy of a Large-Scale Hypertextual Web Search Engine,
WWW Conference, 1998
(lokaler Mirror)
Referent: Sven Herzog
Betreuer: Sergej Sizov
Folien: PS, PDF Ausarbeitung: PS, PDF
2) Metasearch:
W. Meng, Z. Wu, C. Yu, Z. Li:
A Highly-Scalable and Effective Method for Metasearch,
ACM Transactions on Information Systems Vol.19 No.3, 2001

Referent: Petra Schumacher
Betreuer: Martin Theobald
Folien: PDF
Ausarbeitung: PDF


                           


Di, 21. Mai: Link Analysis & Authority Ranking
3) Authority Ranking
J. Kleinberg:
Authoritative Sources in a Hyperlinked Environment,
Journal of the ACM Vol.46 No.5, 1999

Referent: Isabell Schu
Betreuer: Martin Theobald
Folien: PDF
Ausarbeitung: PDF


               

4) Improved Topic Distillation
K. Bharat, M. Henzinger:
Improved Algorithms for Topic Distillation in a Hyperlinked Environment,
ACM SIGIR 98
Referent: Christoph Keppner
Betreuer: Martin Theobald
Folien: PDF
Ausarbeitung: PDF

Di, 28. Mai: Classification
5) Text Classification
K. Nigam, A.K. McCallum, S. Thrun, T. Mitchell:
Text Classification from Labeled and Unlabeled Documents Using EM,
Machine Learning Vol.38, 2000

-ausgefallen-
6) Support Vector Machines
T. Joachims:
A Statistical Learning Model of Text Classification with Support Vector Machines,
SIGIR Conference, 2001

Referent: Volker Schuberth
Betreuer: Sergej Sizov
Folien: PS, PDF Ausarbeitung: PS, PDF

Di, 11. Juni: Focused Crawling
7) Focused Crawling 1
S. Chakrabarti, M. van den Berg, B. Dom:
Focused Crawling: A New Approach to Topic-specific Web Resource Discovery,
WWW Conference, 1999

Referent: Holger Hewener
Betreuer: Martin Theobald
Folien: PDF
Ausarbeitung: PDF
8) Focused Crawling 2
S. Chakrabarti, M.M. Joshi, V.B. Tawde:
Enhanced Topic Distillation using Text, Markup Tags, and Hyperlinks,
ACM SIGIR Conference, 2001

Referent: Andreas Wagner
Betreuer: Martin Theobald
Folien: PDF
Ausarbeitung: PDF

Di, 18. Juni: Deep Web
9) Deep Web Exploration 1
P.G. Ipeirotis, L. Gravano, M. Sahami:
Probe, Count, and Classify: Categorizing Hidden-Web Databases,
ACM SIGMOD Conference, 2001

Referent: Marco Möhrlein
Betreuer: Martin Theobald
Folien: PDF
Ausarbeitung: PDF
10) Deep Web Exploration 2
W. Meng, W. Wang, H. Sun, C. Yu:
Concept Hierarchy Based Text Database Categorization,
International Journal on Knowledge and Information Systems, 2001

Referent: Latyr Tanor Dieng
Betreuer: Martin Theobald
Folien: PDF
Ausarbeitung: PDF

Di, 25. Juni: Semantic Web
11) Semantic Web
L. Kerschberg, W. Kim, A. Scime:
A Semantic Taxonomy-Based Personalizable Meta-Search Agent,
WISE Conference, 2001

Referent: Markus Pister
Betreuer: Jens Graupmann
Folien: PDF
Ausarbeitung: PDF
12) Latent Semantic Indexing
Thomas Hofmann:
Unsupervised Learning by Probabilistic Latent Semantic Analysis,
Department of Computer Science, Brown University, Providence

Referent: Rene Schubotz
Betreuer: Gerhard Weikum
Folien: PDF
Ausarbeitung: PDF

Termin- und Raumänderung
Mo, 1. Juli, 14.15 Uhr im SR 323: Enhanced Classification
13) Boosting
Robert E. Schapire, Yoram Singer:
BoosTexter: A boosting-based system for text categorization.
Machine Learning, 39(2/3):135-168, 2000

Referent: Daniel Porta
Betreuer: Gerhard Weikum
Folien: PDF
Ausarbeitung: PDF

Di, 9. Juli: Automatic Segmentation

14) Hypertext Classification
S. Chakrabarti, B. Dom, P. Indyk:
Enhanced Hypertext Categorization Using Hyperlinks,
ACM SIGMOD Conference, 1998

Referent: Stefanie Roth
Betreuer: Gerhard Weikum
Folien: PDF
Ausarbeitung: PDF
15) Automatic Segmentation 2
V. Borkar, K. Deshmukh, S. Sarawagi:
Automatic Segmentation of Text into Structured Records,
ACM SIGMOD Conference, 2001

Referent: Dennis Reiter
Betreuer: Jens Graupmann
Folien: PDF
Ausarbeitung: PDF