Proseminar SS 1999
"Datenreduktionstechniken"
Prof. Dr.-Ing. Gerhard Weikum
Dipl.-Inform. Anja Jantke (jantke@cs.uni-sb.de)
Dipl.-Inform. Arnd Christian König (koenig@cs.uni-sb.de)
jeweils Dienstag, 16:15 in Raum 45/013
Themen:
1) (11.05.99): Sampling-Techniken(Ausarbeitung)
Bearbeitet von: Vanessa Walter
Betreuer: Arnd Christian König
2) (18.05.99): Ein Vergleich verschiedener
Histogramm-Techniken(Ausarbeitung)
Bearbeitet von: Martin Wanke
Betreuer: Arnd Christian König
3) (25.05.99): Inkrementelle Verwaltung
von Histogrammen und Samples(Ausarbeitung)(Ausarbeitung
als PDF)
Bearbeitet von: Matthias Rink
Betreuer: Arnd Christian König
4) (08.06.99): Adaptive Selektivitätsschätzung
durch Polynom-Regression(Ausarbeitung)(Ausarbeitung
als PDF)
Bearbeitet von: Johannes John
Betreuer: Arnd Christian König
-
Chungmin
Melvin Chen, Nick Roussopoulos, Adaptive Selectivity Estimation Using Query
Feedback, ACM SIGMOD Conference, 1994
-
W.
Sun, Yibei Ling, Naphtali Rishe, Yi Deng, An Instant and Accurate Size
Estimation Method for Joins and Selection in a Retrival-Intensive Environment,
ACM SIGMOD Conference, 1993
5) (15.06.99): Selektivitätsschätzung
durch Wavelets(Ausarbeitung)
Bearbeitet von: Andreas Hildebrandt
Betreuer: Arnd Christian König
-
Yossi
Matias, Jeffrey Scott Vitter, Min Wang, Wavelet-Based Histograms for Selectivity
Estimation, ACM SIGMOD Conference, 1998
-
Jeffrey
Scott Vitter, Min Wang, Bala Iyer, Data Cube Approximation and Histograms
via Waveletts, 7th Int. Conference on Information and Knowledge Managment
, 1998
6) (22.06.99): Index-Bäume
als Suchstrukturen / Nearest-Neighbor-Algorithmus (Ausarbeitung-ps)
Bearbeitet von: Tom Crecelius / Stephan Wiehr
Betreuerin: Anja Jantke
7) (29.06.99): Singulärwertdekomposition
(Ausarbeitung-ps),(Ausarbeitung-pdf)
Bearbeitet von: Stefan Posth
Betreuerin: Anja Jantke
8) (06.07.99): Clustering-Techniken
(Ausarbeitung-ps),(Ausarbeitung-doc)
Bearbeitet von: Ki-Joon Cho
Betreuerin: Anja Jantke
-
V.
Ganti, R. Ramakrishnan, J. Gehrke, A. Powell, J. French: "Clustering
Large Datasets in Arbitrary Metric Spaces", ICDE 1999.
-
M.
Ester, H.-P. Kriegel, J. Sander, X. Xu: "Clustering for Mining in Large
Spartial Databases", KI-Journal, 1998.
Weitere Überblicks- und Hintergrundliteratur:
-
D.
Barbara, W. Dumouchel, C. Faloutsos, et al.: "The New Jersey Data Reduction
Report", IEEE Bulletin of the Technical Committee on Data Engineering,
12/1997.
-
V.
Gaede, O. Günther: "Multidimensional Access Methods", ACM Computing
Surveys 30(2): 170-231, 1998.
-
W.H. Press, S.A. Teukolsky, W.T. Vetterling, B.P. Flannery, Numerical
Receipes in C, the Art of Scientific Programming, Cambridge University
Press, 1996, elektronisch verfügbar unter: http://www.nr.com/
(Kapitel 2, 14 und 15)
-
Phillip B.
Gibbons, Yossi Matias, Synopsis Data Structures for Massive Data Sets,
Technical Report, Bell Labs, 1998