Die Top 10 Algorithmen im Data Mining laut IEEE International Conference on Data Mining 2006:
1. C4.5 (suite of algorithms for classification problems in ML and data mining)
2. K-Means
3. Support Vector Machines
4. Apriori (pattern finding)
5. EM (expectation-maximization, useful in incomplete-data problems)
6. PageRank (link-based ranking algorithm)
7. AdaBoost
8. k-Nearest Neighbors
9. Naive Bayes
10. CART: Classification and Regression Trees
Sehr theoretisch und mit Pseudocode erklärt, für Einsteiger eher ungeeignet. Viele der Algorithmen habe ich in verschiedenen fertigen R Paketen schon verwendet, daher ist es eine sehr gute Vertiefung, wenn man wissen will, was dahinter steckt.