Dieses Buch widmet sich auf über 500 Seiten der NLP mit Python. Es wird beschrieben wie man Text Corpora verwendet, wie man Rohtexte bearbeitet, kategorisiert und klassifiziert. Die Klassifikation geschieht mit überwachten Verfahren, es werden Decision Trees, Naive Bayes Classifier und Maximum Entropy Classifier besprochen.
Ein weiteres Kapitel beschäftigt sich mit der Analyse der Bedeutung ganzer Sätze und welche Semantiken dahinterstecken.
Wer noch keine Erfahrung mit Python hat sollte unbedingt vorher eines der Einführungsbücher studieren.