Will man natürliche Texte (Bücher, Websiten, Forentexte,…) mit ML Verfahren bearbeiten, befindet man sich in der Domäne des Natural Language Processing. Das vorliegende Buch beginnt mit einer Definition der wichtigsten Begriffe (Natural Language, Corpora) und zeigt an praktischen Beispielen, wie NLP funktioniert.
Das Buch setzt Kenntnisse in Python voraus. Die mir vorliegende Version verwendet dazu die Natural Language Toolkit, die laut Autoren nur mit Python 2.4 – 2.7, jedoch nicht mit Python 3.0 kompatibel ist. Den Test mit Python 3.0 habe ich noch nicht versucht, sollte es jemand schon gemacht haben bin ich über Kommentare dankbar.