Inevidence logo

Install the Flash plugin to see animation: Click here to download

Open Text Mining (Ine french)
PDF Print E-mail
Written by Philippe Bonny
Tuesday, 28 September 2010 17:00
article

La croissance du monde de l'Open Source n'épargne pas le secteur du Text Mining. Ce qui, il y a encore quelques années, était précieusement conservé au sein des éditeurs du domaine, comme trésor de guerre, est aujourd'hui llibrement accessible sur la toile. Ces outils open source comprennent en effet des librairies riches en fonctionnalités d'analyse automatique de texte telles que : Tokeniser, Analyseur Morpho-Syntaxiques, Extracteurs d'entités nommés, PartOfSpeech Tagger, Gestionnaires de Grammaires etc. Et ce dans un grand nombre de langues allant de l'Hindi ... au Basque !

Quelques exemples d'outils les plus utilisés :

GATE, http://gate.ac.uk/ (Le plus complet)

Logo-gate

NLTK, http://www.nltk.org/Home (basé sur le langage Python)

 

RAPID MINER, http://rapid-i.com/content/view/181/196/, (Plutôt Data Mining mais avec des fonctionnalités de base Text Mining)

Rapid_analytics_190