| article |
| La croissance du monde de l'Open Source n'épargne pas le secteur du Text Mining. Ce qui, il y a encore quelques années, était précieusement conservé au sein des éditeurs du domaine, comme trésor de guerre, est aujourd'hui llibrement accessible sur la toile. Ces outils open source comprennent en effet des librairies riches en fonctionnalités d'analyse automatique de texte telles que : Tokeniser, Analyseur Morpho-Syntaxiques, Extracteurs d'entités nommés, PartOfSpeech Tagger, Gestionnaires de Grammaires etc. Et ce dans un grand nombre de langues allant de l'Hindi ... au Basque ! Quelques exemples d'outils les plus utilisés : GATE, http://gate.ac.uk/ (Le plus complet) NLTK, http://www.nltk.org/Home (basé sur le langage Python)
RAPID MINER, http://rapid-i.com/content/view/181/196/, (Plutôt Data Mining mais avec des fonctionnalités de base Text Mining)
|
main menu
Written by Philippe Bonny
Tuesday, 28 September 2010 17:00




