A
la croisée des chemins entre le Data Mining et la veille, les outils de
Text Mining sont dotés de fonctionnalités d'extraction et de catégorisation
d'informations non structurées. Focus sur les offres disponibles.
"L'un des objectifs du Text Mining est de donner du sens à des informations
non structurées et de faciliter la prise de décision", affirme Gilles
Balmisse, directeur associé au sein de Knowledgeconsult, cabinet de conseil en
matière de veille et de gestion des connaissances.
Parmi les acteurs présents
sur ce marché, on recense trois catégories d'acteurs : les
pure players, ceux issus du décisionnel, et les éditeurs
de solutions de recherche ayant intégré la fonctionnalité
à leur outil. Nous avons choisi de recenser les deux premières catégories
d'offres.
Les
critères de choix | 1 |
Nombre
de formats de documents supportés en entrée |
2 |
Quantité
de langues gérées nativement
|
3 | Acquisition
des flux HTTPS et RSS par défaut |
Le premier critère de choix retenu pour ce panorama est celui
qui concerne le nombre de formats de documents que la solution est en mesure de
supporter. Au-delà des formats traditionnels de documents issus
des suites bureautiques (.doc, .xls, .ppt...), d'autres comme XML (eXtensible
Markup Language) ou encore SGML (Standard Generalized Markup
Language), peuvent être reconnus par les solutions.
Lorsque l'on
met en place un outil de Text Mining dans le cadre d'une action de veille
(sectorielle, concurrentielle, juridique, technologique...), il peut être
intéressant d'opter pour une solution qui soit en mesure de reconnaître
plus d'une dizaine de langues par défaut. Cependant, la plupart
des éditeurs proposent des modules linguistiques supplémentaires
(en option), en fonction des besoins.
Les entreprises et les sites Web
sont par ailleurs de plus en plus nombreux à diffuser leurs communiqués
et/ou à syndiquer leurs informations en utilisant le format de publication
RSS. Loin d'être encore unanimement répandue par défaut,
cette fonctionnalité constitue notre troisième critère de
choix des principaux outils de Text Mining disponibles sur le marché.
|