Tableau
de synthèse des solutions à suivre |
Editeur
/ Solution |
Formats de
documents en entrée (>50) |
Langues supportées
en natif (>10) |
Flux HTTPS
et RSS |
Clearforest
/ Text Analysis Suite |
(.pdf, .html, .doc...) |
NC |
NC |
Inxight /
SmartDiscovery | (220
formats) | (30
langues) | |
Lingway / XTIRP |
(.pdf, .html, .doc...) | 7
langues | HTTPS |
SAS
/ Text Miner | (.pdf,
.html, .doc, .XLS, .ppt...) | (>15
langues) | Pas
disponibles par défaut |
SPSS / LexiquestMine,
Categorize et Text Mining for Clementine | (>50
formats dont .pdf, .html, .doc, .xml, .ppt, .xls, .rtf, .txt...) | 8
langues | HTTPS |
Temis / Online
Miner | | (20
langues, dont le chinois, le russe et l'arabe) | |
Editeur
/ Solution |
Formats de
documents en entrée (>50) |
Langues supportées
en natif (>10) |
Flux HTTPS
et RSS | | "Il
sera nécessaire de prêter une attention particulière à la qualité des dictionnaires
métiers ou thésaurus fournis par les éditeurs, dont la facilité d'implémentation
variera en fonction des offres et pourra nécessiter des paramétrages spécifiques
en interne", prévient Gilles Balmisse.
Ainsi, seules Text
Mining for Clementine (SPSS) et Online Miner (Temis) sont interopérables
sous les environnements d'exploitation Windows, Linux, Solaris/Unix.
Enfin,
du point de vue des bases de données, Temis se démarque en
supportant indifféremment Oracle, SQL Server, MySQL, IBM DB2 et
également Xylème Zone server. |