Business Intelligence : jouer la carte de l'Open Source ?

Après les solutions d'infrastructure et la productivité personnelle, l'Open Source s'attaque désormais aux solutions d'entreprise, notamment autour de tout ce qui touche à l'information. La Business Intelligence est un des marchés visés

L'Open Source Business Intelligence : pourquoi maintenant ?

Les logiciels Open Source sont longtemps restés l'apanage de spécialistes en ne touchant que des domaines techniques comme les systèmes d'exploitation (Linux via les diffusions Debian, Ubuntu, RedHat, Suse...), les bases de données (MySQL, PostGreSQL, Ingres...), les serveurs Web et applicatifs (Apache, TomCat, JBoss, ...) puis les outils de développement (PHP, Eclipse, ...). Les logiciels Open Source se sont ensuite retrouvés sur le poste utilisateur avec les browsers Web (MozillaFireFox).

Aujourd'hui une nouvelle vague d'outils Open Source apparaît avec tout ce qui touche à l'information. Avec d'un côté des technologies utilisées aussi bien dans le monde de l'entreprise que par les particuliers (Wiki, Blogs) et de l'autre des solutions plus spécifiquement dédiées à une utilisation en entreprise (Gestion de la Relation Client, Gestion de contenu, Business Intelligence...).

Les solutions Open Source de Business Intelligence (Open Source BI, ou OSBI) attirent désormais l'attention des entreprises, à l'heure où les systèmes d'information décisionnels se banalisent : ils concernent tout type d'entreprise, y compris les PME, et, à l'intérieur de ces entreprises, ils visent un nombre de plus en plus large d'utilisateurs.

Dès lors, le coût de la solution est en ligne de mire et remet en cause les modèles de licences traditionnels.On aurait tort toutefois de simplifier à l'extrême le débat sur les coûts en associant sans discernements logiciels commerciaux à cher et OpenSource à gratuit.

Du côté des logiciels commerciaux, la banalisation des solutions commence en effet à se traduire par des modèles de licences mieux adaptés. Les grands éditeurs prenne en compte la banalisation du décisionnel, au moins pour ses briques de bases, à l'instar de Microsoft qui inclue désormais dans la version standard de sa base de données SQLServer un environnement d'extraction ou ETL, une base de données multi-dimensionnelle et un outil pour le reporting de masse.

Néanmoins, ceci ne les empêche de revenir à un modèle de tarification directe de l'offre Business intelligence sur des composants qu'ils jugent à plus forte valeur ajoutée : pour aller jusqu'au bout de l'analyse de l'exemple de Microsoft, celui-ci commercialise Performance Point pour les fonctions de dash-boarding, d'analyse multi-dimensionnelle ad-hoc, ou de planification.

A ce modèle de mise sur le marché traditionnel, s'oppose bien sûr le modèle Open Source, mais l'erreur serait de considérer les solutions qui adoptent ce modèle comme gratuites. Open Source (ou logiciel libre) ne veut dire forcément freeware (logiciel gratuit).

L'ambiguïté, parfois entretenue par les promoteurs de solutions Open source, est renforcée pour nous francophones par le fait que free signifie indifféremment libre et gratuit. Open Source et freeware sont pourtant bien deux choses différentes, même si en remontant aux origines des logiciels libres, on peut trouver de nombreuses diffusions gratuites (se référer au type de licence associé, qui détermine le mode de diffusion de la solution).

Dans le monde Open Source, le principe de diffusion est fondamental : pour une même base de source, il est fréquent de retrouver plusieurs types de diffusions différentes. Les diffusions les plus basiques sont alors gratuites et sont destinées à s'implanter dans les entreprises de manière virale : quiconque est intéressé peut l'installer et l'utiliser sans avoir besoin de justifier d'un investissement sur le logiciel. Des diffusions plus sophistiquées, payantes,sont alors proposées, avec des valeurs ajoutées fonctionnelles ou technologiques (multi-serveurs, tolérance aux pannes, module d'administration, ...).

Une autre approche possible pour un éditeur d'outils Open Source est de facturer le service associé (support technique,engagement de résultats pour la mise à disposition des correctifs, ...).

C'est souvent ce type d'approche qui permet de pérenniser une solution Open Source : à partir du moment où un acteur du marché, voire-même un écosystème tout entier, génère un volume d'affaires significatif autour d'une solution technologique, il a tout intérêt à investir pour le faire vivre, améliorer sa fiabilité, s'assurer que les utilisateurs de la solution soient pleinement satisfaits...

Ce qui reste gratuit, c'est la mise à disposition du code source et la possibilité de le modifier, et ou de la rediffusé, selon des règles formalisées par la licence de déploiement associée (la plus connue et la plus utilisée est la licence GNU GPL).

Ce mode de partage du code source permet d'ailleurs aux outils Open Source d'être particulièrement ouvert. En effet, leur succès dépend de leur capacité à rassembler une forte communauté de développeurs, ce qui impose de s'appuyer sur des conventions et standards communs à chaque fois que possible.

Les acteurs du monde de l'Open Source Business Intelligence

Les premières briques techniques OSBI sont apparus dès 2001 avec Jasper Reports. Puis de nombreux autres projets se sont lancés ou ont été réutilisé, venant ainsi couvrir tous les domaines de la Business Intelligence :
- Kettle, Talend, Octopuss pour la partie extraction et transformation des données (ETL)
- Mondrian et Palo pour la partie base de données multidimensionnelle, ou OLAP. JPivot, FreeAnalysis comme outil permettant à l'utilisateur d'accéder à ces bases multidimensionnelles
- MySQL, PostGreSQL, ou Ingres pour la partie stockage des données.
- Birt, JFreeReport et donc JasperReport pour la partie reporting.
- FreeMetrics pour la gestion des indicateurs de performances (ou KPIs)
- Weka pour le datamining.

Puis sont apparues des environnements complets, regroupant un ensemble de composants nécessaires pour un projet de Business Intelligence. On retrouve deux profils d'infrastructure pour ces environnements : ceux qui mixent les outils déjà présents sur le marché (tel composant open source pour telle fonction, tel autre pour une autre), ou ceux qui partent de zéro avec l'ambition de fédérer un ensemble d'outils homogènes autour d'une plate-forme technologique et de référentiels communs. La première approche est séduisante parce qu'elle sélectionne des outils qui ont fait leurs preuves.

Leurs atouts sont leur complétude fonctionnelle et leur relative maturité, mais elles demandent de maîtriser plusieurs environnements hétérogènes et par voie de conséquence une forte expertise technique.

De leur côté, les plates-formes homogènes commencent à séduire des sociétés de taille moyenne qui lancent des projets globaux,mais qui se détournent de solutions à base de logiciels dit classiques du fait d'un ticket d'entrée jugé trop élevé face à leur contexte.

Les solutions globales les plus connues, qu'elles soient plates-formes ou suites,sont Pentaho, Jaspersoft et SpagoBI.Les deux premiers sont les projets les plus ambitieux, chacun se présentant d'ores et déjà comme étant le leader du marché OSBI, JasperSoft déclarant 6000 clients,et Pentaho 13500 membres actifs ! Tous deux représentent des investissements importants financés par des sociétés de Capital risque.

Pentaho a été fondé par des anciens de Business Objects, Cognos, Hyperion, IBM, Oracle,et SAS. Son business model se base depuis l'origine sur la vente de version entreprise incluant des modules et fonctions supplémentaires (administration, sécurité,...) pour se diriger vers une rémunération uniquement par le support (maintenance et correctifs), le conseil et la formation.

Le projet s'est constitué sur la base d'outils indépendants, mais ne s'est pas limité à les regrouper : tous les projets à l'origine des outils sélectionnés ont été regroupés sous la bannière du projet Pentaho. Ses composants sont les suivants :
  • Mondrian -Server Multidimensionnel(OLAP)
  • JFreeReport -environnement de Reporting Open Source
  • Kettle -environnement d'intégration de données (ETL)
  • Weka -Environnement de Data Mining
    Une des évolutions prévues, pour la suite Pentaho, est la gestion des méta données via un référentiel commun à l'ensemble de la plate-forme.

    A noter pour dresser un tableau complet des plates-formes décisionnelles que la société Ingres commercialise, sous le nom Ingres Icebraker BI Appliance, la suite Jaspersoft, sous la forme d'un bundle logiciel auquel il ajoute un Linux dédié et sa base de données relationnelle. L'intérêt de ce bundle (aussi appelé appliance logiciel), est qu'Ingres prend en charge la support de l'ensemble du stack.

    En conclusion...


    Les solutions Open Source ont encore une bonne marge de progression, et les améliorations qu'elles doivent amener au plus vite est la partie interface de développement qui reste assez sommaire (on trouve à ce niveau de grandes disparités suivant les outils).

    Les premiers retours d'expérience des entreprises pionnières qui ont choisi de les déployer dans les entreprises sont également précieuses pour accélérer la pénétration sur le marché de ces offres.

    Enfin, face à une offre pléthorique, on aimerait voire se dégager plus nettement des leaders capables de faire converger autour d'eux tout un ensemble de solutions intégrées et une importante communauté Open Source, à l'instar de Linux, de Firefox, ou de Sun/mySQL.

    Mais, sur ce point, les solutions Open Source n'ont pas grand chose à envier aux solutions éditeurs. Car, comme on a pu le voir récemment avec les acquisitions d'Hyperion par Oracle, de Cognos pr IBM, de Business Objects, Cartesis et Oultooksoft par SAP, ou encore de Datallegro, de Fast et de Pro Clarity par Microsoft, le marché de la Business Intelligence est en pleine phase de consolidation et ses potentiels leaders sont encore au coude à coude.

    Tribune co-rédigée par Hervé Le Fur et Jean-Michel Franco - Business & Decision