Data et modèles analytiques ont une date de péremption : ignorer les systèmes obsolètes à ses risques et périls

En s'assurant continuellement de l'actualité, de l'exactitude et de la pertinence des données et des modèles analytiques critiques pour l'entreprise, les organisations peuvent mieux anticiper et résoudre les challenges du marché et de leur environnement.

Les données et les modèles analytiques périssables rendent beaucoup plus difficiles l'anticipation et la réaction aux changements soudains. Cela peut aller de la demande de produits et de services, du prix ou de la disponibilité des matières premières, du sentiment des consommateurs ou encore de l'accès des clients et des employés à l'entreprise.

Ainsi, les entreprises qui gardent leurs données et leurs modèles analytiques les plus frais peuvent augmenter considérablement, non seulement leurs chances de survie, mais aussi améliorer leur capacité à capturer une plus grande part des revenus et des profits dans le processus. Plus une entreprise est capable de générer des informations approfondies et précises, plus elle peut apporter de valeur ajoutée en interne et en externe. Si l’on prend l’exemple d’une chaîne de magasins de proximité qui identifie les produits qui se vendent le plus rapidement pendant la pandémie. Cela leur permet de s'assurer qu'ils ont suffisamment de ces produits en stock et de les placer près des caisses pour que les clients passent le moins de temps possible dans le magasin et même augmenter les achats de ces produits. La compréhension des données et des modèles périssables va bien au-delà des mesures traditionnelles telles que l'âge ou l’actualisation. Alors, quelles sont les données actuelles, précises ou pertinentes ? 

Des données suffisamment actuelles

Les données actuelles reflètent les changements les plus récents qui pourraient avoir un impact significatif sur l'entreprise. Il peut s'agir du relâchement ou du resserrement des mesures liées à la Covid-19 ou d'un appel à une manifestation à proximité (ou à propos) de l'entreprise via les réseaux sociaux. Les techniques avancées d'intelligence artificielle (IA) telles que le machine learning peuvent aider à identifier ces données en déterminant, par exemple, quelles sources de données ont été utilisées pour générer les modèles.

Ces modèles sont continuellement affinés et utilisent l'IA avancée contre des "jumeaux virtuels" du monde réel, ils apprennent donc continuellement plutôt que d'être formés une seule fois sur des données statiques. Cela évite le risque que les modèles deviennent inutiles, ce qui est par exemple le cas avec de nombreux modèles prédictifs basés sur le comportement des consommateurs ou des employés avant la crise de la Covid-19, qui ne sont évidemment plus pertinents. Ces nouveaux modèles basés sur les comportements actuels changeront également à mesure que les niveaux de confinement, les taux d'infection et d'autres facteurs (tels que les manifestations et les catastrophes naturelles) modifieront le statu quo.

Des données suffisamment précises

Il s’agit ici des données qui ont été nettoyées et validées pour s'assurer qu'elles proviennent d'une source précise, qu'elles n'ont pas été compromises et qu'elles sont dans un format utilisable. Ceci est particulièrement important pour les données sous des formes non traditionnelles, comme les données non structurées, ou provenant de sources plus récentes comme les réseaux sociaux ou l'Internet des objets (IoT). Ces données peuvent souvent être la source d'informations intéressantes, par exemple lorsque les données de localisation des téléphones portables sont utilisées en plus des données des tests Covid-19 pour mieux suivre la propagation de la maladie et les nouvelles infections.

Des modèles précis ont non seulement été testés pour leur exactitude dans les conditions actuelles, mais ils peuvent, grâce à l'IA avancée, fournir des prévisions plus précises.

Si une prédiction est peu fiable mais qu'elle peut avoir des conséquences massives, comme un exode des millenials des zones urbaines dû à la Covid-19, une entreprise peut faire un bond en avant à moindre coût par rapport à ses concurrents en étant la première à prévoir une telle tendance. Par exemple, un modèle analytique qui "découvre" des tendances hebdomadaires ou saisonnières dans les échanges financiers est peu utile si les concurrents ont déjà trouvé cette tendance et ajusté leurs propres échanges pour en tenir compte. Par conséquent, les modèles qui sont précis ont également été formés pour ne pas tenir compte des tendances qui apparaitraient dans les données lorsque ces tendances cessent d'être pertinentes.

Des données suffisamment pertinentes

Cela fait référence à des données qui sont suffisamment significatives pour avoir un impact important sur les prévisions des conditions futures et/ou les mesures qu'elles recommandent pour y répondre. Avant le mouvement "#Metoo", par exemple, un tweet d'un PDG n'était peut-être pas un point de données digne d'être suivi. Aujourd'hui, les boycotts qu'un tel tweet pourrait susciter pourraient entraîner des changements importants dans les revenus, la part de marché et la valeur de la marque. Les données pertinentes proviennent de n'importe où, au sein ou en dehors de l'entreprise, et elles peuvent aider l'entreprise à être la première à sentir le changement et à y réagir.

En développant et en affinant des modèles pertinents, les organisations peuvent déterminer, à l'aide du machine learning, quelles données sont les plus utiles et ne pas tenir compte des données moins utiles. Plus important encore, cela réduit les coûts, le temps et les efforts que représente la formation des modèles sur des données non pertinentes.