Une brève introduction à la Suite TIMi

Une fois que vous aurez suivi les 8 vidéos ci-dessus sur Anatella, vous serez en mesure d’effectuer presque toutes les activités liées aux données telles que : la collecte de données, l’importation de données, la transformation de données, le traitement de données, le nettoyage de données, le traçage de données, l’exportation de données vers d’autres outils de BI ou vers des services cloud, l’ingénierie des fonctionnalités, etc.
 
Nous vous encourageons vivement à suivre les 8 vidéos ci-dessus sur Anatella car elles vous aideront grandement à apprendre la « Suite TIMi ». Les autres vidéos ci-dessous ne sont utiles que si vous avez des besoins très spécifiques : par exemple, si vous avez un exercice d’apprentissage automatique ou de clustering à réaliser.
 
Dans Anatella, toutes les bibliothèques open source permettant de créer des modèles prédictifs et d’effectuer des activités d’apprentissage automatique sont directement disponibles, en quelques clics de souris. Mais, si vous voulez vous lancer dans les exercices d’apprentissage automatique les plus avancés, vous aurez besoin d’un outil d’apprentissage automatique tel que « Modeler ». Voici quelques tutoriels vidéo Youtube sur Modeler :

  1. Une courte introduction à la modélisation prédictive et comment créer votre premier modèle prédictif avec Modeler (anglais)
  2. Comment utiliser Modeler directement depuis Anatella pour recréer automatiquement un nouveau modèle à la volée chaque semaine ? (anglais)
  3. Résoudre un problème de Text Mining très avancé avec TIMi Modeler (anglais)
Toujours dans Anatella, toutes les bibliothèques open source pour segmenter/classer vos ensembles de données sont directement disponibles en quelques clics de souris. Mais si vous voulez vous engager dans les exercices de clustering les plus avancés, vous aurez besoin d’un outil de segmentation 3D tel que « Stardust ». Voici quelques tutoriels vidéo Youtube sur Stardust :

  1. Principes de segmentation : Introduction théorique à la technique PCA – partie 1 (anglais).
  2. Principes de segmentation : Introduction théorique à la technique PCA – partie 2 (anglais).
  3. Une démonstration du moteur de segmentation multivariée de Stardust – partie 1 (anglais).
  4. Une démonstration du moteur de segmentation multivariée de Stardust – partie 2 (anglais).

LES BASES DE LA BUSINESS INTELLIGENCE

Dans ce guide, nous allons voir quelles fonctionnalités chaque type de solution analytique a à offrir,
comment elles se comparent les unes aux autres et comment faire le bon choix pour vos besoins.
Les solutions classiques de Business-Intelligence peuvent être classées grossièrement comme suit :

Intégration de données : ETL

L’objectif principal des outils ETL (Extract, Transform, Load) est de rassembler le contenu de diverses bases de données ou systèmes opérationnels d’une organisation et de centraliser toutes les données en un seul endroit, appelé « entrepôt de données ».

Lire la suite (anglais)

Data warehousing

Un data warehouse est un lieu centralisé où vous pouvez trouver toutes les données de votre entreprise. Les logiciels de Data Warehouse sont très souvent de simples bases de données : Oracle, Teradata, SQL Server, MySQL,…

Lire la suite (anglais)

Rapports et BI

Les logiciels de reporting (c’est-à-dire les outils BI – Business Intelligence tools) vous permettent de créer des tableaux et des graphiques sur l’évolution des différents KPI (Key Performance Indexes) qui caractérisent votre entreprise.

Lire la suite (anglais)

Logiciels de CRM

L’acronyme CRM signifie « Customer Relationship Management » (gestion de la relation client). Cette catégorie couvre les logiciels de CRM opérationnel et de CRM analytique.

Lire la suite (anglais)

Analytique avancée : 2 approches différentes

Les outils CRM analytiques peuvent être classé en 2 catégories : Les outils de CRM analytique basés sur des techniques de segmentation et les outils de CRM analytique basés sur des techniques prédictives. Par sa nature même, la segmentation est une technique bien adaptée au travail exploratoire. Par opposition, l’analyse prédictive est de nature discriminatoire. Les outils de CRM analytique basés sur des techniques prédictives génèrent généralement un meilleur retour sur investissement pour les campagnes de marketing.

Lire la suite (anglais)
segPredLifts
datasetForScoring

De l’utilité de l’ensemble de données de test

Lorsque vous comparez la précision de 2 modèles prédictifs différents pour savoir quel modèle prédictif est le meilleur (celui qui a la meilleure précision et le meilleur ROI), vous devez comparer UNIQUEMENT les « courbes de lift calculées sur le jeu de données TEST » et si possible, utiliser toujours le même jeu de données TEST.

Lire la suite (anglais)

Toutes les lifts ne sont pas égales

Lorsque nous construisons un modèle qui ne fait aucune erreur sur l' »ensemble de données d’entraînement », nous obtenons un modèle qui n’est pas performant sur des données non vues. La « capacité de généralisation » de notre modèle est faible. Le modèle prédictif utilise des informations qui étaient en réalité des bruits. Ce phénomène est appelé « over-fitting ». Un modèle qui « surajuste » les données peut avoir une précision de 100 % lorsqu’il est appliqué à l’ensemble d’apprentissage.

Lire la suite (anglais)
predictiveModel2