BUSINESS INTELLIGENCE
Le terme Business Intelligence (BI) désigne les technologies, applications et pratiques de collecte, d'intégration, d'analyse et de présentation de l'information.
Le but de la Business Intelligence est d'accompagner les dirigeants et de leur fournir des informations pour les aider dans leurs prises de décisions.
MÉDIANE ET QUARTILE
La médiane (Me) des données signifie que 50% des valeurs sont plus petites et 50% des valeurs sont plus grandes que celle-ci. C’est l’équivalent de Q2, soit le deuxième quartile.
Le 1er quartile (Q1) : la valeur intermédiaire entre la plus petite valeur (minimum) et la médiane.
Le 3ème quartile (Q3) : la valeur intermédiaire entre la médiane et la plus grande valeur (maximum).
L'étendue est la distance entre le minimum (-4 sur notre schéma) et le maximum (23 sur le schéma) de la série observée. C'est donc la différence entre la plus petite et la plus grande valeur.
Enfin, l’écart interquartile est un indicateur de dispersion. C’est l’intervalle dans lequel se trouve 50% des valeurs intermédiaires, soit entre Q1 et Q3.
BOÎTE À MOUSTACHE (BOXPLOT)
Une boîte à moustache (ou boxplot) est une représentation graphique d'une série statistique.
Sur l'image, les rectangles bleus sont délimités par les 1er et 3ème quartiles (soit Q1 et Q3, cela représente notre écart interquartile).
Les rectangles bleus concentrent donc 50% des valeurs intermédiaires de la série analysée.
Les traits bleus représentent les maximums et minimums des séries étudiées (soit MIN et MAX, cela représente notre étendue).
MOYENNE ET ÉCART-TYPE
La moyenne est un indicateur servant à résumer l'information fournie par un ensemble de données statistiques : elle est égale à la somme de ces données divisée par leur nombre.
L'écart-type sert à mesurer la dispersion, ou l'étalement, d'un ensemble de valeurs autour de leur moyenne. Plus l'écart-type est faible, plus les valeurs sont homogène (peu de dispersion).
MACHINE LEARNING
1
MATCHS PASSÉS
La base de données BIRUGBY comporte plus de 2200 matchs. Pour chacun des matchs passés nous avons collecté des informations telles que le classement des équipes, les cartons, les essais, les pénalités etc.
2
MODÈLE MATHEMATIQUE
Grâce au langage informatique (python) et à l'aide des bibliothèques (scikit-learn) nous modélisons mathématiquement les matchs de la base de données BIRUGBY.
3
MATCHS À VENIR
Nous appliquons le modèle mathématique créé et paramétré en étape 2 aux nouveaux matchs à venir afin de prédire des tendances et des scenarios de match comme par exemple les totaux des points marqués par équipe.