Présentation de la prestation Base de Données

Toutes les études menées par ENSAE Junior Etudes reposent sur une analyse statistique, à partir d’une base de données fournie par le client. La conception d’une base de données pertinente pour l’analyse peut paraître confuse, comme c’est souvent le cas après le recueil d’un questionnaire. A cet égard, ENSAE Junior Etudes dispose de toutes les compétences nécessaires à l’élaboration et la gestion d’une base de données optimale. Tous ses intervenants disposent d’une expertise solide en matière de bases de données. En effet, dès la première année une matière est dédiée à la création et à la gestion des bases de données. Par ailleurs, au cours de leur scolarité, ils doivent valider un projet de 6 mois portant sur la création et l’optimisation de base.

Ainsi, grâce à ces enseignements théoriques et pratiques, ENSAE Junior Etudes dispose de méthodes avancées, validées par les instituts statistiques, permettant de concevoir une base de données pertinente, de la nettoyer et de s’assurer que les valeurs extrêmes et aberrantes, à l’origine d’analyses faussées, soient supprimées.

Exemple d'étude : création d'un schéma-type de construction de base de données

Afin d’analyser exhaustivement un questionnaire sur le sentiment de sécurité des employés, une entreprise a fait appel à EJE pour qu’elle puisse exploiter minutieusement sa base de données ainsi récoltée. Or, comme l’entreprise ne possédait qu’une ébauche incomplète de base de données, il s’agît donc pour EJE non seulement de l’exploiter et de l’analyser, mais préalablement de fournir un schéma-type de construction de base de données, ainsi que des algorithmes qui permettent l’exploitation automatique des futures bases.

Dans cette optique, EJE a d’abord livré un modèle de base de données exploitable grâce notamment au recodage de certaines variables. Ce premier travail de gestion de bases a ensuite été enrichi par  diverses méthodes d’analyse statistique afin d’exploiter la base du client :  depuis des statistiques descriptives univariées et bivariées qui décrivent les différentes variables ainsi que leur répartition et analysent les possibles corrélations jusqu’à des méthodes plus complexes, qui relèvent de la classification et de l’élaboration de profils-types ou bien de méthodes économétriques de régression pour identifier des liens de causalité entre des variables ou des groupes de variables, obtenus à l’aide d’analyses factorielles.

Exemple d'étude : analyse de la fréquentation des expositions dans les musées

Un organisme public a fait appel à notre expertise statistique dans le but d’analyser la fréquentation des expositions temporaires dans les musées français. Compte tenu de la taille significative de la base proposée – qui décrivait la fréquentation des 1200 établissements sur 7 ans – nous avons identifié les variables pertinentes dans le cadre de l’étude, afin de les regrouper dans une sous-base plus facilement exploitable. A cette première étape de gestion de bases s’est ajoutée une analyse plus fine et exhaustive des variables sélectionnées, notamment grâce à des outils de statistique descriptive qui décrivent la répartition et les corrélations entre variables. Des méthodes économétriques, telles la modélisation par ARIMA ou bien l’étude de la co-intégration des variables, ont permis de souligner des causes explicatives de la fréquentation des expositions temporaires, au premier rang desquelles se situent par exemple l’offre en elle-même et les politiques de tarification.