données 201-2018 issues de la base de données de l'ANRT et données 2019 issues de la base DRRT ; seuls les dossiers concernant des entreprises ont été gardés ,
, ? Les données générales (sources : Insee et Mesri) : population, population des 19-24 ans
, ? Les données en lien avec l'innovation (source MESRI) : CIR (nombre et volume), brevets (nombres)
Test de cohérence : la distribution des CIFRE par département (notée C) n'est relativisée à une autre distribution notée Y) que si ces deux distributions ont une corrélation forte ,
, Repérage des anomalies / points extrêmes / outliers : ? Soit l'indicateur X = C/Y dont on dispose d'une valeur par département
Compte tenu de la faibel taille de l'échantillon, X est normalisée par une approche robuste ? Xnorm = (X -med(X))/ecr(X) où med(X) représente la médiane de X et ecr(X) la médiane de la distribution ,
, On teste alors la normalité de la variable Xnorm par un test statistique de comparaison de distribution. Sachant que l'échantillon est de petite taille
Une valeur supérieure (resp. inférieure) à 1.96 (resp. -1.96) indiquera un département où le nombre de CIFRE est anormalement élevé ,
, Les résultats ? CIFRE vs CIR (nombre d'entreprises bénéficiant du CIR). Les CIFRE son ? très sur-représentées : Isère (Xnorm = 8.6)
, Savoie (0.5), Ardèche (0.15)
, ? sous-représentées : Allier (-0.8)
Rhône : CIR, demandeurs d'emplois, population 19-24, taux de scolarisation ? Isère ,
, ? CIFRE sous-représentées : pour l'Ain pour les variables CIR et brevets ? Autres indicateurs entre eux
Population : très sous-représentées (3, 7, 15) ; équivalentes (1, 63, 73, 74) ; très sur-représentées, vol.38, p.69 ,
, ? CIR vs brevets : très sous-représentées (63) ; sous-représentées, vol.74, p.38
, Résultat détaillé : analyse CIFRE vs CIR