Modele de choisir

Cependant, imaginez un autre chercheur étudiant les effets du rayonnement solaire sur le climat. Ils seraient probablement plus intéressés à identifier les schémas cycliques dans les données de température. Pour eux, toute tendance de plusieurs décennies serait le bruit. Ils choisiront un modèle qui isole les motifs reproductibles sur l`échelle de 8-11 ans. Les techniques de sélection des modèles peuvent être considérées comme des estimateurs d`une certaine quantité physique, comme la probabilité du modèle produisant les données fournies. Le biais et la variance sont à la fois des mesures importantes de la qualité de cet estimateur; l`efficacité est également souvent envisagée. Un tout nouvel hôtel avec un grand budget pourrait valoriser l`introduction de personnes à leur marque, tandis qu`une entreprise de logiciel de planification de voyage se soucie de chaque interaction publicitaire sur le voyage. Cela dépend de ce que vous voulez sortir de Google Ads. Vous voudrez choisir un modèle qui correspond le mieux à vos besoins. La qualité du modèle mesurée en tant qu`équilibre entre un ajustement équitable des données et un nombre minimal de paramètres peut être évaluée à l`aide d`indices tels que le critère d`information (AIC) ou le critère d`information Bayésien (BIC ou SBC).

Lors de la comparaison de plusieurs modèles paramétriques les uns aux autres, le modèle avec l`indice le plus bas a la meilleure qualité dans l`ensemble. L`interprétation de ces indices n`a pas de sens dans un contexte absolu, en d`autres termes, lorsqu`un seul modèle est pris en considération. La sélection d`un modèle est la tâche consistant à sélectionner un modèle statistique à partir d`un ensemble de modèles candidats, données fournies. Dans les cas les plus simples, un ensemble préexistant de données est considéré. Cependant, la tâche peut également impliquer la conception d`expériences telles que les données collectées sont bien adaptées au problème de la sélection du modèle. Étant donné les modèles candidats de puissance prédictive ou explicative similaire, le modèle le plus simple est le plus susceptible d`être le meilleur choix (le rasoir d`Occam). Il trouvera les valeurs optimales pour votre modèle comme les paramètres à choisir. Tout ce que vous devez faire est d`importer la classe de la bibliothèque Sklearn. Essayer tous les modèles est un objectif fin, mais nous devons l`équilibrer avec le fait qu`il y a littéralement une infinité de modèles à choisir. Il n`y a aucun moyen de les essayer tous.

Il n`est même pas pratique d`essayer toutes les communes. Les exécuter tous, dans toutes leurs manifestations publiées, est susceptible de prendre si longtemps que nous ne nous soucions plus de la réponse, et ce n`est même pas considérer le temps qu`il faudrait pour les faire fonctionner tous dans la même base de code. Nous allons devoir prendre des décisions difficiles. Une fois que vous avez choisi l`outil de modélisation approprié, dans de nombreuses situations, vous pouvez demander combien de paramètres vous devez inclure dans le modèle. Plus le nombre de paramètres que vous incluez est élevé, mieux l`ajustement du modèle aux données (c.-à-d. la baisse des valeurs résiduelles qui implique une statistique R ² plus élevée). Le nombre de paramètres dans le modèle devrait-il être maximisé de manière à ce que les résidus soient extrêmement réduits au minimum? Pas vraiment. Un modèle qui correspond trop aux données sera trop représentatif de l`échantillon particulier qui est utilisé, et la généralisation à l`ensemble de la population sera moins exacte. Lorsque vous examinez les données de performance, n`oubliez pas de choisir une fenêtre d`historique appropriée.