Rappelez-vous que les variables sont généralement de deux types - variables dépendantes ou de réponse et variables indépendantes ou prédictives. Les termes "dépendant" et "indépendant" sont les plus courants dans les modèles de type ANOVA, tandis que les termes "réponse" et "prédicteur" sont plus courants dans les modèles de type régression, bien que leur utilisation ne soit pas uniforme pour une méthodologie particulière. L'instruction de fonction classique Y = f (X) raconte l'histoire - saisissez une valeur pour X (variable indépendante) et observez l'effet sur Y (variable dépendante). Dans un test t à échantillons indépendants, par exemple, X est une variable à deux niveaux, tandis que la variable dépendante est une variable continue. Dans une ANOVA classique à sens unique, X a plusieurs niveaux. Dans une régression linéaire simple, X est généralement une variable continue, et nous utilisons la variable pour faire des prédictions d'une autre variable continue Y. La plupart des modélisations statistiques consistent simplement à observer un résultat basé sur une valeur estimée équation de données).

 

Les données se présentent sous différentes formes. Bien qu'il existe des distinctions théoriques assez précises entre les différentes formes de données, nous pouvons résumer la discussion pour les types d'application suivants:

(i) continue et

(ii) discrète.

Les variables mesurées sur une échelle continue peuvent, en théorie, atteindre toute valeur numérique sur une échelle donnée. Par exemple, la longueur est généralement considérée comme une variable continue, car nous pouvons mesurer la longueur à tout degré numérique spécifié. C'est-à-dire que la distance entre 5 et 10 pouces sur une échelle contient un nombre infini de possibilités de mesure (par exemple 6.1852, 8.341, 364, etc.). L'échelle est continue car elle suppose un nombre infini de possibilités entre deux points de l'échelle et n'a pas de "ruptures" dans ce continuum. Par contre, si une échelle est discrète, cela signifie qu’entre deux valeurs de l’échelle, seul un nombre limité de possibilités peut exister. Par exemple, le nombre de pièces dans ma poche est une variable discrète, car je ne peux pas avoir 1,5 pièce. Je peux avoir 1 pièce, 2 pièces, 3 pièces, etc., mais entre ces valeurs, il n’existe pas un nombre infini de possibilités. Parfois, les données sont aussi catégoriques, ce qui signifie que les valeurs de la variable sont mutuellement exclusives, telles que A ou B ou C ou "garçon" ou "fille". D'autres fois, les données prennent la forme de comptes QI, nous ne comptons que le nombre d’occurrences de certains comportements (par exemple, le nombre de fois où je cligne des yeux en une minute). Selon le type de données dont vous disposez, différentes méthodes statistiques seront appliquées. En examinant ce que SPSS a à offrir, nous identifions les variables comme étant continues, discrètes ou catégoriques au fur et à mesure que nous discutons de la méthode donnée. Cependant, ne soyez pas trop rattrapé par les définitions ici; il y a toujours un peu de "flou" dans l'apprentissage de la nature des variables que vous avez. Par exemple, si je compte le nombre de gouttes de pluie dans une tempête de pluie, nous aurions du mal à appeler cela «données de comptage». Nous l'accepterions plutôt comme des données continues et les traiterions comme telles. Plusieurs fois, vous devez compromettre un peu entre les types de données pour mieux répondre à une question de recherche. Certes, le nombre moyen de personnes par ménage n'a pas de sens, mais les rapports de recensement nous donnent souvent de tels chiffres sur les données de «comptage». Rappelez-vous toutefois toujours que le logiciel ne reconnaît pas la nature de vos variables ou la manière dont elles sont mesurées. Vous devez être certain de cette information entrant; connaître très bien vos variables, de sorte que vous puissiez être sûr que SPSS les traite comme prévu.
Les échelles de mesure sont également distinguées entre les valeurs nominales, ordinales, les intervalles et les ratios. Une échelle nominale n'est pas vraiment une mesure en premier lieu, car elle attribue simplement des étiquettes aux objets que nous étudions. L'exemple classique est celui des chiffres sur les maillots de football. Ce joueur a le numéro 10 et un autre nombre 15 ne signifie rien d'autre que des étiquettes pour distinguer deux joueurs. Si les différences entre les nombres représentent des grandeurs, mais que les différences entre les grandeurs sont inconnues ou imprécises, alors nous avons des mesures au niveau ordinal.
Par exemple, un coureur a terminé premier et une autre seconde une mesure à l’ordinal niveau. Rien n'est dit de la différence de temps entre le premier et le deuxième coureur, mais seulement qu'il y a un "classement" des coureurs. Si les différences entre les nombres sur une échelle représentent des longueurs égales, mais qu'un point zéro absolu ne peut toujours pas être défini, alors nous avons une mesure au niveau de l'intervalle. Un classique par exemple, la température en degrés Fahrenheit - la différence entre 10 et 20 ° représente la même distance de température que celle entre 20 et 30; Cependant, zéro sur l'échelle ne représente pas une "absence" de température. Quand on peut attribuer un point zéro absolu en plus pour déduire les propriétés de l'échelle d'intervalle, nous avons alors une mesure à l'échelle du rapport. Le nombre de pièces dans ma poche est un exemple de mesure du ratio, car zéro sur l’échelle représente une absence totale de pièces. Le nombre d'accidents de voiture en un an est une autre variable mesurable sur une échelle de ratio, car il est possible, même peu probable, qu'il n'y ait pas eu d'accident au cours d'une année donnée.
La première étape dans le choix d'un modèle statistique consiste à savoir quel type de données vous avez, qu'elles soient continues, discrètes ou catégoriques, et à vous demander si les données sont nominales, ordinales, à intervalles ou en proportions. Prendre ces décisions peut être beaucoup plus délicat que cela puisse paraître, et vous devrez peut-être consulter quelqu'un pour obtenir des conseils à ce sujet avant de choisir un modèle. D'autres fois, il est très facile de déterminer quel type de données vous avez. Mais si vous n’êtes pas sûr, vérifiez auprès d’un consultant en statistique pour vous aider à confirmer la nature de vos variables, car commettre une erreur à ce stade initial de l’analyse peut avoir des conséquences graves et compromettre entièrement vos analyses de données.