27 juin

Biostatistiques (5) – Taille de l'échantillon

La taille de l'échantillon doit être calculée de manière rigoureuse pour garantir la validité statistique des résultats.

1. Définitions importantes

  • Population à l'étude : Ensemble des sujets cibles de l'étude.

  • Échantillon : Sous-groupe de la population sur lequel les mesures sont réalisées.

  • Randomisation : Procédure de tirage au sort permettant de constituer les groupes de manière aléatoire (ex : groupe étude vs. groupe témoin).

2. Estimation de la taille de l'échantillon

La taille optimale d'un échantillon dépend de plusieurs paramètres :

  • α (risque d'erreur de type I)

  • β (risque d'erreur de type II) ou puissance statistique (1 - β)

  • Différence attendue entre les groupes (effet clinique jugé pertinent)

  • Variabilité des mesures (ex. écart-type)

3. Outils en ligne recommandés

Pour faciliter ces calculs, plusieurs outils en ligne sont disponibles :

4. Exemple pratique

Dans une étude précédente, la durée des crises motrices était de 43 ± 10 s sous étomidate (0,2 mg/kg) contre 31 ± 8 s sous propofol (1 mg/kg).

Avec une puissance statistique de 80 % (β = 0,20) et un niveau de signification de 5 % (α = 0,05), la taille initiale de l'échantillon a été estimée à 9 patients par groupe.

En anticipant un taux d'exclusion de 10 %, un total de 10 patients a été inclus dans chaque groupe.


20 juin

Biostatistiques (4) – Logiciels


Pour réaliser des analyses statistiques en biostatistiques, plusieurs logiciels sont disponibles, chacun avec ses avantages selon le type d’analyse et le niveau d’expertise.

**SPSS est un logiciel payant très utilisé en milieu médical et scientifique grâce à son interface intuitive et ses fonctionnalités complètes. Il facilite les analyses descriptives, les tests statistiques et la modélisation.
Lien : IBM SPSS Statistics

*Jamovi est un logiciel open-source et gratuit, offrant une interface claire adaptée aux débutants ou aux analyses rapides. Il intègre les tests statistiques essentiels et des graphiques simples.
Lien : Jamovi

-R Studio est un environnement puissant et open-source pour le langage R, très flexible, permettant d’effectuer des analyses complexes et personnalisées. Il nécessite une connaissance plus avancée en programmation.
Lien : R Studio

-MedCalc est un logiciel payant spécialisé en biostatistiques médicales, proposant des outils adaptés à la recherche clinique, comme l’analyse ROC et les courbes de survie.
Lien : MedCalc

-GraphPad Prism combine statistiques, création de graphiques et modélisation. Très utilisé en sciences de la vie, il est payant mais apprécié pour sa facilité d’utilisation.
Lien : GraphPad Prism

-Microsoft Excel, avec son module complémentaire XLStat, permet de réaliser des analyses statistiques simples à avancées directement dans un tableur connu de tous. XLStat ajoute des fonctionnalités statistiques avancées.
Liens : Microsoft Excel | XLStat

13 juin

Biostatistiques (3) – Notions pratiques

Astuces pour le codage des variables

·         Présence / absence d’un facteur : 1 / 0

·         Sexe : mâle = 1, femelle = 2

·         Groupes : 1 = étude, 2 = témoin

Transformation de variables sous SPSS

·         Calculer une variable : Transformer → Calculer la variable

·         Recoder une variable (ex. créer des intervalles) : Transformer → Recoder en variables différentes → définir anciennes et nouvelles valeurs

·         Sélectionner un sous-groupe : Données → Sélectionner les observations

·         Travailler sur deux groupes simultanément : Données → Scinder des fichiers

Conseils pour graphiques

·         Variables continues : histogrammes, boxplots, courbes de distribution

·         Variables discontinues / ordinales : diagrammes en barres, diagrammes en secteurs

·         Variables nominales : diagrammes en secteurs ou barres

·         Pas de graphiques 3D

·         Légendes toujours sous l’image

Conseils pour tableaux

·         Présenter les données clairement et synthétiquement (colonnes = paramètres, lignes = variables)

·         Utiliser des titres explicites et unités dans les en-têtes

·         Favoriser la simplicité pour une lecture rapide

·         Tracer uniquement les lignes de séparation pour l’en-tête et la fin du tableau

·         Placer la légende au-dessus du tableau

 

06 juin

Biostatistiques (2) – Notions de base

1. Types de variables

Type de variable

Définition

Exemples

Continue

Peut prendre une infinité de valeurs avec intervalles égaux

Poids, taille, pression artérielle

Discontinue

Valeurs dénombrables, souvent entières, non continues

Nombre de doses, score de douleur

Ordinale

Modalités ordonnées sans intervalles fixes

Stades de cancer, score ASA

Nominale

Modalités sans ordre

Sexe, groupe sanguin, type d’acte

2. Paramètres qu’on peut calculer

Paramètre

Définition

Moyenne

Somme des valeurs divisée par le nombre total

Écart-type

Dispersion des valeurs autour de la moyenne

Variance

Moyenne des carrés des écarts à la moyenne (écart-type²)

Médiane

Valeur qui divise la population en deux parties égales

Intervalle interquartile (IQR)

Différence entre le 3ᵉ et le 1er quartile (Q3 – Q1), robuste aux valeurs extrêmes

Mode

Valeur la plus fréquente dans la distribution

Fréquence absolue

Nombre d’occurrences d’une modalité

Fréquence relative (%)

Pourcentage d’une modalité par rapport au total

Étendue (Max – Min)

Différence entre la valeur maximale et minimale

3. Loi normale

La loi normale (ou loi de Gauss) est la loi de probabilité la plus utilisée en statistique. Une variable suit cette loi si sa densité de probabilité forme une courbe en cloche, avec mode ≈ moyenne ≈ médiane.

Tests de normalité courants :

·         Shapiro-Wilk

·         Kolmogorov-Smirnov

·         Anderson-Darling (plus sensible aux extrêmes)

Interprétation :

·         p > 0,05 → variable suit une loi normale

·         p ≤ 0,05 → variable ne suit pas une loi normale

Vérification sous SPSS :

·         Analyse → Statistiques descriptives → Explorer

·         Sélectionner la variable quantitative (et facteur qualitatif si besoin)

·         Cliquer sur Tracés → cocher “Tracés de répartition Gaussiens avec test”

·         Valider par OK

4. Intervalle de confiance (IC) – Intervalle de fluctuation (IF)

·         IC : Estimation de la valeur vraie dans la population à partir d’un échantillon, avec un niveau de confiance (ex. 95 %).

·         IF : Variabilité attendue d’une statistique entre différents échantillons issus d’une même population.

Outils & APK (4) – ATB express

ATB express : l’antibiothérapie en un clin d’œil En contexte péri-opératoire, en réanimation ou en urgence, l’accès rapide à une stratégie ...