Partagez
Voir le sujet précédentAller en basVoir le sujet suivant
Emre.leo
Niveau 1

Progression en stats QHSE

par Emre.leo le Jeu 23 Aoû 2018 - 13:54
Bonjour, je suis prof de maths certifié au collège dans le 94 et récemment j'ai eu une proposition de poste dans un CCI dans le 95 en qualité d'intervenant en Statistiques appliquées à la QHSE (Qualité hygiène sécurité et environnement).

Niveau de la formation Bac+4 mais les étudiants admis ont un niveau entre Bac+2 et Bac+5.

Je serai en charge de 4 groupes :

2 groupes avec 3 jours de cours soit 21 heures.

2 groupes avec 5,5 jours de cours soit 38,5 heures.

Lors de l'entretien, la responsable m'a fait part de plusieurs problématiques :

Cours trop chargé.

Niveau trop faible.

Cours trop théorique et donc peu pratique.

Pour ma part la principale problématique étant de construire une progression pertinente et j'adapterais le reste.
En effet les domaines cités par mes collègues sont très vague.
Pour vous donnez quelques exemples de ma problématique (faire des choix pertinents sur les sujets à aborder dans chaque thème) pour faire une progression :
Mes collègues me parlent par exemple de la loi normale mais la loi normale c'est trop vague, on peut faire des milliers d'heures de cours juste sur ça.

Voici des exemples de ce qu'on peut faire (évidemment je compte pas aborder tous ces sujets, c'est un exemple de ce que l'on peut faire sans précision).

Loi Normale :

Définition et explication
Fonction de densité
Fonction de répartition (qui nécessiterai peut être un rappel sur les intégrales)
Fonction caractéristique
Fonction génératrice des moments
etc

Je ne pense pas qu’il y ait un intérêt quelconque et le temps necessaire à exploiter tous ces sujets pour la loi normale.

Tests d’hypothèses : Il y a de nombreux tests et donc de nombreux critères et formules à retenir.

Test du Chi2
Test d'ajustement
Test seuil de signification
Test d’indépendance
Test d’hypothèses
Test de comparaison
etc

Idem pour les tests.

Pour le moment je n'ai pas rencontré tous mes collègues et ce qui Ils n'arrivent pas à être plus précis.

Voici une esquisse de ma progression : (Ceci n'est pas une progression ordonnée, ce sont les thèmes que je comptais aborder).

·      Lois de probabilités (Bernoulli, Binomiale, Normale, Pareto)

·      Échantillonnage

·      Intervalle de confiance

·      Intervalle de fluctuation

·      Aide à la décision

·      Estimation

·      Tendance

·      Statistique descriptive (moyenne, médiane etc...)

Donc pour conclure y a-t-il parmi vous des profs (étudiants ou autres) qui ont fait ou suivi un cours de statistiques dans ce domaine pour m'orienter davantage ?

Merci d'avance pour vos réponses.


Dernière édition par Emre.leo le Jeu 23 Aoû 2018 - 14:45, édité 4 fois
avatar
ben2510
Érudit

Re: Progression en stats QHSE

par ben2510 le Jeu 23 Aoû 2018 - 14:16
L'enseignement qu'on te propose est dans le cadre de la CCI, mais correspond à quel niveau ?

Est-ce le DUT HSE ? Le programme est là : https://cache.media.enseignementsup-recherche.gouv.fr/file/DUT_-_Programmes_pedagogiques_nationaux/28/6/10-PPN-HSE_VD_150286.pdf  page 17, avec 40h en tout moitié analyse et moitié probas (10h CM, 14h TD, 16h TP)

S'il s'agit du niveau BTS, tu peux regarder les modules concernés dans ce document  https://www.sup.adc.education.fr/btslst/referentiel/BTS_ProgrammeMathematiques.pdf

En tout cas, oublie les fonctions caractéristiques ; et la distribution du Khi² regroupe plusieurs test d'hypothèse : test d'indépendance, test de conformité (=ajustement), donc ta liste est un peu trop longue par rapport au contenu réel, inutile de stresser.

En ce qui concerne ta progression, elle me semble un peu bizarre (finir par les stats descriptives, par exemple).
Je te propose de la réordonner ainsi (je suis ma progression de BTS), avec un horaire indicatif.

Statistique descriptive (moyenne, médiane écart type)  2h TD essentiellement des exercices contextualisés, l'utilisation de la calculatrice, les intervalles à plus ou moins deux écarts type

Tendance 2h TD la droite des moindres carrés ; peu de théorie, mais peut-être faudra-t-il faire des changements de variable du genre z=ln(y)=ax+b d'où y=k*exp(ax) avec k=exp(b)

Lois de probabilités (Bernoulli, Binomiale, Normale, Pareto) 2h CM, 2h TD

Échantillonnage,  Intervalle de fluctuation  2h CM, 2h TD

Estimation,  Intervalle de confiance  2h CM, 2h TD

Aide à la décision  les 4h restantes ; peut-être peux-tu commencer par exemple par le Khi² d'indépendance, pour bien expliquer la démarche inférentielle, puis enchaîner les autres tests.

Pour pouvoir t'en dire plus, il faut que tu précise le niveau auquel tu devra intervenir !

_________________
On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n'est pas plus une science qu'un tas de pierres n'est une maison. Henri Poincaré  La notion d'équation différentielle est le pivot de la conception scientifique du monde. Vladimir Arnold
Emre.leo
Niveau 1

Re: Progression en stats QHSE

par Emre.leo le Jeu 23 Aoû 2018 - 14:32
Avant tout merci de ta réponse Ben2510 (je ne sais ni marquer quelqu'un et ni répondre à un message directement désolé).

BIG MEA CULPA, il manquait en effet plusieurs informations je rectifie cela dans mon message initiale.

Je vais également mettre le nombre d'heure qu'on me donne.
avatar
ben2510
Érudit

Re: Progression en stats QHSE

par ben2510 le Jeu 23 Aoû 2018 - 15:05
@Emre.leo a écrit:Niveau de la formation Bac+4 mais les étudiants admis ont un niveau entre Bac+2 et Bac+5.

Je serai en charge de 4 groupes :

2 groupes avec 3 jours de cours soit 21 heures.

2 groupes avec 5,5 jours de cours soit 38,5 heures.

C'est sûr que ce n'est pas simple de savoir comment s'organiser si tout ce dont tu disposes est la simple indication bac+4 !
Il faut exiger qu'on te donne un programme de formation, sinon c'est à toi de le construire.
Si les admis vont de bac+2 à bac+5, sais-tu sur quel critère ils sont admis ? J'imagine que les bac+2, +3, +4 et +5 ne sont pas forcément dans les mêmes branches, sinon je vois mal comment feraient les bac +2 ?

Les cours sont "massés", c'est-à-dire que tes 3 jours (ou 5,5 jours) se suivent, sous forme de stage ?
C'est une contrainte très forte sur l'organisation des cours !

@Emre.leo a écrit:
Lors de l'entretien, la responsable m'a fait part de plusieurs problématiques :

Cours trop chargé.

Niveau trop faible.

Cours trop théorique et donc peu pratique.

Je vois bien le problème, j'ai eu à peu près le même avec des M1 et M2 : niveau mathématique très hétérogène, intérêt pour la matière assez faible, étudiants peu susceptibles de s'intéresser à la théorie...

Essentiellement, il faut problématiser ton enseignement, c'est-à-dire présenter les connaissances méthodes comme répondant à des questions pertinentes par rapport à la formation, si possible des questions en lien avec les autres "matières" (même si ce n'est sans doute pas le mot adapté ici).

Un exemple (central et fondateur) : tu relèves des concentrations en nitrates dans de l'eau destinée à la distribution au robinet ; cette concentration est-elle élevée ? Stable ? Quelle sont les valeurs "aberrantes", dans le sens "qui arrivent rarement (<5%)". Les variations de cette concentration sont-elles normales (un Khi² d'ajustement est intéressant ici) ? Sur 365 jours, combien de jours peut-on prévoir pour lesquels cette concentration dépassera une certaine norme ? Peut-on observer une corrélation entre les précipitations et le taux de nitrates (lavage des sols) ? Avec peut-être deux jours de décalage ? Quel décalage permet de maximiser la corrélation ?

En tout cas il te faut, au choix, soit un contrat clair (un programme explicite), soit l'autorisation de faire ce qui te semble pertinent.
Si tu découvres l'utilisation des stats dans le supérieur, je te conseille de commencer par un bouquin de BTS, car le programme tel que tu le décris ressemble beaucoup à ce qui se fait dans ceux des BTS où il y a le plus de stats.

_________________
On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n'est pas plus une science qu'un tas de pierres n'est une maison. Henri Poincaré  La notion d'équation différentielle est le pivot de la conception scientifique du monde. Vladimir Arnold
avatar
cassiopella
Niveau 7

Re: Progression en stats QHSE

par cassiopella le Jeu 23 Aoû 2018 - 17:57
Bonjour @Emre.leo, je pensais à créer ce genre de sujet, parce que j'ai du mal à organiser la première partie du cours. J'enseigne les stats inférentielles en L2 éco (BAC ES pour la plupart). Est-ce que je peux poser des questions aux profs de lycée dans ton sujet?

Voilà ce que j'en pense:

La première chose à faire, c'est de voir s'ils ont les bases. Combien ont suivi le cours de Proba (au moins les variables discrètes) dans le supérieur? Si moins de 30%, il faudra aussi faire le cours de proba. Est-ce qu'ils savent dériver et intégrer? Les miens, par exemple, ne savaient pas. Pourtant ils ont eu BAC ES il y a 2 ans Neutral Est-ce qu'ils ont suivit le cours de stats descriptives?

Quant à au contenu:
0.1) Statistiques descriptives s'ils n'ont jamais fait. Sinon pas la peine de faire les rappels.
0.2) Probabilités discrètes (surtout les notions d'espérance, variance, lois usuelles et paramètres des lois, fonction de masse/densité, fonction de répartition)
0.3) Si c'est utiles dans leurs profession, tu peux parler de l’échantillonnage.

1) Rappel: lois usuelles et surtout la loi Normale. Quelques exercices calculatoires pour la loi normale. Ici il est important de préciser la différence entre la moyenne de l'échantillon et le paramètre m de la loi normale appelé "moyenne". De même pour la variance de l'échantillon et sigma² le paramètre de la loi normale appelé "variance".
1.1) Loi normale:
--- paramètres
--- densité
--- fonction de répartition
--- loi normale centré réduite
--- utilisation des tables statistiques ou calculatrice
--- calcul de la probabilité (loi normale CR et loi normale)
--- faire l'inverse
--- retrouver les valeurs des paramètres de la loi normale si les probabilités sont données pour les intervalles des valeures

2)  Estimation: progression classique
2.1) Introduction: l'objet d'étude et présentation du vocabulaire (population, échantillon, statistique, loi de probabilité, paramètres des lois...)
2.2) Estimation ponctuelle: moyenne, variance, proportion (paramètres des lois, s'ils arrivent à suivre). Le critère de qualité d'estimation (risque quadratique), biais et convergence. La notion du biais est très importante à mon avis. Bien évidement parler de la variance corrigée.
2.3) Estimation par l'intervalle de confiance (c'est une estimation!): des paramètres de la loi normale (moyenne et variance) et le paramètre p de la loi Binomiale (proportion ou fréquence). J'insiste sur le mot paramètre, parce qu'ils mélangent paramètres et les statistiques et du coup ne savent pas quel IC prendre pour la moyenne. Ici il faudra aussi présenter la loi de Student.
2.4) Régression linéaire et MCO (sans aller trop dans les détails).

3) Tests (à toi de voir si tu fais les tests unilatéraux). Il faut aussi décider s'ils calculent tout ou tu leur donne les résultats avec les p-values et ils les interprètent.
3.1) Grands principes (en faisant le moins de théorie possible) et le vocabulaire
3.2) Test de la moyenne (càd m de la loi normale) en faisant le lien avec l'intervalle de confiance et le test de Student.
3.3) Test de la variance
3.4) Test des échantillons appareillés, test de Fisher et introduire la loi de Fisher
3.5) Test de la proportion
3.6) Tests de Chi-2 (indépendance, ajustement etc)

Comme ils ont un niveau faible, pas la peine d'aller plus loin à mon avis. C'est assez dense pour 20h.

PS pas la peine de parler de l'intervalle de fluctuation! C'est très très peu utilisé dans la pratique.

_________________
Moi et l'orthographe, nous ne sommes pas amis. Je corrige les erreurs dès que je les vois. Je m'excuse pour celles que je ne vois pas...
Emre.leo
Niveau 1

Re: Progression en stats QHSE

par Emre.leo le Jeu 23 Aoû 2018 - 18:19
Désolé je pensais t'avoir répondu mais j'ai eu un problème de connexion à internet.
@ben2510 a écrit:

C'est sûr que ce n'est pas simple de savoir comment s'organiser si tout ce dont tu disposes est la simple indication bac+4 !
Il faut exiger qu'on te donne un programme de formation, sinon c'est à toi de le construire.
Si les admis vont de bac+2 à bac+5, sais-tu sur quel critère ils sont admis ? J'imagine que les bac+2, +3, +4 et +5 ne sont pas forcément dans les mêmes branches, sinon je vois mal comment feraient les bac +2 ?

Les cours sont "massés", c'est-à-dire que tes 3 jours (ou 5,5 jours) se suivent, sous forme de stage ?
C'est une contrainte très forte sur l'organisation des cours !

Ils sont admis par dossier et par entretien donc je ne pense pas qu'ils regardent le niveau mathématiques des étudiants.

En théorie on a une demi journée par mois mais c'est en théorie, la seule certitude que je peux avoir c'est que j'aurai jamais deux demi journées dans la même journée.
Une demi journée correspond à 3h30 de cours donc ça me laisse pas mal de marge pour bien avancer par demi journée.



@ben2510 a écrit:

Je vois bien le problème, j'ai eu à peu près le même avec des M1 et M2 : niveau mathématique très hétérogène, intérêt pour la matière assez faible, étudiants peu susceptibles de s'intéresser à la théorie...

Essentiellement, il faut problématiser ton enseignement, c'est-à-dire présenter les connaissances méthodes comme répondant à des questions pertinentes par rapport à la formation, si possible des questions en lien avec les autres "matières" (même si ce n'est sans doute pas le mot adapté ici).

C'est quasiment les mêmes problématiques que je vais rencontrer.

J'aimerais bien mais les collègues ne sont pas très ouvert à discuter étant donné qu'ils ont un autre travail (manque de temps sans doute ou ils n'aiment pas travailler en collaboration).

@ben2510 a écrit:

Un exemple (central et fondateur) : tu relèves des concentrations en nitrates dans de l'eau destinée à la distribution au robinet ; cette concentration est-elle élevée ? Stable ? Quelle sont les valeurs "aberrantes", dans le sens "qui arrivent rarement (<5%)". Les variations de cette concentration sont-elles normales (un Khi² d'ajustement est intéressant ici) ? Sur 365 jours, combien de jours peut-on prévoir pour lesquels cette concentration dépassera une certaine norme ? Peut-on observer une corrélation entre les précipitations et le taux de nitrates (lavage des sols) ? Avec peut-être deux jours de décalage ? Quel décalage permet de maximiser la corrélation ?

En tout cas il te faut, au choix, soit un contrat clair (un programme explicite), soit l'autorisation de faire ce qui te semble pertinent.
Si tu découvres l'utilisation des stats dans le supérieur, je te conseille de commencer par un bouquin de BTS, car le programme tel que tu le décris ressemble beaucoup à ce qui se fait dans ceux des BTS où il y a le plus de stats.

Je trouve ton exemple très pertinent, clair et interessant c'est exactement ce dont j'ai besoin, une base de données d'exercice de genre. As tu des références internet, des livres en particuliers (ça m'arrangerait à vrai dire)?

J'ai cherché tout à l'heure et c'est difficile de trouver des bouquins dans ce domaine, comment s'appelle le BTS en question ? Ne serait ce pas le BTS MSE ?

Pour le programme il me laisse libre choix, j'avoue que c'est mieux pour un prof mais la je me perd un peu dans la masse d'info.
avatar
ben2510
Érudit

Re: Progression en stats QHSE

par ben2510 le Jeu 23 Aoû 2018 - 18:33
Les BTS ont des programmes de maths différents, mais organisés en modules ; par conséquent la plupart des bouquins sont valables pour tous les BTS (sauf certains bouquins qui ne feront que les modules propres à un BTS).
Vérifie simplement dans la table des matières qu'il y a des probas/stats inférentielles !

Cassiopella, en France on peut aussi utiliser le mot "espérance" pour le paramètre µ d'une loi (normale) ; distinguer moyenne d'un échantillon et espérance d'une variable aléatoire, on peut le faire en même temps que l'échantillonnage, non ?


Dernière édition par ben2510 le Jeu 23 Aoû 2018 - 21:09, édité 1 fois

_________________
On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n'est pas plus une science qu'un tas de pierres n'est une maison. Henri Poincaré  La notion d'équation différentielle est le pivot de la conception scientifique du monde. Vladimir Arnold
avatar
cassiopella
Niveau 7

Re: Progression en stats QHSE

par cassiopella le Jeu 23 Aoû 2018 - 19:59
@ben2510 a écrit:Cassiopella, en France on utilise le mot "espérance" pour le paramètre µ d'une loi (normale)
Je n'ai jamais fait de stats et proba en Russie. Il n'y a pas de confusion. Non, c'est bien la moyenne (théorique) m ou mu et la variance (théorique) sigma². L’espérance c'est l’espérance. La moyenne c'est le nom du paramètre µ de la loi normale. Ouvre n'importe quel cours de statistiques inférentielles. Par exemple: un, deux, trois. D'où aussi les expressions "intervalle de confiance pour la moyenne", "test de la moyenne" etc.
La confusion arrive au niveau des IC ou test, quand il faut décider lequel est bon en fonction de : "si la moyenne est connue"/"si la variance est connue". Certains pensent que la moyenne/variance est connue parce qu'ils peuvent calculer la moyenne et la variance de l'échantillon. Et dans les exercices contextualisés impossible de bannir les mots moyenne et variance.

distinguer moyenne d'un échantillon et espérance d'une variable aléatoire, on peut le faire en même temps que l'échantillonnage, non ?
Oui. Mais il n'y a pas de confusion entre moyenne de l'échantillon et l'espérance de v.a. En tout cas parmi les miens. Par contre ils peuvent confondre la variance empirique de l'échantillon et la variance de v.a. Mais c'est un autre type d'erreur, plutôt rare: à la demande de calculer la variance de v.a. X ils essayent d'utiliser la formule de la variance de l'échantillon.

@Emre.leo a écrit:Je trouve ton exemple très pertinent, clair et interessant c'est exactement ce dont j'ai besoin, une base de données d'exercice de genre. As tu des références internet, des livres en particuliers (ça m'arrangerait à vrai dire)?

J'ai cherché tout à l'heure et c'est difficile de trouver des bouquins dans ce domaine, comment s'appelle le BTS en question ? Ne serait ce pas le BTS MSE ?

Pour le programme il me laisse libre choix, j'avoue que c'est mieux pour un prof mais la je me perd un peu dans la masse d'info.
Attention, l'exercice est trop poussé. Pour un débutant il y a trop de notions à la fois. Il faut commencer par les exercices plus simples pas à pas. Par exemple:
Au deuxième tour de l’élection présidentielle, le dernier sondage de l’institut I indique 52,5% d’intentions de vote pour le candidat A et 47,5% pour le candidat B (les absentions ou les votes nuls ne sont pas pris en compte). L’institut II indique 50,5% d’intentions de vote pour A et 49,5% pour B. Pour chaque sondage l’échantillon est de taille n = 1112.

1) Définir la v.a. X. Préciser la loi de probabilité suivie par X.
2) Donner un estimateur sans biais et convergent du pourcentage des votes pour le candidat A.
3) On aimerait estimer le pourcentage des votes pour le candidat A par l’intervalle de confiance. Quelle v.a. pivotale Z faut-il utiliser pour construire cet intervalle ?
4) Estimer le pourcentage de vote pour A par l’intervalle de confiance au niveau 1−α=86% pour chaque échantillon. Y a-t-il une contradiction entre les résultats de ces deux instituts de sondage ?
5) Le candidat A peut-il être totalement rassuré ?



_________________
Moi et l'orthographe, nous ne sommes pas amis. Je corrige les erreurs dès que je les vois. Je m'excuse pour celles que je ne vois pas...
avatar
ben2510
Érudit

Re: Progression en stats QHSE

par ben2510 le Jeu 23 Aoû 2018 - 21:08
Je n'ai pas dit que tu confondais !
J'ai dit que pour une variable aléatoire la moyenne s'appelle aussi (voila ce qui manquait dans le tweet précédent) espérance, ce qui est une façon pratique d'éviter le confusion entre la moyenne empirique (de l'échantillon) et la moyenne théorique (dans la population).
Ceci dit, les statistiques à l'Université sont un domaine où il ya des différences assez importantes de notations d'un professeur à l'autre.

En ce qui concerne l'exercice, il est bien sûr trop complet, je voulais simplement montrer comment on pouvait structurer les contenus à enseigner autour d'une situation de départ assez simple. Avec des séances assez espacées, par exemple toutes les deux-trois semaines, utiliser un tel "fil rouge" est malcommode, je pense. Par contre, avec des cours consécutifs très concentrés, passer la première séance sur un tel problème, disons simplement en faisant quelques statistiques descriptives et graphiques, en s'assurant que tout le monde comprend bien les questions qu'on se pose, peut (à mon avis toujours) permettre de structure les cours suivants, chacun autour d'une méthode (p.ex moindres carrés, corrélation et test de la corrélation/test du khi² d'adéquation à une loi/etc).

_________________
On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n'est pas plus une science qu'un tas de pierres n'est une maison. Henri Poincaré  La notion d'équation différentielle est le pivot de la conception scientifique du monde. Vladimir Arnold
Emre.leo
Niveau 1

Re: Progression en stats QHSE

par Emre.leo le Jeu 23 Aoû 2018 - 21:18
@cassiopella a écrit:Bonjour @Emre.leo, je pensais à créer ce genre de sujet, parce que j'ai du mal à organiser la première partie du cours. J'enseigne les stats inférentielles en L2 éco (BAC ES pour la plupart). Est-ce que je peux poser des questions aux profs de lycée dans ton sujet?


Bien sur tu peux il n'y aucun souci.
Emre.leo
Niveau 1

Re: Progression en stats QHSE

par Emre.leo le Jeu 23 Aoû 2018 - 21:25
@ben2510 a écrit:

En ce qui concerne l'exercice, il est bien sûr trop complet, je voulais simplement montrer comment on pouvait structurer les contenus à enseigner autour d'une situation de départ assez simple. Avec des séances assez espacées, par exemple toutes les deux-trois semaines, utiliser un tel "fil rouge" est malcommode, je pense. Par contre, avec des cours consécutifs très concentrés, passer la première séance sur un tel problème, disons simplement en faisant quelques statistiques descriptives et graphiques, en s'assurant que tout le monde comprend bien les questions qu'on se pose, peut (à mon avis toujours) permettre de structure les cours suivants, chacun autour d'une méthode (p.ex moindres carrés, corrélation et test de la corrélation/test du khi² d'adéquation à une loi/etc).

Bien sur que l'exercice est un peu compliqué mais en finalité j'aimerais qu'ils sachent faire ce genre d'exercice. Ce n'est pas donné pour l'instant d'après les propos de la responsable.
Emre.leo
Niveau 1

Re: Progression en stats QHSE

par Emre.leo le Jeu 23 Aoû 2018 - 21:32
@cassiopella a écrit:Bonjour @Emre.leo, je pensais à créer ce genre de sujet, parce que j'ai du mal à organiser la première partie du cours. J'enseigne les stats inférentielles en L2 éco (BAC ES pour la plupart). Est-ce que je peux poser des questions aux profs de lycée dans ton sujet?

Voilà ce que j'en pense:

La première chose à faire, c'est de voir s'ils ont les bases. Combien ont suivi le cours de Proba (au moins les variables discrètes) dans le supérieur? Si moins de 30%, il faudra aussi faire le cours de proba. Est-ce qu'ils savent dériver et intégrer? Les miens, par exemple, ne savaient pas. Pourtant ils ont eu BAC ES il y a 2 ans Neutral Est-ce qu'ils ont suivit le cours de stats descriptives?

Quant à au contenu:
0.1) Statistiques descriptives s'ils n'ont jamais fait. Sinon pas la peine de faire les rappels.
0.2) Probabilités discrètes (surtout les notions d'espérance, variance, lois usuelles et paramètres des lois, fonction de masse/densité, fonction de répartition)
0.3) Si c'est utiles dans leurs profession, tu peux parler de l’échantillonnage.

1) Rappel: lois usuelles et surtout la loi Normale. Quelques exercices calculatoires pour la loi normale. Ici il est important de préciser la différence entre la moyenne de l'échantillon et le paramètre m de la loi normale appelé "moyenne". De même pour la variance de l'échantillon et sigma² le paramètre de la loi normale appelé "variance".
1.1) Loi normale:
--- paramètres
--- densité
--- fonction de répartition
--- loi normale centré réduite
--- utilisation des tables statistiques ou calculatrice
--- calcul de la probabilité (loi normale CR et loi normale)
--- faire l'inverse
--- retrouver les valeurs des paramètres de la loi normale si les probabilités sont données pour les intervalles des valeures

2)  Estimation: progression classique
2.1) Introduction: l'objet d'étude et présentation du vocabulaire (population, échantillon, statistique, loi de probabilité, paramètres des lois...)
2.2) Estimation ponctuelle: moyenne, variance, proportion (paramètres des lois, s'ils arrivent à suivre). Le critère de qualité d'estimation (risque quadratique), biais et convergence. La notion du biais est très importante à mon avis. Bien évidement parler de la variance corrigée.
2.3) Estimation par l'intervalle de confiance (c'est une estimation!): des paramètres de la loi normale (moyenne et variance) et le paramètre p de la loi Binomiale (proportion ou fréquence). J'insiste sur le mot paramètre, parce qu'ils mélangent paramètres et les statistiques et du coup ne savent pas quel IC prendre pour la moyenne. Ici il faudra aussi présenter la loi de Student.
2.4) Régression linéaire et MCO (sans aller  trop dans les détails).

3) Tests (à toi de voir si tu fais les tests unilatéraux). Il faut aussi décider s'ils calculent tout ou tu leur donne les résultats avec les p-values et ils les interprètent.
3.1) Grands principes (en faisant le moins de théorie possible) et le vocabulaire
3.2) Test de la moyenne (càd m de la loi normale) en faisant le lien avec l'intervalle de confiance et le test de Student.
3.3) Test de la variance
3.4) Test des échantillons appareillés, test de Fisher et introduire la loi de Fisher
3.5) Test de la proportion
3.6) Tests de Chi-2 (indépendance, ajustement etc)

Comme ils ont un niveau faible, pas la peine d'aller plus loin à mon avis. C'est assez dense pour 20h.

PS pas la peine de parler de l'intervalle de fluctuation! C'est très très peu utilisé dans la pratique.

Merci pour ta réponse, je trouve ta progression interessante mais il ya des choses qui me semblent encore un peu compliqué pour eux et puis moi c'est QHSE non en eco tu penses qu'on peut faire le même programme ? Je pense qu'il y a beaucoup de points communs sans doute mais il y aura des choses différentes.

A vrai dire si tu as une base de données d'exercices dans n'importe quel domaine en statistique je suis preneur.
avatar
ben2510
Érudit

Re: Progression en stats QHSE

par ben2510 le Jeu 23 Aoû 2018 - 21:59
Tu peux regarder dans les sujets de BTS, il y a dans les programmes de BTS une partie statistiques inférentielles plus ou moins importante suivant les séries.

https://www.apmep.fr/-BTS-316-sujets-

Les sujets sont en pdf et en latex, il faudra certainement faire un peu de tri, et réécrire les exercices qui sont souvent beaucoup trop guidés !

_________________
On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n'est pas plus une science qu'un tas de pierres n'est une maison. Henri Poincaré  La notion d'équation différentielle est le pivot de la conception scientifique du monde. Vladimir Arnold
avatar
verdurin
Habitué du forum

Re: Progression en stats QHSE

par verdurin le Ven 24 Aoû 2018 - 0:07
Bonsoir,
une des nouveautés des programmes de lycée est l'introduction des intervalles de fluctuations, c'est quasiment directement une idée basée sur les tests.
Je m'étais déjà demandé si il ne serait pas plus logique d'étudier les tests avant les estimations.
L'avantage étant que les intervalles de confiances au seuil de risque a ont alors une définition simple : c'est l'ensemble des valeurs qui passent le test avec comme hypothèse nulle la valeur observée.
Et, d'un point de vue conceptuel, la notion de test me semble plus simple sue celle d'intervalle de confiance.

Ceci étant dit, je n'ai jamais appliqué ce genre de plan en cours. Le poids de la tradition n'est pas négligeable.

_________________
Contre la bêtise, les dieux eux mêmes luttent en vain.
Ni centidieux, ni centimètres.
avatar
cassiopella
Niveau 7

Re: Progression en stats QHSE

par cassiopella le Ven 24 Aoû 2018 - 12:58
@ben2510, merci pour l'explication, je t'ai mal compris. J'ai mentionné le problème de compréhension, parce que pour nous (les matheux ou les gens avec expérience) tout est logique. Alors que les étudiants ont parfois des réflexions et une logique inattendues. Et dans le cas du choix du bon IC ou test certains se plantent.
Je pense que je vais utiliser ton exemple (un peu adapté) comme l'introduction en cours.

@Emre.leo, le fondement mathématiques des stats inférentielles sont les mêmes pour tous. La progression est plutôt classique:
1) Rappels probas
2) Estimations: ponctuelle, maximum de vraisemblance, IC, moments
3) Tests dont la détermination de la région critique de Neyman-Pearson en utilisant les vraisemblances, la théorie des tests puis les applications en commençant par les tests basiques (Student, Fisher, Chi-2).
Ma progression est chargée si on aborde, explique et démontre toute la théorie en cours. Je ne l'ai pas fait. On n'a pas le temps et 95% n'ont pas le niveau pour comprendre. Pour les tests c'était:
1) Principes généraux et lien avec IC
2) Une sorte d'algo en 5 étapes pour effectuer le test statistique:
--- Lire l'énoncé et poser les hypothèses H0 et H1 et en déduire quel test il faut utiliser.
--- Quel est le risque alpha?
--- Étant données les hypothèses, quelle statistique du test faut-il utiliser et quelle loi suis cette statistique sous H0?
--- En utilisant la statistique du test calculer la région du rejet de H0.
--- Décider rejeter H0 ou ne pas rejeter, puis conclure.
Si tu veux, je peux te donner un exemple.

Quant aux contenu, exemples et points importants à mentionner: cela dépend des filières et du niveau des élèves. Ma progression est fait pour ceux qui vont continuer en L3 éco et auront l'économétrie. Il faut que tu adaptes les choses. J'imagine que tu ne connais pas le secteur QHSE? Dans ce cas il faut demander aux statisticiens qui travaillent dans ce secteur comment orienter le cours. Est-ce que tu as accès à l'ancien cours et les exos/contrôle qui ont été fait par ton prédécesseur? Si tu sais que par la suite ils vont utiliser le logiciel XXXX, tu peux donner les exemples de sorties pour les tests en demandant de les interpréter.

J'ai aussi trouver une description du cours CNAM pour HSE:
Statistiques descriptives pour la santé-sécurité au travail et l'environnement : éléments de probabilité et lois usuelles, indicateurs numériques et représentations graphiques des données.

Statistique inférentielle pour la santé-sécurité au travail et l'environnement : estimation ponctuelle et intervalles de confiance, tests d'hypothèse (interprétation des résultats et pratique des tests usuels), corrélation et régression linéaire.

Tous les exemples sont pris dans le domaine de la sécurité sanitaire professionnelle et environnementale.

@Emre.leo a écrit:Bien sur que l'exercice est un peu compliqué mais en finalité j'aimerais qu'ils sachent faire ce genre d'exercice. Ce n'est pas donné pour l'instant d'après les propos de la responsable.
A mon avis c'est impossible en 40h. Pour faire ce genre d'exercice il faut maitriser le sujet étudié ET tous les outils statistiques qui sont nécessaires.

@verdurin, la notion pédagogique de l'intervalle de fluctuation peut être utilisée pour définir et expliquer les tests, mais pas l'intervalle de confiance. Pour moi c'est illogique, parce que IC est prérequis pour faire les tests. En plus les tests ne sont pas toujours bilatéraux...
Quant au programme de statistiques et proba au lycée, il est complétement absurde furieux J'aimerais bien savoir qui a eu l'idée folle de faire IC au lycée sans définir ce que c'est réellement en survolant les probas...

_________________
Moi et l'orthographe, nous ne sommes pas amis. Je corrige les erreurs dès que je les vois. Je m'excuse pour celles que je ne vois pas...
avatar
ben2510
Érudit

Re: Progression en stats QHSE

par ben2510 le Ven 24 Aoû 2018 - 14:03
Pour ton algo en cinq étapes, j'ai tendance à rajouter une "étape zéro", qui correspond à des statistiques descriptives, y compris éventuellement des représentations graphiques, pendant laquelle on se demande quelles sont les variables, et quel est leur type (numérique vs qualitatif).

Cette partie descriptive permet de voir quelles hypothèses de travail on peut poser (=hypothèses alternatives, ce qu'on veut prouver).

Dès que les données sont présentées sans effort particulier, ce qui se passe en général dans la vie réelle, certains étudiants lisent de travers ces données !
Par exemple, si tu cherches l'effet de différents produits sur le pH,
A 6,3 5,7 6,8 7,1 6,6
B 8,1 7,4 6,9 7,7
C 7,2 7,1 7,4 7,3
certains étudiants pensent qu'il y a trois variables !

La méthode que j'utilise est celle de la "fiche en carton" : pour chaque individu, ici pour chaque mesure de pH, on remplit une petite fiche cartonnée, et pour un jeu de données particulier elles sont toutes sur le même modèle.
Ici cela ressemblerait à :
Date ....
Technicien ayant effectué la mesure ......
Produit utilisé A B C (entourer le produit)
pH mesuré ....

Cela permet de voir que les deux variables pertinentes sont :
* le produit utilisé, A ou B ou C, c'est une variable catégorielle/nominale/qualitative
* le pH mesuré, c'est une variable numérique/quantitative

(et ici on pourrait penser à une ANOVA).

_________________
On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n'est pas plus une science qu'un tas de pierres n'est une maison. Henri Poincaré  La notion d'équation différentielle est le pivot de la conception scientifique du monde. Vladimir Arnold
avatar
verdurin
Habitué du forum

Re: Progression en stats QHSE

par verdurin le Ven 24 Aoû 2018 - 21:40
@cassiopella je suis d'accord avec toi sur les programme de lycée.
Mais pas du tout quand tu dis que les intervalles de confiances sont un prérequis pour faire des tests statistiques.
Où est-il indispensable de de connaître les intervalles de confiances pour construire un test sur une moyenne  (à partir d'une population normale) ?

En fait on peut définir facilement les intervalles de confiances à partir des tests ( ou des intervalles de fluctuations ).
Une valeur u est dans l'intervalle au seuil de confiance 1-a si un test bilatéral au seuil de risque a ne rejette pas l'hypothèse « le paramètre est égale à u ».

Et j'aimerais savoir comment tu définis un intervalle de confiance de façon générale.

_________________
Contre la bêtise, les dieux eux mêmes luttent en vain.
Ni centidieux, ni centimètres.
avatar
Kimberlite
Fidèle du forum

Re: Progression en stats QHSE

par Kimberlite le Jeu 13 Sep 2018 - 10:15
Bonjour,
Quel est l'objectif de ce cours? Est-ce qu'il est de former des gens à faire des tests et être des "statisticiens" dans leur domaine, ou est-ce plutôt de leur faire comprendre la "philosophie" des statistiques qu'ils devront un peu manipuler dans leur futur métier?

Pour moi, ce sont des approches assez différentes: si l'objectif est "mathématique/spécialiste" il faut aller dans le détail, démontrer les formules, demander aux élèves de les apprendre, d'apprendre par cœur que si N est grand, telle loi approche telle loi, etc...
C'était l'approche de mes supers profs de proba et stat de première année de DEUG, et ça m'a donné de bonnes bases, mais ça prend beaucoup d'heures et je pense que la majorité des élèves n'ont tout bonnement rien compris (on utilisait différentes tables imprimées pour calculer le risque alpha et les intervalles de confiance...), à part que c'était des maths et que c'était difficile. D'ailleurs, on en était un peu au même résultat durant mon DEA avec certains de mes profs (quand on a vu les statistiques multivariées).

Si l'objectif est plutôt d'avoir de bonnes bases de compréhension de "qu'est-ce que c'est un test paramétrique", pourquoi on fait comme ça, etc... là il ne faut pas surcharger de formules, mais travailler vraiment sur l'approche (beaucoup utiliser les représentations graphiques, personnellement c'est ça qui était le plus clair pour moi): d'où vient la loi Normale et pourquoi est-elle valable dans de nombreux champs d'applications/ lien avec le théorème central limite. Qu'est-ce que c'est, une densité de probabilité? Evidemment il faudra une compréhension de ce que c'est que l'intégration. Ceci dit, pour moi, ce sont les statistiques qui ont "illuminé" ma compréhension de ce qu'était une intégrale. Un fois la loi normale comprise, passage à d'autres lois et montrer que, dans certaines conditions, on peut approcher une autre loi quand par exemple n augmente.

Ne pas oublier de parler du risque bêta, trop souvent oublié et pourtant important.

Personnellement, je ne vois pas l'intérêt de voir trop de types de tests: les étudiants ont souvent tendance à apprendre ça comme des "recettes" et ensuite à les utiliser sans avoir de recul (et ça se retrouve chez pas mal de chercheurs ensuite, et du coup dans des publications scientifiques. On voit par exemple énormément de tests de Chi-2 là où il faudrait utiliser le test exact de Fisher, qui actuellement, avec les moyens informatiques, ne pose plus trop de problèmes). Il me semble surtout important de comprendre qu'un test ne se fait que quand on s'est assuré qu'on est dans les conditions pour le faire (indépendance ou pas des variables, respect de la loi sur laquelle il repose, compréhension de ce qu'est la robustesse d'un test).

Parler aussi rapidement des tests non paramétriques, ou semi-paramétriques (genre modèle de Cox) pour que les élèves sachent que ça existe (bon, peut-être pas la peine de faire des stats Bayésiennes, quand même).

Donner des exemples concrets, évidemment, et surtout des exemples d'erreurs (je le redis, beaucoup de scientifiques bricolent avec les stats sans bien comprendre ce qu'ils manipulent... certaines erreurs statistiques laissent des traces dans le temps et même la société, comme l'effet Mc Clintock).

Pour les stats descriptives, ça devrait être acquis, mais ça peut valoir le coup de faire quelque chose sur les représentations graphiques (boxplots, etc...).

Est-ce qu'il y aura en complément des travaux pratiques (et en as-tu la charge)?
Est-ce que tu penses utiliser un programme de statistiques dans le cadre de ton cours? (J'ai travaillé avec R: on trouve beaucoup d'aide et de support, ça permet de faire plein de belles choses... j'aimais beaucoup certains supports pour les biostatistiques disponibles sur le site de l'Université Lyon II https://pbil.univ-lyon1.fr/R/ C'est vraiment une mine pour récupérer des jeux de données et des exemples).

Cordialement,
K
PS: j'ai oublié de parler des régressions et corrélations... zut, 40 heures, c'est vraiment peu... dans le contexte actuel où les corrélations sont généralement mal comprises, il me semble aussi important de faire passer le message que corrélation et causalité sont deux choses différentes (on doit pouvoir retrouver un joli jeu de données montrant une corrélation entre le nombre de naissances en Alsace et la natalité Smile . Il y a évidemment aussi l'excellent site : http://www.tylervigen.com/spurious-correlations ).
PS2: totalement d'accord avec vous sur le programme de lycée... dans l'absolu, je ne trouvais pas débile de faire une introduction aux probas et stats, vu leur importance en sciences mais aussi la façon dont elles sont détournées (notamment par les médias et les politiques), mais quand une personne de ma famille qui est prof de maths m'a raconté la façon dont c'était abordé, je me suis dit que c'était pire que tout...

_________________
Spoiler:
Contenu sponsorisé

Re: Progression en stats QHSE

par Contenu sponsorisé
Voir le sujet précédentRevenir en hautVoir le sujet suivant
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum