I) Les lois de probabilités


1) Introduction

Une variable aléatoire `x` désigne concrètement une suite de valeurs correspondant à des tirages au sort successifs `bbx_1, bbx_2, bbx_3..., bbx_"k"...` Cela constitue une fonction de tirage, c'est à dire une fonction de l'ensemble des entiers vers l'ensemble d'arrivé de `x`, noté `Dom(x)` qui représente l'ensemble des valeurs envisagables pour `x`, et qui constitue le domaine de définition de la loi de probabilité de `x`. On dira que la variable aléatoire est définie sur cet ensemble `Dom(x)`.

On peut choisir un ensemble fini de `"n"` valeurs comme ensemble de valeurs envisageables pour la variable `x`, que l'on ramène par dénombrement à l'ensemble des `"n"` premiers entiers. `Dom(x) = {0,1,2,3...,"n"-1}`. Dans ce cas `x` est une variable aléatoire discrète.

On peut choisir un ensemble infini de valeurs comme ensemble de valeurs envisageables pour la variable `x`. Mais on ne retiendra alors que des structures différentiables afin de pouvoir utiliser la notation différentielle trés pratique pour les physiciens, et on ne retiendra que des structures connexes ouvertes et bornés tels des boules dans un espace métrique. Pour un espace réel à une dimension, ces boules correspondent aux intervalles bornés, que l'on ramène par changement de variable à l'intervalle `]0, "n"[`. Dans ce cas `x` est une variable aléatoire continue.

On s'intéresse aux variables aléatoires définie sur des ensembles finis ou bien des espaces connexes ouverts différentiables et bornés, et aux lois absolument continues (c'est à dire dérivables à droite et à gauche). Ainsi on évite les infinis. On établit un parallèle entre le cas discret et le cas continu. Dans le cas discret, la variable `x` est définie sur l'ensemble des `"n"` premiers entiers `Dom(x) = {0,1,2,3...,"n"-1}`. Et dans le cas continu, la variable `x` est définie sur l'intervalle réel `Dom(x) = ]0, "n"[`. On considérera plus tard des variables aléatoires mixtes, somme d'une variable aléatoire de loi absolument continue et d'une variable aléatoire discrète. Et dans ce cas le domaine de définition standard sera `Dom(x) = [0, "n"[`. (Le paramètre `"n"` est conservé dans la perspective d'approximation de la variable aléatoire continue par une variable aléatoire discrète.)

Le concept de tirage au sort doit être interprété ici comme l'affirmation d'une totale indépendance entre les tirages successifs. Cet unique principe, dit d'indépendance des tirages successifs, non encore formalisé et aux conséquences innombrables, préside à la définition des lois de probabilité à tirages indépendants que nous étudions ici.

2) Notations

L'esprit humain est limité et ne peut pas prendre pleinement conscience d'une proposition contenant trop de paramètres. La formulation se trouve noyées dans les détails, c'est pourquoi il faut mettre en oeuvre des typages et contextes puissants qui permettent de se libérer de la profusions des détails et de ne retenir que l'essentiel. Cela passe par une économie minutieuse du nombre de variables explicites, et par une intégration efficace des dépendances et analogies dans la notation même.

Dans certain cas `"x"` fait référence à une variable aléatoire, dans d'autre cas `"x"` désigne un paramètre libre parcourant les valeurs envisageables de la variable `"x"`, et dans d'autre cas encore `"x"` désigne la valeur d'un tirage de la variable `"x"`.

Pour éviter les ambiguïtés sans démultiplier les variables, on autorise une convention d'écriture. Les variables aléatoires prisent dans leur globablité serons notées en italique, `x`, tandis que la valeur d'un tirage d'une variable sera notée avec la même lettre mais en gras, `bbx`, et un paramètre parcourant les valeurs enivisageables de la variable sera écrit en normal, `"x"`. Par exemple dans les expressions `Dom(x)`,   `bbx"=x"`  et  `bbx"∈"]"x", "x"+d"x"[`, le symbole `x` désigne une variable aléatoire, les symboles `"x"` et `d"x"` désignent un paramètre libre et sa variation infinitésimale, évoluant dans le domaine de définition de la variable `x`, et le symbole `"bbx` en caractère gras désigne le résultat d'un tirage de la variable aléatoire `x`. Mais cette convention n'est pas obligatoire, elle n'est là que pour lever des ambiguités qui n'auraient pas été levées par le typage ou le contexte. Puis on s'efforcera dans les légendes de préfixer les variables aléatoires du mot Variable afin de bien les mettre en évidence.

Un évènement est une condition logique vrai ou fausse qui se manifeste à chaque tirage. Etant donné une variable aléatoire continue `x` que l'on appellera, Variable `x`, et étant donné une valeur `"x"` qui est un paramètre, l'évènement `bbx = "x"` se réalise si et seulement si lors du tirage, la valeur du tirage de la variable `x` est égale à la valeur `"x"`. Et l'évènement `bbx "∈" ]"x", "x"+d"x"[` se réalise si et seulement si lors du tirage, la valeur du tirage de la variable `x` est comprise entre `"x"` et `"x"+d"x"` `"x"` représente un paramètre libre et où `d"x"` représente une variation infinitésimale du paramètre `"x"`. On utilise la même lettre pour désigner la variable aléatoire, le tirage d'une variable aléatoire et pour désigner un paramètre libre, avec quelque fois du gras ou de l'italique pour rappeller le rôle conféré.

L'évènement `bbx"=x"` se réalise quand le résultat du tirage de la variable `x` est égale à la valeur du paramètre `"x"`. De même, l'évènement `(bbx"x")^2+ bbx"x" + 1 = 0` se réalise si le résultat du tirage de la variable `x` produit une valeur `"h"` vérifiant `("h""x")^2 + "h""x" + 1 = 0``"x"` désigne ici un paramètre libre appartenant à `Dom(x)` et non la variable `x`.

Si on doit distinguer plusieurs tirages, on les numérote en indice. Un évènement devient alors une condition logique qui se manifeste sur un ensemble de tirages. L'évènement `bbx_1"=" bbx_2` se réalise quand lors de deux tirages successifs de la variable `x`, les deux tirages produisent une même valeur. D'après le principe d'indépendance des tirages, ces tirages ne sont pas nécessairement successifs, ils peuvent être séparés selon n'importe quel critère non discriminant.

La portée d'un symbole intégrateur ( `sum` ou `prod` ou `int`) se prolonge tout au long de la ligne jusqu'à la fermeture d'une parenthèse ouverte avant le symbole intégrateur ou bien, si c'est une somme, jusqu'à la rencontre d'une addition au premier niveau et, si c'est un produit jusqu'à la rencontre d'un produit au premier niveau, l'expression sur lequel porte le symbole somme étant considéré comme un produit et l'expression sur lequel porte le symbole produit étant considéré comme une somme. Par convention, l'égalité qui suit juste après un symbole intégrateur ( `sum` ou `prod` ou `int` ) et qui est notée en indice, définie une variable d'intégration. La définition précédente de la variable de même nom est alors masquée. Pour y faire référence on adopte la convention suivante : on utilise l'anticote ` comme préfixe, pour référencer la variable à sa définition parente. Par exemple considérons l'expression suivante :

`g("x") = int_"x=0"^"x" \`"xx"d"x"`

L'égalité `"x"=0` à `"x"`, définie une variable d'intégration `"x"` variant de `0` à `"x"`. Noter alors que le deuxième symbole `"x"` (en haut) utilisé pour définir la borne finale de cette variable d'intégration ne fait pas référence à la variable d'intégration car celle-ci n'est pas encore définie mais fait référence à la définition parente qui indique que `"x"` est l'argument de `g`. Après cette égalité, la variable d'intégration `"x"` est définie, et tout symbole `"x"` qui suit dans la porté du symbole d'intégration, fera référence à la variable d'intégration, sauf s'il est préfixé d'une anticote, auquel cas il fera référence à la définition parente. Ainsi par exemple, nous avons :

`g("x") = int_"x=0"^"x" \`"xx"d"x"`
`g("x") = "x"int_"x=0"^"x""x"d"x"`
`g("x") = "x"[x^2/2]_("x"=0)^"x"`
`g("x") = "x"^3/2`

L'égalité `g("x") = int_"x=0"^"x" \`"xx"d"x"` est équivalente à l'égalité `g("x") = int_"y=0"^"x""xy"d"y"`.

L'usage de l'anticote permet d'éviter de démultiplier les noms de variable.

Autre convention, lorsque l'on manipule une variable aléatoire discrète `x` définie sur un ensemble de valeurs `Dom(x) = "A"`, les sommes utilisant `"x"` comme variable de sommation et qui ne mentionnent pas de domaine de sommation, auront comme domaine de sommation par défaut le domaine de `x`.

`sum_"x"`  signifie  `sum_("x" in "A")`

Et si le domaine de `x` est standardisé en `"A"={0,1,2,3...,"n"-1}` cela correspondra à :

`sum_"x"`  signifie  `sum_("x" = 0)^("n"-1)`

Et, le domaine étant valable par défaut, une condition peut être mise en indice pour désigner seulement une partie du domaine. Par exemple :

`sum_"x<1"`  signifie  `sum_("x" in "A"  "et" "x"<1)`

De même lorsque l'on manipule une variables aléatoire continue `x` définie sur un intervalle `Dom(x) = "A"`, les intégrales utilisant comme variable d'intégration `"x"` et qui ne mentionnent pas de domaine d'intégration, auront comme domaine d'intégration par défaut le domaine de `x`.

`int_"x"`  signifie  `int_("x"in "A" )`

Et si le domaine de `x` est standardisé en `"A"=]0,"n"[` cela correspondra à :

`int_"x"`  signifie  `int_("x"=0)^"n"`

Et, le domaine étant valable par défaut, une condition peut être mise en indice pour désigner seulement une partie du domaine. Par exemple :

`int_"x<1"`  signifie  `int_("x" in "A"  "et" "x"<1)`

Puis, par défaut l'intégrale intègre selon l'élément différentiel présent, faisant qu'il n'est pas besoin de rappeller la variable d'intégration mais seulement son domaine d'intégration tel que `"A"` ou `]0,"n"`[, par exemples :

`int_"A" f("x")d"x"`     ou      `int_0^"n" f("x")d"x"`

Et par défaut le domaine d'intégration sera celui de l'élément différentiel présent :

`int f("x")d"x"`

L'élément différentiel présent est `d"x"` donc le domaine d'intégration sera celui de `x`, c'est à dire `"A"`.

Lorsqu'une égalité ou une propriété fait intervenir un paramètre libre, cela signifie qu'elle s'applique quelque soit la valeur de ce paramètre prise dans son domaine de définition, par exemple :

`f("x") = P(bbx"=x")`      signifie     `AA "x" in "A",  f("x") = P(bbx"=x")`

3) Loi de probabilité discrète

A chaque évènement `e` correspond une probabilité notée `P(e)`. Notez qu'un évènement symbolisé par `e` est en fait une variable aléatoire booléenne qui à chaque tirage vaut `0` si l'évènement ne se réalise pas et `1` si l'évènement se réalise.

Lorsque `x` est une variable aléatoire discrète, la loi de probabilité de `x`, notée `f `, est une fonction de `Dom(x)` vers `[0,1]`. Cette fonction `f ` associe à chaque valeur `"x"` envisageable pour la variable `x`, la probabilité que le tirage de la variable `x` soit égale à la valeur `"x"`.

`f("x") = P(bbx"=x")`

La probabilité de l'évènement `bbx"=x"` est donnée par la loi de probabilité de `x` appliquée à `"x"`.

Loi de probabilité discrète

`f("x") = P(bbx"=x")`

`P(bbx"=x")` : Probabilité que le tirage de la variable `x` soit égale au paramètre `"x"`
`f` : Loi de probabilité de la variable `x`.
`bbx` : Tirage de la variable `x`
`"x"` : Paramètre appartenant à `Dom(x)`
Variable `x` : Variable aléatoire discrète de loi `f` définie sur `Dom(x)`
`Dom(x)` : Domaine de définition de la variable `x`. Ensemble fini.

Si la variable `x` est définie sur `{0, 1, 2..., "n"-1}` alors la loi `f` est définie par les `"n"` probabilités élémentaires `P(bbx"="0), P(bbx"="1), P(bbx"="2)..., P(bbx"=" "n"-1)` que l'on note de manière condensée `"p"_0, "p"_1, "p"_2..., "p"_("n"-1)` ou simplement par `f(0), f(1), f(2)..., f("n"-1)`. Et comme la somme des probabilités doit être égale à `1`, il suffit d'en connaître `"n"-1` pour tous les connaitre.

Une loi discrète `f` est un histogramme normé, une distribution discrète de probabilité. Par exemple, la connaissance `f(5) = 1"/"3` signifie que lors d'un tirage, la variable aléatoire a une probabilité `1"/"3` de valoir `5`.

Il existe une façon empirique de calculer cette probabilité `f("x")`, en prenant la limite lorsque le nombre de tirages tend vers l'infini, du nombre de tirages satisfaisant `bbx"=x"` divisé par le nombre totale de tirages.

Calcul empirique d'une loi de probabilité discrète

`f("x") = lim_("k"->∞) (1/"k")sum_("k"=1)^"k" (bbx_"k"=x)`

`bbx` : Tirage de la variable `x`
`(bbx_k"=x")` : vaut `1` si le `"k"`ième tirage de la variable `x` est égale au paramètre `"x"`, et vaut `0` sinon.
`"k"` : Nombre de tirages

Variable `x` : Variable aléatoire discrète de loi `f` définie sur `Dom(x)`
`Dom(x)` : Domaine de définition de la variable `x`. Intervalle.
`"x"` : Paramètre appartenant à `Dom(x)`
`f` : Loi de probabilité de la variable `x`.


4) Loi de probabilité continue

Lorsque `x` est une variable aléatoire continue et de loi absolument continue, la probabilité de l'évènement `bbx"=x"` est toujours nulle, par contre la probabilité de l'évènement `bbx "∈" ]"x", "x"+d"x"[` est égale à une probabilité infinitésimale proportionnelle à `|d"x"|`.

Ainsi la loi de probabilité de `x` proprement dite est une fonction qui associe à chaque point `"x"` une valeur infinitésimale de probabilité, qu'est la probabilité que le tirage de la variable `x` soit dans l'intervalle différentiel `]"x", "x"+d"x"[`. La loi de probabilité de `x` est :

`"x" |-> f("x")d"x"`

Tandis que la fonction `f`, définie de `Dom(x)` vers `[0, +oo[`, s'appelle la loi de densité de probabilité. Multipliée par un élément différentiel d'espace, elle donne la probabilité que le tirage de la variable `x` soit dans cet élément d'espace. Cette fonction de densité de probabilité `f` associe à chaque valeur `"x"` envisageable pour la variable `x`, une division entre deux valeurs infinitésimales. Le numérateur contient la probabilité que le tirage de la variable `x` soit dans l'intervalle `]"x", "x"+d"x"[` `"x"` est un paramètre et `d"x"` un paramètre infinitésimal. Le dénominateur contient la valeur infinitésimale `d"x"`.

`f("x") = (P(bbx "∈" ]"x", "x"+d"x"[))/(d"x")`

On adopte une convention d'écriture plus souple des intervalles sans avoir à respecter l'ordre des bornes. Ainsi nous avons par exemple `[0, 1[ = ]1, 0]`. On peut alors considérer un élément `d"x"` de signe quelconque, et définir l'intervalle `]"x", "x"+d"x"[` sans respecter l'ordre des bornes `"x"` et `"x"+d"x"`.

Loi de probabilité continue et dérivable

`f("x") |d"x"| = P(bbx "∈" ]"x", "x"+d"x"[ )`

`P(bbx"∈"]"x", "x"+d"x"[ )` : Probabilité que le tirage de la variable `x` appartienne à l'intervalle `]"x", "x"+d"x"[`
`f` : Loi de densité de probabilité de la variable `x`
`bbx` : Tirage de la variable `x`
`"x"` : Paramètres appartenant à `Dom(x)`
`d"x"` : Variation infinitésimale du paramètre `"x"`
Variable `x` : Variable aléatoire continue de loi `f` définie sur `Dom(x)`.
`Dom(x)` : Domaine de définition de la variable `x`. C'est un intervalle ouvert.

Notez que les termes de la formule sont de l'ordre de `O(d"x")` et donc que l'égalité est définie à l'ordre de grandeur prés de `O(d"x"^2)`. Notez que la formule reste valable lorsque `d"x"` est négatif grâce à l'usage de la norme `|d"x"|`, et sachant que par convention d'écriture on a `]"x", "x"-d"x"[ = ]"x"-d"x", "x"[`. Autrement dit, en prenant `d"x"` positif, nous avons :

`P(bbx"∈"]"x", "x"+d"x"[ ) = f("x")d"x"`
`P(bbx"∈"]"x", "x"-d"x"[) = f("x")d"x"`
`P(bbx"∈"]"x"-d"x", "x"+d"x"[) = 2f("x")d"x"`

Pour une loi dérivable `f` nous avons le développement de Taylor :

`f("x"+d"x") = f("x") + f'("x")d"x" + O(d"x"^2)`
`f("x"+d"x") = f("x") + O(d"x")`
`f("x"+d"x")d"x" = f("x")d"x" + O(d"x"^2)`

Et cela est une propriété des différentiels. La probabilité que le tirage ait lieu dans un même intervalle, mais translaté d'une valeur infinitésimale de l'ordre de `d"x"`, est la même, à l'ordre de grandeur `d"x"^2` prêt :

`P(bbx"∈"]"x"+d"x", "x"+2d"x"[ ) = P(bbx"∈"]"x", "x"+d"x"[ ) + O(d"x"^2)`

Considérons une variable aléatoire continue de loi `f` analytique. Par exemple, la connaissance `f(5) = 3` signifie que, lors d'un tirage, la variable aléatoire a une probabilité `3 d"x"` d'appartenir à l'intervalle `]5, 5+d"x"[`, et également une probabilité `3 d"x"` d'appartenir à l'intervalle `]5, 5-d"x"[`, et donc une probabilité `6 d"x"` d'appartenir à l'intervalle `]5-d"x", 5+d"x"[`.

Dans le cas d'une variable aléatoire mixte, somme d'une variable aléatoire continue de loi absolument continue et d'une variable discrète, la probabilité continue est complétée par une probabilité discrète qui constitue une valeur d'un ordre supérieur. La probabilité continue est de l'ordre de `O(d"x")` c'est à dire est définie à l'ordre prêt de `O(d"x"^2)`, tandis que la probabilité discrète est de l'ordre de `O(1)` c'est à dire est définie à l'ordre prêt de `O(d"x")`.

Il existe une façon empirique de calculer cette probabilité `f("x")`, en calculant la probabilité `f("x")epsilon = P(bbx "∈" ["x", "x"+epsilon[ )` comme précédement, et en prenant la limite lorsque `epsilon` tend vers zéro.

Calcul empirique d'une loi de probabilité continue

`f("x")epsilon = lim_("k"->∞) (1/"k")sum_("k"=1)^"k" (bbx_"k""∈"["x",x+epsilon[)`

`f("x") = lim_(epsilon->0) lim_("k"->∞) (1/"k") sum_("k"=1)^"k" (bbx_"k""∈"["x",x+epsilon[)`

`epsilon` : Grandeur aussi petite que l'on souhaite.
`"k"` : Nombre de tirages aussi grand que l'on souhaite.
`bbx` : Tirage de la variable `x`
`(bbx_"k""∈"["x","x"+epsilon[)` : vaut `1` si le `"k"`ième tirage de la variable `x` est dans `["x","x"+epsilon[`, vaut `0` sinon.

Variable `x` : Variable aléatoire discrète de loi `f` définie sur `Dom(x)`
`Dom(x)` : Domaine de définition de la variable `x`. Ensemble fini.
`"x"` : Paramètre appartenant à `Dom(x)`
`f` : Loi de probabilité de la variable `x`.

 

5) Variable aléatoire vectorielle

On généralise la notation différentielle pour pouvoir utiliser des variables vectorielles dans un espace orthonormé `RR^n`. Etant donné une variable vectorielle `vec "v"` de composantes `vec "v"=("x","y","z")`, on note `d vec"v"` l'élément différentiel `d vec"v"=(d"x",d"y",d"z")` et on note `vec "v" # d vec "v"` l'élément différentiel d'espace `]"x","x"+d"x"[ × ]"y","y"+d"y"[ × ]"z","z"+d"z"[` sans avoir à respecter l'ordre des bornes dans les intervalles. Et on note `Pi d vec"v"` le produits des composantes de `d vec"v"`. Nous avons :

`vec "v"=("x","y","z")`
`Pi d vec"v" = d"x"d"y"d"z"`

Ainsi `vec"v" + d vec"v"` désigne un point infiniment voisin de `vec"v"` obtenue en le déplaçant selon le vecteur `d vec"v"`, et `vec "v"#d vec"v"` désigne un voisinage cartésien de `vec "v" + d vec"v""/"2`, c'est à dire une portion infinitésimale de l'espace de centre `vec"v" + d vec"v""/"2` et de volume `|Πd vec"v"| = |d"x"d"y"d"z"|`. Le terme de volume correspond à la dimension `3`. On utilise le terme de taille ou de largeur en dimension `1`, de surface en dimension `2`, de volume en dimension `3`, et d'hypervolume en dimension supérieur. Le voisinage cartésien `vec "v"#d vec"v"` possède une quantité d'espace, un hypervolume, égale à la norme du produit des composantes de `d vec"v"` qui se note `|Πd vec"v"|`.

Dans le cas à une dimension, pour une variable aléatoire `x`, pour toute valeur `"x"` appartenant à `Dom(x)`, nous avons :

`"x"#d"x" = ]"x", "x"+d"x"[ `

La loi de probabilité se formule de façon générale pour une variable aléatoire vectorielle continue `vec v` de composantes scalaires `vec v=(x,y,z)`. Chaque composante `x,y,z` constitue une variable aléatoire.

Loi de probabilité continue vectorielle

`f(vec "v")|Πd vec"v"| = P(vec bbv "∈" vec "v"#d vec"v")`

`f("x","y","z")|d"x"d"y"d"z"| = P((bbx, bby, bbz) "∈" ]"x","x"+d"x"[×]"y","y"+d"y"[×]"z","z"+d"z"[)`
`f("x","y","z")|d"x"d"y"d"z"| = P(bbx "∈" ]"x","x"+d"x"[  "et"  bby "∈" ]"y","y"+d"y"[  "et"  bbz "∈" ]"z","z"+d"z"[)`


`P(vec bbv "∈A")` : Probabilité que le tirage de la variable `vec v` appartienne à l'ensemble `"A"`
`vec"v"#d vec"v"` : Voisinage cartésien de centre `vec"v" + d vec"v""/"2` et de volume `|Pi d vec"v"| = |d"x"d"y"d"z"|`
`vec "v"` : paramètre vectoriel de composante `vec"v"=("x","y","z")` et appartenant à `Dom(vec v)`
`d vec"v"` : paramètre vectoriel infinitésimale de composante `d vec"v"=(d"x",d"y",d"z")`
`|Pi d vec"v"|` : volume infinitésimale. `|Pi d vec"v"| = |d"x"d"y"d"z"|`
`f ` : Loi de densité de probabilité de la variable `vec v`
`f(vec"v")` : Densité de probabilité au point `vec "v"`
`vec bbv =(bbx,bby,bbz)` : Tirage de la variable vectoriel `vec v`
`"x", "y", "z"` : Paramètres tel que `("x","y","z") in Dom(vec v)`
`d"x", d"y", d"z"` : Valeurs infinitésimales réels.
Variable `vec v` : Variable aléatoire continue vectorielle de loi `f`
Variable `x` : Première composante de la variable aléatoire `vec v`
Variable `y` : seconde composante de la variable aléatoire `vec v`
Variable `z` : Troisième composante de la variable aléatoire `vec v`
`Dom(vec v)` : Domaine de la variable aléatoire `vec v`

`f(vec "v")` est la densité de probabilité de la variable `vec v` au point `vec"v"`, et `f(vec "v") |Pi d vec"v"|` est la probabilité que le tirage la variable `vec v` soit dans le volume `vec "v"#d vec"v"`.

Par convention, on simplifie l'écriture en `f("(" "x","y","z" ")" ) = f("x","y","z")`.

6) Fonction cumulative

Dans la notation française que nous utilisons, la fonction cumulative de la variable aléatoire `x`, notée `F`, est définie comme étant la probabilité d'obtenir un tirage strictement inférieur à `"x"`.

Fonction cumulative

`F("x") = P(bbx"<x")`

`P(bbx"<x")` : Probabilité que le tirage de la variable `x` soit inférieur strictement au paramètre `"x"`.
`F` : Fonction cumulative de la variable `x`
`bbx` : Tirage de la variable aléatoire `x`
`"x"` : Paramètre.
Variable `x` : Variable aléatoire.
`Dom(x)`: Domaine de définition de la variable `x`.

Toute fonction croissante `F`, définie de `Dom(x)` vers `[0, 1]`, est une fonction cumulative et donc permet de définir une loi de probabilité.

Dans le cas d'une variable aléatoire discrète `x` définie sur `{0, 1, 2, 3..., "n"-1}` et de loi `f`, sa fonction cumulative `F` se calcule comme suit :

`F("x") = P(bbx"<x")`
`F("x") = P(bbx"="0) + P(bbx"="1) + P(bbx"="2)... + P(bbx"=" "x"-1)`
`F("x") = f(0) + f(1) + f(2)... + f("x"-1) `
`F("x") = sum_("x"=0)^("x"-1) f("x")`

Le pas de la fonction cumulative donne la loi de probabilité : `f("x") = F("x"+1) - F("x")`

Et dans le cas d'une variable aléatoire continue `x` définie sur `]0, n[` et de loi `f`, sa fonction cumulative `F` se calcul comme suit :

`F("x") = P(bbx"<x")`
`F("x") = int_0^"x" P(bbx "∈" ["x", "x"+d"x"[ )`
`F("x") = int_0^"x" f("x")d"x"`

Le différentiel de la fonction cumulative donne la loi de probabilité : `dF("x") = F("x"+d"x")-F("x") = f("x")d"x"`

La dérivé de la fonction cumulative donne la loi de densité de probabilité : `F'("x") = (dF("x"))/(d"x") = f("x")`

La fonction cumulative est appelée la primitive, l'intégrale ou la somme de la loi.

Par convention on étend le domaine de définition de `F`, et nous avons `F(0) = 0` et `F("n") = 1`.

La fonction cumulative peut se calculer de manière empirique en prenant la limite lorsque le nombre de tirages tend vers l'infini, du nombre de tirages satisfaisant `bbx"<x"` divisé par le nombre totale de tirages.

`F("x") = lim_("k"->∞) (1/"k")sum_("k"=1)^"k" (bbx_"k"<x)`

Fonction cumulative d'une variable discrète `x` de domaine `{0, 1, 2..., "n"-1}`

`F("x")  =  P(bbx"<x")  =  sum_("x"=0)^("x"-1) f("x")`

`f("x") = F("x"+1) - F("x")`

`P(bbx "∈" ["a","b"[) = F("b")-F("a")`


`P(bbx "∈" ["a", "b"[)` : Probabilité que le tirage de la variable `x` appartienne à `["a","b"[`
`f `: Loi de probabilité de la variable `x`
`F` : Fonction cumulative de la variable `x`
`bbx` : Tirage de la variable aléatoire `x`
`"x", "a", "b"` : Paramètres entiers
Variable `x` : Variable aléatoire continue définie sur `{0, 1, 2, 3..., "n"-1}`

Fonction cumulative d'une variable continue `x` de domaine `]0,"n"[`

`F("x")  =  P(bbx"<x")  =  int_0^"x" f("x")d"x"`

`f("x") = F'("x")`

`P(bbx "∈" ["a", "b"[ ) = F("b")-F("a")`


`P(bbx "∈" [a, b[)` : Probabilité que le tirage de la variable `x` appartienne à l'intervalle `[a, b[`
`f` : Loi de densité de probabilité de la variable `x`
`F` : Fonction cumulative de la variable `x`
`bbx` : Tirage de la variable aléatoire `x`
`"x", "a", "b"` : Paramètres réels.
Variable `x` : Variable aléatoire continue définie sur `]0, n[`

Dans le cas d'une variable aléatoire vectorielle `(x,y)` la fonction cumulative `F` est définie comme étant la probabilité d'obtenir un tirage dont la première composante est strictement inférieur à `"x"` et la seconde composante est strictement inférieur à `"y"`.

Fonction cumulative d'une variable discrète vectorielle `(x,y)`

`F("x","y") = P(bbx"<x" "et" bby"<y")`

`F("x","y") = sum_("x"<"x") sum_("y"<"y") f("x","y")`

`f("x","y") = P(bbx"=x" "et" bby"=y")`

`P(bbx"<x")` : Probabilité que le tirage de la variable `x` soit inférieur strictement au paramètre `"x"`.
`P(bbx"<y")` : Probabilité que le tirage de la variable `y` soit inférieur strictement au paramètre `"y"`.
`F` : Fonction cumulative de la variable `(x,y)`
`f `: Loi de probabilité de la variable `(x,y)`
`(bbx,bby)` : Tirage de la variable aléatoire `(x,y)`
`"x", "y"` : Paramètres.
Variable `(x,y)` : Variable aléatoire.

 

7) Les fractiles

La fonction inverse `F^(-1)` donne les fractiles. Le fractile `"x"` d'ordre `alpha` est `"x" = F^(-1)(alpha)`, c'est la valeur `"x"` tel quel la probabilité d'un tirage inférieur à `"x"` soit égale à `alpha` :

`P(bbx<"x") = alpha`

Le fractile peut ne pas être unique et constituer un intervalle.

Le fractile d'ordre `alpha` de la variable `x` se note parfois `"x"_alpha`.

Le fractile d'ordre `1"/"2` s'appelle la médiane.

Le fractile d'ordre `1"/"4` s'appelle le premier quartile.

Le fractile d'ordre `3"/"4` s'appelle le troisième quartile.

Les fractiles d'ordre `"k/"10` avec `"k"` entier compris entre `1` et `9` définissent les déciles.

Les fractiles d'ordre `"k/"100` avec `"k"` entier compris entre `1` et `99` définissent les centiles.

8) Moment d'odre zéro

La somme des probabilités de chaque valeurs possibles est appelée le moment d'ordre zéro `mu_0` et vaut par principe `1`. Une loi de probabilité est toujours normée ainsi à `1`.

Toute fonction définie de `"X"` vers `[0, +oo[`, dont la somme existe et est finie, et que l'on divise par sa somme, constitue une loi de probabilité. Autrement dit, dans le cas discret, toute fonction définie de `{0, 1, 2..., "n"-1}` vers `[0, +oo[` dont la somme converge vers une valeur finie, et que l'on divise par cette valeur, constitue une loi de probabilité, et dans le cas continue, toute fonction définie de `]0, n[` vers `[0, +∞`[ dont l'intégrale converge vers une valeur finie, et que l'on divise par cette valeur, constitue une loi de probabilité.

Dans le cas d'une variable aléatoire discrète `x` définie sur `{0, 1, 2, 3..., "n"-1}` et de loi `f`, le moment d'ordre zéro s'écrit comme suit :

`mu_0 = P(bbx"="0) + P(bbx"="1) + P(bbx"="2)... + P(bbx"=" "n"-1)`
`mu_0 = f(0) + f(1) + f(2)... + f("n"-1)`
`mu_0 = sum_"x" f("x")`

Et dans le cas d'une variable aléatoire continue `x` définie sur `]0, n[` et de loi `f`, le moment d'ordre zéro s'écrit comme suit :

`mu_0 = int_"x" P(bbx "∈" ]"x", "x"+d"x"[ )`
`mu_0 = int_"x" f("x")d"x"`

Par principe, la loi de probabilités est normée à `1`, autrement dit le moment d'ordre zéro vaut `1`

`mu_0 = 1`

9) La moyenne

Il existe deux façons de définir la moyenne, une façon intérieure calculant `mu_1`, en sommant les valeurs possibles de `x` multipliées par leur probabilitées respectives, ou une façon extérieur et empirique calculant la moyenne `"<"x">"`, en prenant la limite lorsque le nombre de tirage tend vers l'infini de la somme des valeurs de chaque tirage divisé par le nombre de tirages. Les deux procédés donnent le même résultat qu'est la moyenne appelée moment d'ordre un, `mu_1`.

Dans le cas d'une variable aléatoire discrète `x` définie sur `{0,1,2,3...,"n"-1}` et de loi `f`, cela s'écrit comme suit :

`mu_1 = 0"*"P(bbx"="0) + 1"*"P(bbx"="1) + 2"*"P(bbx"="2)... + ("n"-1)"*"P(bbx"=" "n"-1)`
`mu_1 = 0"*"f(0) + 1"*"f(1) + 2"*"f(2)... + ("n"-1)"*"f("n"-1)`
`mu_1 = sum_"x" "x"f("x")`

Et dans le cas d'une variable aléatoire continue `x` définie sur `]0, n[` et de loi `f`, cela s'écrit comme suit :

`mu_1 = int_"x" "x"P(bbx "∈" ]"x", "x"+d"x"[ )`
`mu_1 = int_"x" "x"f("x")d"x"`

La moyenne est ce sur quoi converge la somme de `"k"` tirages divisée par `"k"` lorsque `"k"` tend vers l'infini. On note `bbx_"k"` la valeur du `"k"`ième tirage de la variable `x`.

`"<"x">" = lim_("k"->∞) (1/"k")sum_("k"=1)^"k" bbx_"k"`

Les valeurs possibles de `x` étant bornées et les tirages étant indépendants entre-eux, cette limite doit converger quelque soit la loi de probabilité de `x`. Ces deux conditions que sont l'existance d'une borne sur les valeurs envisageables de `x` et l'indépendances des tirages entre-eux, sont suffisantes pour garantir la convergence de la moyenne empirique.

Parcontre s'il n'y a pas d'indépendance entre les tirages, il est facile de construire une fonction de tirage `x` dont la moyenne empirique ne converge pas. Il suffit de prendre comme tirages, la valeur `0` pour les tirages numéros `2^(2"n")` à `2^(2"n"+1)-1` et la valeur `1` pour les tirages numéros `2^(2"n"+1)` à `2^(2"n"+2)-1` pour tout `"n"` entier. La divergence de la moyenne empirique `"<"x">"` nécessite, soit des valeurs non bornées pour la variable `x`, ou soit une dépendance entre les tirages consécutifs.

Il existe deux façons de calculer la moyenne, une façon intérieure calculant le moment d'ordre un, `mu_1`, et une façon extérieur dite empirique calculant la moyenne `"<"x">"`. Les deux procédés donnent le même résultat.

`mu_1 = "<"x">"`

La moyenne de `x` est quelque fois notée `m` ou `m_x`, ou encore `E(x)`, l'espérance mathèmatique de `x`. Elle possède la même unité que `x`.

10) La loi équiprobable (ou loi uniforme)

La loi équiprobable est la loi la moins arbitraire de toute. C'est la loi de probabilité constante, ou dite uniforme. Toutes les probabilités élémentaires sont égales entre-elles.

Prenons une variable aléatoire `x` ayant une loi de probabilité équiprobable `f`. Autrement dit la loi `f` est constante.

Cas pour une variable aléatoire discrète `x`
définie sur `{0, 1, 2..., "n"-1}` et de loi `f` équiprobable
Cas pour une variable aléatoire continue `x`
définie sur `]0, "n"[` et de loi `f` équiprobable
`mu_0 = sum_"x" f("x")`
`mu_0 = f("x")sum_"x"1`
  quelque soit `"x" in {0, 1, 2..., "n"-1}`
`mu_0 = f("x") "n"`


donc `f("x") = 1"/""n"`

`mu_0 = int_"x" f("x")d"x"`
`mu_0 = f("x")int_"x" d"x"`
  quelque soit `"x" in ]0, "n"[`

`mu_0 = f("x")["x"]_("x"=0)^"n"`

`mu_0 = f("x") "n"`


donc `f("x") = 1"/""n"`

`mu_1 = sum_"x" "x" f("x")`
`mu_1 = f("x") sum_"x" "x"`
  quelque soit `"x" in {0, 1, 2..., "n"-1}`
`mu_1 = (1/"n")("n"("n"-1))/2`
`mu_1 = ("n"-1)/2`
`mu_1 = int_"x" "x" f("x")d"x"`
`mu_1 = f("x") int_"x" "x"d"x"`
  quelque soit `"x" in ]0, "n"[`
`mu_1 = 1/"n" ["x"^2/2]_"x"`
`mu_1 = 1/"n" "n"^2/2 = "n"/2`

En conclusion :

Loi équiprobable discrète

`f("x") = 1/"n",` `P(bbx"=x") = 1/"n",` `"<"x">" = ("n"-1)/2`

`"<"x">"` : Moyenne de `x`
`P(bbx"=x")` : Probabilité que le tirage de la variable `x` soit égale au paramètre `"x"`
`f` : Loi de probabilité de la variable `x`
`bbx` : Tirage de la variable `x`
`"x"` : Paramètres entiers.
`"n"` : Nombre de valeurs possibles pour la variable `x`
Variable `x` : Variable aléatoire équiprobable définie sur `{0, 1, 2..., "n"-1}`

Loi équiprobable continue

`f("x") = 1/"n"` `P(bbx "∈" ]"x", "x"+d"x"[ ) = |d"x"| / "n"` `"<"x">" = "n"/2`

`"<"x">"` : Moyenne de `x`
`P(bbx "∈" ]"x", "x"+d"x"[ )` : Probabilité que le tirage de la variable `x` tombe dans l'intervalle `]"x", "x"+d"x"[`
`f` : Loi de densité de probabilité de la variable `x`
`bbx` : Tirage de la variable `x`
`"x"` : Paramètre réel.
`d"x"` : Valeur infinitésimale.
`"n"` : Taille de l'intervalle des valeurs possibles pour la variable `x`
Variable `x` : Variable aléatoire continue équiprobable définie sur `]0, "n"[`.


11) Générateurs de nombres aléatoires selon une loi équiprobable (ou loi uniforme)

11.1) Générateur à congruence linéaire

Park & Miller ont proposé en 1988, un générateur de nombres pseudo-aléatoires, à congruence linéaire, standard, convenablement testé. Ils l'ont appelé le Standard minimal. Il est défini comme suit :

`"x"_("n"+1) = 16807"x"_"n" mod (2^31- 1)`

La graine `"x"_0` ne doit pas être nulle. Il existe de nombreuses méthodes analogue (voir (GNU) Other random number generators) qui peuvent être plus rapides mais moins fiables en utilisant une puissance de `2` comme modulo. Elles engendrent une suite couvrant presque tous les nombres dans un ordre pseudo-aléatoire de période donc trés longue. La fonction rand( ) du langage C qui est programmée sur le même principe, retourne un nombre pseudo-aléatoire sur 31 ou 63 bits (compris entre `0` et RAND_MAX).

Si nous avons besoin d'un nombre entier pseudo-aléatoire `"x"` compris entre `0` et `"n"-1`, nous pouvons prendre le modulo `"n"`, c'est à dire exécuter l'instruction x = rand( )%n; néanmoins il faut se méfier des bits de poid faible qui dans de nombreuses implémentation de la fonction rand( ) ne sont pas vraiment pseudo-aléatoires, et cette méthode introduit un biais lorsque RAND_MAX n'est pas un multiple de `"n"`. La méthode suivante (voir FAQ C de Developpez.com) permet d'éliminer ces biais sans favoriser les bits de poids faibles. On programme la fonction randn( ) suivante, qui appliquée à `"n"`, retourne un nombre aléatoire compris entre `0` et `"n"-1`.

#include <stdlib.h>

int
randn(int n)
{
       n--;
       int p = 1+(n==RAND_MAX ? 0 : (RAND_MAX-n) / (n+1));
       int m = p*n + (p - 1);
       int d;
       do {d = rand( );} while (d > m);
       return d/p;
}

Intuitivement, on peut vouloir introduire ou pas du vrai hasard en ajoutant à la graine `"x"_"n"` après chaque tirage une valeur volatile correspondant au nombre de cycles machines écoulés. Sur architecture x86 vous pouvez pour cela utiliser la procédure rdtsc ainsi programmée (voir FAQ de commentcamarche.net). Puis on peut vouloir extraire les 16 ou 8 premiers bits juste après le premier bit qui est toujours à zéro. On construit ainsi quatre générateurs rapides comme suit :

#include <stdlib.h>

unsigned int* seedp;

typedef union {
     unsigned char c[
4];
     struct {unsigned short x,y;} s;
     int i;
} INT;

int rdtsc( ) { __asm__  __volatile__("rdtsc");}
unsigned short rand16(void) {return ((INT)(rand( )<<
1)).s.y;}
unsigned
char
rand8(void) {return ((INT)(rand( )<<
1)).c[3];}
unsigned
short
randsys16(void) {*seedp += rdtsc(); return ((INT)(rand_r(seedp)<<1)).s.y;}
unsigned
char
randsys8(void) {*seedp += rdtsc(); return ((INT)(rand_r(seedp)<<1)).c[
3];}

Pour les fonctions rand8( ) et rand16( ) qui génèrent des nombres pseudo-aléatoires, on peut fixer la graine `"x"_0` à une valeur `"g"` arbitraire à l'aide de la commande srand(g), ce qui permet de générer toujours la même suite de nombres pseudo-aléatoires. Pour les fonctions randsys8( ) et randsys16( ) qui génèrent des nombres aléatoires, la valeur courante de la graine change à chaque tirage selon les aléas hards et softs du système et est mémorisée dans seedp*.

On peut aussi utiliser les périphériques random et urandom générateurs aléatoires, du noyau Linux.

11.2) random, urandom - Périphériques générateurs aléatoires du noyau Linux

Extrait de http://manpagesfr.free.fr

Dans le système d'exploitation Linux, le périphérique /dev/random est un fichier spécial qui sert de générateur de nombres aléatoires. Le ficher /dev/random délivre des octects aléatoires qui sont récupéré à chaque lecture.

Le générateur de nombres aléatoires regroupe du bruit provenant de l'environnement recueillies auprès de pilotes de périphériques et d'autres sources et le stocke dans un réservoir d'entropie. Il mémorise une estimation du nombre de bits de bruit dans son réservoir d'entropie, et utilise son contenu pour créer des nombres aléatoires qui sont délivrés à chaque lecture du périphérique /dev/random. Lorsque le réservoir d'entropie est vide, les lectures depuis le périphérique /dev/random seront bloquantes jusqu'à l'obtention de suffisamment de bruit en provenance de l'environnement. Ainsi quand l'activité du système (source d'entropie) n'est pas suffisante, la lecture du fichier est bloquée.

Par contre le périphérique /dev/urandom qui fonctionne de façon analogue n'est jamais bloqué. L'aléa produit est donc de moins bonne qualité.

Pour accéder à ces périphériques en langage C on utilise les instructions suivantes :

#include <stdio.h>

unsigned int x;
FILE* random = fopen("/dev/random", "r");
fread(&x, sizeof(int),
1, random);
fclose(random);
#include <stdio.h>

unsigned int x;
FILE* urandom = fopen("/dev/urandom", "r");
fread(&x, sizeof(int),
1, urandom);
fclose(urandom);

11.3) Autres générateurs

Générateur Mersenne-Twister, voir https://en.wikipedia.org/wiki/Mersenne_Twister et http://www.math.sci.hiroshima-u.ac.jp/~m-mat/MT/emt.html

Générateur WELL, voir http://www.iro.umontreal.ca/~panneton/WELLRNG.html

Générateur SFMT, voir http://www.researchgate.net/publication/221211361_SFMT_pseudo_random_number_generator_for_Erlang

Générateur ISAAC, voir http://sebsauvage.net/isaac/

11.4) Générateurs aléatoires dans le logiciel R

Le logiciel R propose différents générateurs aléatoires :

...

12) Les moments

Il existe deux façons de calculer les moments d'ordre `"r"`, une façon intérieur qui consiste à sommer les puissances `"r"` des valeurs possibles de la variable `x` multipliées par leur probabilitées respectives, et une façon extérieur et empirique qui consiste à passer en revue l'ensemble des tirages, et à calculer la moyenne `"<"x^"r"">"`.

On note `bbx_"k"` le `"k"`ième tirage de la variable `x`.

`"<"x^"r"">" = lim_("k"->oo)(1/"k")sum_("k"=1)^"k" bbx_"k"^"r"`

Les tirages de `x` étant bornées et indépendants entre-eux, cette limite converge. (Voir chapitre 7, "La moyenne").

Moments d'une variable discrète

`mu_"r" = sum_("x"=0)^("n"-1) "x"^"r"f("x")`

`mu_"r" = "<""x"^"r"">"`


`f` : Loi de probabilité de la variable `x`
`mu_"r"` : Moment d'ordre `"r"` de la variable `x`
`"<"x^"r"">"` : Moyenne des puissances `"r"` de la variable `x`
`"x", "r"` : Paramètres entiers.
Variable `x` : Variable aléatoire définie sur `{0, 1, 2..., "n"-1}` et de loi `f`

Moments d'une variable continue

`mu_"r" = int_("x"=0)^n "x"^"r"f("x")d"x"`

`mu_"r" = "<""x"^"r"">"`

`f` : Loi de densité de probabilité de la variable `x`
`mu_"r"` : Moment d'ordre `"r"` de la variable `x`
`"<"x^"r"">"` : Moyenne des puissances `"r"` de la variable `x`
`"x"` : Paramètre réel.
`d"x"` : Valeur infinitésimale.
`"r"` : Paramètre entier.
Variable `x` : Variable aléatoire définie sur `]0, "n"[` et de loi `f`

Les deux procédés donnent le même résultat `mu_"r"` qu'est la moyenne des tirages à la puissances `"r"` appelée moment d'ordre `"r"`

`mu_"r" = "<"x^"r"">"`

La loi `f` est déterminée par la connaissance de tous ses moments `mu_0, mu_1, mu_2, mu_3...`. Nous savons calculer la liste des moments à partir de la loi de probabilité. Pour mettre en oeuvre le calcul inverse, c'est à dire calculer la loi de probabilité à partir de la liste des moments, il nous faut étudier la fonction caractéristique, ce que nous ferons dans la partie 3.

Le moment d'ordre `"r"` de la variable `x` peut se noter `mu_r(x)`.

13) Les moments de la loi équiprobable

Pour une variable discrète `x` définie sur `{0, 1, 2, 3..., "n"-1}` et de loi `f` équiprobable, `"n"` est le nombre de valeurs possible de la variable `x`, nous avons `f("x")=1 "/" "n"`.

`mu_"r" = sum_"x" "x"^"r"f("x")`
`mu_"r" = sum_"x" "x"^"r"(1/"n")`
`mu_"r" = (1/"n") sum_"x" "x"^"r"`

Et pour une variable continue `x` définie sur `]0, "n"[` et de loi `f` équiprobable, nous avons `f("x")=1/"n"`.

`mu_"r" = int_"x" "x"^"r"f("x")d"x"`
`mu_"r" = int_"x" "x"^"r"(1/"n")d"x"`
`mu_"r" = (1/"n") int_"x" "x"^"r"d"x"`
`mu_"r" = (1/"n") ["x"^("r"+1)/("r"+1)]_"x"`
`mu_"r" = (1/"n") ("n"^("r"+1)/("r"+1) - 0)`
`mu_"r" = "n"^"r"/("r"+1)`

Moments de la loi équiprobable discrète

`mu_"r" = (1/"n") sum_("x"=0)^("n"-1) "x"^"r"`

`mu_1 = "n""/"2 - 1"/"2`
`mu_2 = "n"^2"/"3 - "n""/"2 + 1"/"6`
`mu_3 = "n"^3"/"4 - "n"^2"/"2 + "n""/"4`
`mu_4 = "n"^4"/"5 - "n"^3"/"2 + "n"^2"/"3 - 1"/"30`
`mu_5 = "n"^5"/"6 - "n"^4"/"2 + 5"n"^3"/"12 - "n""/"12`
`mu_6 = "n"^6"/"7 - "n"^5"/"2 + "n"^4"/"2 - "n"^2"/"6 + 1"/"42`
`mu_7 = "n"^7"/"8 - "n"^6"/"2 + 7"n"^5"/"12 -7"n"^3"/"24 +"n""/"12`
`mu_8 = "n"^8"/"9 - "n"^7"/"2 + 2"n"^6"/"3 - 7"n"^4"/"15 + 2"n"^2"/"9 - 1"/"30`


`mu_"r"`
: Moment d'ordre `"r"` de la variable `x`
`mu_1` : Moyenne de `x`
`mu_2` : Variance de `x`
`"x", "r"` : Paramètres entiers.
`"n"` : Nombre de valeurs possibles de la variable `x`
Variable `x` : Variable aléatoire équiprobable définie sur `{0, 1, 2..., "n"-1}`
Moments de la loi équiprobable continue

`mu_"r" = "n"^"r"/("r"+1)`

`mu_1 = "n""/"2`
`mu_2 = "n"^2"/"3`
`mu_3 = "n"^3"/"4`
`mu_4 = "n"^4"/"5`
`mu_5 = "n"^5"/"6`
`mu_6 = "n"^6"/"7`
`mu_7 = "n"^7"/"8`
`mu_8 = "n"^8"/"9`


`mu_"r"` : Moment d'ordre `"r"` de la variable `x`
`mu_1` : Moyenne de `x`
`mu_2` : Variance de `x`
`"x", "r"` : Paramètres entiers.
`"n"` : Taille de l'intervalle des valeurs possibles de la variable `x`
Variable `x` : Variable aléatoire discrète équiprobable définie sur `]0, "n"[`

Dans un certain sens, lorsque `"n"` devient grand, la variable discrète équiprobable définie sur `{0, 1, 2..., "n"-1}`, approxime la variable continue équiprobable définie sur `]0,"n"[`, les moments de la variable discrète équiprobable convergent vers les moments de la variable continue équiprobable comme on peut le voir sur ces deux tableaux ci-dessus.

Pour `r>1`, nous avons le développement remarquable suivant :

`sum_("x"=0)^("n"-1) "x"^"r" = 1/("r"+1) "n"^("r"+1)- 1/2 "n"^"r" + r/12 "n"^("r"-1) + O("n"^("r"-3))`

`mu_"r" = 1/("r"+1) "n"^"r"- 1/2 "n"^("r"-1) + r/12 "n"^("r"-2) + O("n"^("r"-4))`

14) Variable centrée

On centre la variable `x` en lui soustrayant sa moyenne `m`. On obtient ainsi une nouvelle variable :

`x-m`

Nommons cette nouvelle variable `y`. Cela signifie qu'à chaque tirage nous avons `bby=bbx - "<"x">"`. La moyenne de `y` est nulle :

`y = x - "<"x">"`
`"<"y">" = "<"x - "<"x">"">"`
`"<"y">" = "<"x">"- "<"x">"`
  car `"<"x">"` est une constante.
`"<"y">" = 0`

15) Variance et écart type

La variance de `x` notée `V` ou `V(x)` est le moment d'ordre `2` de la variable centrée `x-"<"x">"`. Il existe deux façons de calculer la variance, une façon intérieure, et une façon extérieur dite empirique. Les deux procédés donnent le même résultat :

Dans le cas d'une variable aléatoire discrète `x` de loi `f` :

`V = sum_"x" ("x"-"<"x">")^2f("x")`

Et dans le cas d'une variable aléatoire continue `x` de loi `f` :

`V = int_"x" ("x"-"<"x">")^2f("x")d"x"`

La variance est la moyenne des carrés des tirages de la variable centrée `x-"<"x">"`. On note `bbx_"k"` le `"k"`ième tirage de la variable `x`.

`V = "<"("x"-"<""x"">")^2">"`
`V = lim_("k"->oo)(1/"k")sum_("k"=1)^"k" (bbx_"k"-"<"x">")^2`

Les valeurs de `x` étant bornées et indépendantes entre-elles, cette limite converge nécessairement. (Voir chapitre 7 "La moyenne").

On remarque que :

`V = "<"(x - "<"x">")^2">"`
`V = "<" x^2 - 2x"<"x">" + "<"x">"^2 ">"`
`V = "<"x^2">" - 2"<"x">"^2 + "<"x">"^2`
`V = "<"x^2">" - "<"x">"^2`
`V = mu_2 - mu_1^( 2)`

L'écart type de `x` notée `sigma`, ou `sigma_x`, est la racine carré de la variance :

`sigma = sqrt("<"("x"-"<""x"">")^2">")`
`sigma = sqrt(mu_2 - mu_1^( 2))`

Notez que `m_x` et `sigma_x` possède la même unité que `x`.

16) Variable centrée réduite

On centre la variable `x` en soustrayant sa moyenne. Puis on réduit la variable ainsi obtenue en la divisant par son écart-type (racine-carré de la variance). On obtient ainsi une nouvelle variable de moyenne nulle et de variance égale à `1`:

`(x - m) / sigma`

`(x - "<"x">") / sqrt( "<"(x - "<"x">")^2">")`

`(x - "<"x">") / sqrt( "<"x^2">" - "<"x">"^2)`

`(x - mu_1) / sqrt( mu_2 - mu_1^( 2))`

17) La moyenne de `x+y`

Dans le cas d'une variable aléatoire vectorielle `(x,y)`, la moyenne extérieure de `x+y` est la somme des moyennes extérieures de `x` et de `y`.

`"<"x+y">" = lim_("k"->∞) (1/"k")sum_("k"=1)^"k" (bbx_"k" + bby_"k")`
`"<"x+y">" = lim_("k"->∞) (1/"k")sum_("k"=1)^"k" bbx_"k"    +  lim_("k"->∞) (1/"k")sum_("k"=1)^"k" bby_"k"`

`"<"x+y">" = "<"x">" + "<"y">"`

18) Transformation linéaire

Etant donné une variable aléatoire `x`, on se propose d'étudier la variable `"a"x + "b"``"a"` et `"b"` sont des constantes. Nommons cette variable `y`. Nous avons `y` = `"a"x + "b"`, ce qui signifie que à chaque tirage nous avons `bby="a"bbx + "b"`.

Déterminons les moments de cette variable `y`, en fonction des moments de `x` que l'on notent comme suit :

`kappa_1="<"y">",   kappa_2="<"y^2">",   kappa_3="<"y^3">"...`
`mu_1="<"x">",   mu_2="<"x^2">",   mu_3="<"x^3">"...`

Pour la moyenne, nous avons :

`y = "a"x + "b"`
`"<"y">" = "<a"x + "b>"`
`"<"y">" = "a<"x">" + "b"`

Pour la variance, nous avons :

`y = "a"x + "b"`
`y^2= ("a"x + "b")^2`
`y^2 = "a"^2x^2 + 2"a""b"x + "b"^2`
`"<"y^2">" = "<a"^2x^2 + 2"ab"x + "b"^2">"`
`"<"y^2">" = "a"^2"<"x^2">" + 2"ab""<"x">" + b^2`

Pour le moment d'ordre `3`, nous avons :

`("a"x + "b")^3 = "a"^3x^3 + 3"a"^2"b"x^2 + 3"ab"^2x + "b"^3`
`"<"("a"x + "b")^3">" = "a"^3"<"x^3">" + 3"a"^2"b<"x^2">" + 3"ab"^2"<"x">" + "b"^3`

Pour le moment d'ordre `r` , nous avons :

Le développement de `(x+y)^r` est donnée par la formule du binôme :

`(x+y)^"r" = C_"r"^0 x^"r"+C_"r"^1 x^("r"-1)y+C_"r"^2 x^("r"-2)y^2+C_"r"^3 x^("r"-3)y^3... +C_"r"^("r"-1)xy^("r"-1)+C_"r"^"r"y^"r"`
`(x+y)^"r" = sum_("r"=0)^"r" C_(ˋ"r")^"r" x^(ˋ"r"-"r") y^"r"`
`C_"n"^"r" = ("n"!) / ( "r"! ("n"-"r")! )`

La formule de Pascal nous permet de calculer les coefficients binomiaux `C_"n"^"r"` simplement (triangle de Pascal) :

`C_"n"^"r" = C_("n"-1)^("r"-1) + C_("n"-1)^"r"`
`C_"n"^0 = 1`
`C_"n"^"n" = 1`
1
1  1
1  2  1
1  3  3  1
1  4  6  4  1

Appliquons ce développement à notre transformation linéaire :

`("a"x + "b")^"r" = sum_("r"=0)^"r" C_(ˋ"r")^"r" ("a"x)^(ˋ"r"-"r")"b"^"r"`
`"<"("a"x + "b")^"r"> = sum_("r"=0)^"r" C_(ˋ"r")^"r" "a"^(ˋ"r"-"r")"b"^"r" "<"x^(ˋ"r"-"r")">" `
`kappa_"r" = sum_("r"=0)^"r" C_(ˋ"r")^"r" "a"^(ˋ"r"-"r")"b"^"r" mu_(ˋ"r"-"r")`

Transformation linéaire `x |-> "a"x+"b"`

`kappa_"r" = sum_("r"=0)^"r" C_(ˋ"r")^"r" "a"^(ˋ"r"-"r")"b"^"r" mu_(ˋ"r"-"r")`

`C_("n")^"r"` : Coefficient binomiaux. Nombre de sous-ensemble de `"r"` éléments d'un ensemble de `"n"` éléments.

`kappa_1` : Moyenne de la variable `("a"x+"b")`
`kappa_2` : Variance de la variable `("a"x+"b")`
`kappa_"r"` : Moment d'ordre `"r"` de la variable `("a"x+"b")`
`mu_1` : Moyenne de la variable `x`
`mu_2` : Variance de la variable `x`
`mu_"r"`
: Moment d'ordre `"r"` de la variable `x`
`"a","b"`
: Paramètres réels.
Variable `x` : Variable aléatoire.
Variable `("a"x+"b")` : Variable aléatoire.

19) Notations (suite)

Pour éviter de démultiplier les variables ou leur appétence symbolique, pour une variable aléatoire quelconque `x` :

En notation intégrale, la loi `X` est une loi de densité de probabilité, la probabilité correspondante en `x` est `X("x")d"x"`.

En notation somme, la loi `X` est une loi de probabilité.

19.1) Notation intégrale

En notation intégrale, la variable `x` est définie sur un intervalle semi-ouvert :

`"X" = [sfx,frx[`

La loi de densité de probabilité `X` est une fonction de `"x"`  dont l'intégrale vaut `1` :

` int X("x")d"x" = 1`

La fonction cumulative `sfX` est une fonction croissante, c'est l'intégrale de la loi, commençant par valoir `0` :

`sfX("x") = int_(sfx)^"x"X("x")d"x"`            `sfX(sfx) = 0               sfX(frx) = 1`

La loi de densité de probabilité comprend des grandeurs comprises entre deux ordres de grandeurs, l'ordre de grandeur `O(1)` et l'ordre de grandeur `O(1"/"d"x")` :

19.2) Notation somme

En notation somme, la variable `x` est définie sur une succession régulière de `N` points séparés par un pas `delta"x"`. le domaine de définition de `x`, noté `"X"`, commençe par `sfx` et se termine par `frx-delta"x"`, faisant que `frx` dépasse `"X"` d'un écart de `delta"x"`, et nous avons :

`"X"={sfx, sfx + delta"x", sfx + 2delta"x", sfx + 3delta"x", ..., sfx+(N-1)delta"x"}`
`Ndelta"x" = frx`

On approxime l'intégrale par une somme en utilisant un maillage uniforme `delta "x"` aussi fin que l'on souhaite, c'est à dire avec `N` aussi grand que l'on souhaite.

La loi de probabilité `X` est une fonction de `"x"`  dont la somme vaut `1` :

` sum X("x") = 1`

La fonction cumulative est une fonction croissante, c'est la somme de la loi, commençant par valoir `0` :

`sfX("x") = sum_("x"=sfx)^"x"X("x")`            `sfX(sfx) = 0               sfX(frx) = 1`

La loi de probabilité `X` comprend des grandeurs comprises entre deux ordres de grandeurs, l'ordre de grandeur `O(delta"x")` et l'ordre de grandeur d'ordre `O(1)` :


Les lois de probabilités (volume 2)

Dominique Mabboux-Stromberg, 2015