Accueil
Suivant

I) Les lois de probabilité

Une source de données est une variable `x` produisant une suite infinie de valeurs `x(1),x(2),x(3)...`. La variable `x` est donc une fonction. Pour tout entier `k">"0`, le terme `x(k)` est appelé le `k`-ième tirage de la variable `x` ou encore la valeur de `x` à l'instant `k`. La suite des valeurs `x(1),x(2),x(3)...` correspond à des tirages au sort successifs ou bien à une évolution pas à pas de la variable `x`.

`x : (( NN"*"->"Im"(x) ),( k|->x(k) ))`

Le domaine où évolue `x` est l'ensemble image de la fonction `x` que l'on note `"Im"(x)= {x(1),x(2),x(3)...}`.

La variable est qualifiée de discrète si son image où elle évolue est fini. On standardise la variables dicrètes `x` en transformant son image `"Im"(x)` en un domaine standard qu'est l'ensemble des `n` premiers entiers naturels, `{0,1,2...,n"-"1}`.

La variable est qualifiée de continue si son image où elle évolue est infini. On standardise les variables continue `x` en transformant son image `"Im"(x)` en un domaine standard qu'est l'intervalle ouvert `"]"0,1"["`.

Dans la littérature classique, les variables évoluant dans un ensemble infini mais dénombrable sont également qualifiées de discrètes, ce que nous ne faisons pas ici. Car selon le point de vue élémentarien, l'infini potentiel que représente `NN` contient potentiellement tous les infinis. Ce point de vue est fondé par le théorème de Löwenheim-Skolem qui affirme que, si une théorie du premier ordre (écrite dans un langage mathématique dénombrable ce qui est notre cas) admet un modèle infini alors elle admet un modèle dénombrable. Cela nous amène, par principe du moindre effort, à délaisser les modèles de cardinalité supérieur, et à admettre que `NN` contient potentiellement tout.

Une variable évoluant dans un ensemble infini dénombrable d'éléments se transforme par dénombrement et changement de variable, en une variable évoluant dans le domaine des nombres rationnels `QQ`. Et dans ce domaine, il existe une métrique ou le calcul différentiel peut y être défini. Et cette espace métrique admet comme espace complet, `RR`.

Un évènement est une condition logique vrai ou fausse qui s'exprime à chaque tirage. On considère deux types d' évènements simples que sont :

  1. L'évènement discret : Le résultat du tirage de la variable `x` est égale à une valeur donnée
  2. L'évènement continu : Le résultat du tirage de la variable `x` appartenant à un intervalle différentiel ouvert donné.

Remarquez que l'évènement peut être identifié à une variable booléenne `e` qui à chaque tirage vaut `1` si l'évènement se réalise et `0` sinon.

L'esprit humain étant limité, on ne peut pas appréhender pleinement une proposition qui contiendrait trop de paramètres. L'essence de la formulation serait indubitablement noyée dans les détails, c'est pourquoi il faut mettre en oeuvre des typages et des contextes puissants qui permettent de se libérer de la profusions des détails et de ne retenir que l'essentiel. Cela passe par une économie minutieuse du nombre de variables explicites, et par une intégration efficace des dépendances et des analogies dans la notation même.

Dans certain cas `x` fait référence à une variable, a sa fonction, dans d'autre cas `x` désigne un paramètre libre parcourant le domaine où évolue la variable `x`. Ceci afin de ne pas démultiplier les noms de variables. C'est le contexte et le typage qui auront la charge de lever les ambiguïtés.

On note la valeur d'un tirage de la variable `x` par la même lettre mais préfixée d'un rectangle noir vertical `❙x` évoquant ainsi la matérialisation d'un résultat, la réalisation d'un tirage à un instant quelconque. Ainsi les évènements simples sont de l'une ou l'autre forment :

`❙x=x`

`❙x∈"]"x, x"+"dx"[`

Dans cette expression, le symbole `❙x` désigne un tirage de la variable `x`, tandis que le symbole `x` sans la présence du préfixe `❙` dit de "matérialisation" désigne un paramètre libre appartenant au domaine ou évolue la variable `x`, et `dx` désigne une variation infinitésimale positive du paramètre `x`. Parcontre l'expression prise par exemple `x(3)` désigne sans ambiguité la troisième valeurs de `x`, la valeur de `x` à l'instant `3`, le troisième tirage de la variable `x`, donné par la définition de `x`, c'est à dire un tirage à une position absolue, à un instant connu, tandis que le tirage `❙x` désigne un tirage à un instant inconnue.

L'évènement `❙x"="x` se réalise quand le résultat du tirage de la variable `x` est égale à la valeur du paramètre `x`.

L'évènement `❙x"∈]"x, x"+"dx"[` se réalise quand le résultat du tirage de la variable `x` appartient bien à l'intervalle de paramètres `]"x, x"+"dx"[`.

Pour formaliser cette dernière notation, la notation différentielle, et donner un sens concret à la différentielle `dx` et à l'intervalle différentiel `]"x, x"+"dx"[`, nous présenterons le corps des hyperréels.

On définit la probabilité par son sens commun. La probabilité d'un évènement s'obtient en passant à la limite lorsque le nombre `k` de tirages tend vers l'infini, du nombre de tirages où l'évènement se produit divisé par le nombre total `k` de tirages. Cela définit la probabilité sans avoir besoin d'utiliser la théorie de la mesure. Faut-il encore que cette limite existe, que la suite qui la définit soit convergente. Dans le cas générale, cette limite est égale à l'ensemble des points de l'espace complet qui adhérent à la suite, et lorsque la suite converge cet ensemble est réduit à un singleton.

La probabilité de l'évènement `❙x"="x` est définie par la limite suivante :

`P(❙x"="x) = lim_(k->∞) 1/k sum_(k=1)^k (x(k)"="x)`

Dans cette expression, le terme `x(k)` désigne le `k`-ième tirage de la variable `x`, tandis que le terme `x` du second membre de l'égalité ne peut pas désigner la variable `x` pour une question de typage, et donc désigne un nouveau paramètre qui, puisqu'il possède le même nom que celui de la variable `x`, appartient à son image `"Im"(x)`.

L'ensemble de ces probabilités, lorsqu'elles sont toutes définies, forme la loi de probabilité de `x` que l'on note avec la même lettre mais en majuscule `X`.

`X : ( ("Im"(x)->[0,1]),(x|->P(❙x"="x) ) )`

On étudie les variables discrètes de loi de probabilité partout définie, que l'on appelle simplement variable de loi discrète. Ces variables ne sont pas encore qualifiables de "variables aléatoires", car certains évènements complexes tel que par exemple l'évènement consistant en l'égalité de deux tirages successifs, et qui se note `❙x(1)"="❙x(2)`, n'ont pas forcement une probabilité bien définie. Parcontre dans le cas simple où les tirages sont indépendants, la variable est nécessairement aléatoire, car tout les évènements définissables sur la variable en question ont alors une probabilité bien définie.

On étudie les variables continue de loi de probabilité continue, que l'on appelle simplement variable de loi continue. Pour ces variables les probabilités des évènements `❙x"="x` sont d'un ordre strictement inférieur à celles des évènements `❙x"∈"]x"+"dx[`, et peuvent donc être omises.

Puis on étudie les variables de loi mixte qui sont sommes d'une variable de loi continue et d'une variable de loi discrète.

Il existe une transcriptions formelles entre variable de loi discrète et variable de loi continue, où l'élément pour l'un correspond à l'élément différentiel pour l'autre, où l'évènement discret pour l'un correspond à l'évènement continu pour l'autre.

On contourne la théorie de la mesure, en ne considèrant comme famille d'ensembles, que les ensembles dénombrables d'intervalles ouverts, dans lesquels on ajoute un nombre fini de points. La probabilité que le résultat du tirage de la variable `x` appartiennent à `A` est alors égale à la somme des probabilités que le résultat du tirage appartienne à un intervalle de l'ensemble `A`, à la quelle on ajoute la somme des probabilités que le résultat du tirage soit égale à un points ajouté à l'ensemble `A`.

 

---- 19 juin 2019 ----

 

 

à tirages indépendants, la variable est qualifié d'aléatoire, `"Im"(x)` représente l'ensemble des valeurs dans lequel est opéré le tirage au sort. La variable `x` évolue dans cet ensemble, et sa loi est partout définie.

Pour une variable à tirage indépendant, la probabilité de n'importe quel évènement définissable sur cette variable se ramène toujours à une fonction de une ou plusieurs probabilités d'évènements de la forme `❙x"="x`. C'est pourquoi les évènements de la forme `❙x"="x` sont appelés les évènements élémentaires. Pour une variable à tirage indépendant, l'ensemble des évènements élémentaires de la variable `x` est donc `{❙x"="x}`.

La probabilité de l'évènement `❙x"∈]"x, x"+"dx"[` est définie par la limite suivante :

`P(❙x"∈]"x, x"+"dx"[) = lim_(k->∞) 1/(kepsilon) sum_(k=1)^k (x(k)"∈""]"x,x"+"dx"[")`

 

Un évènement est une condition logique vrai ou fausse qui s'exprime à chaque tirage. Pour une variable continue à tirages indépendants, les évènements élémentaires sont de la forme de l'appartenance ou non d'un tirage de la variable `x` à un intervalle différentiel donné. Les évènements élémentaires se notent comme suit avec `dx">"0` :

`❙x"∈]"x, x"+"dx"[`

Dans cette expression, le symbole `❙x` désigne un tirage de la variable `x`, tandis que `x` désigne un paramètre libre appartenant au domaine ou évolue la variable `x`, et que `dx` désigne une variation infinitésimale du paramètre `x`. Avec cette convention d'écriture, l'ensemble des évènements élémentaires de la variable `x` s'écrit `{❙x"∈]"x, x"+"dx"[}`.

On étudie les variables continue de loi de probabilité continue, que l'on appel variable de loi de probabilité continue. On remarque que pour définir la loi de probabilité nous utilisons deux infiniments grands, un pemier infiniment grand `1"/"dx` qui correspond au nombre d'éléments différenciels couvrant `"]"0,1"["`, et un second infiniment grand `k` qui est le nombre de tirages. L'utilisation de deux infiniment grands d'ordre distinct se traduit dans `NN` par la notion de deux nombres arbitrairement grand et de différence arbitrairement grande, Leur définition ne pose pas de difficulté particulière et cela se note :

`1-<1"/"dx -<k`

La probabilité d'un évènement s'obtient toujours en passant à la limite, lorsque le nombre de tirages tend vers l'infini, du nombre de tirages où l'évènement se produit divisé par le nombre total de tirages.

Le concept de tirage au sort doit être interprété ici comme l'affirmation d'une totale indépendance entre les tirages successifs. Cet unique principe, dit d'indépendance des tirages, non encore formalisé et aux conséquences innombrables, préside à la définition des lois de probabilité à tirages indépendants que nous étudions ici.

Un moyen pour transfomer une variable source `x` en une variable `y` à tirage indépendant, consiste à définir `y` comme étant le résultat d'un tirage au sort équiprobable sur un nombre `m` de tirages consécutifs de `x`, où le nombre `m` est arbitrairement grand et s'inscrit dans la suite `1 -<m -<1"/"dx -<k`

Pour une variable à tirage indépendant, la probabilité de n''importe quel évènement définissable sur cette variable se ramène toujours à une fonction de une ou plusieurs probabilités d'évènements élémentaires. Les évènements élémentaires d'une variable de loi discrète à tirages indépendants sont les tirages d'une valeur voulue. Et les évènements élémentaires d'une variable de loi continue à tirages indépendants sont les tirages appartenant à un intervalle différentiel voulue.

 

Etant donné une variable discrète `x`, c'est à dire telle que `"Im"(x)` est fini.

2) Notations

Dans certain cas `x` fait référence à une variable source de données, dans d'autre cas `x` désigne un paramètre libre parcourant les valeurs envisageables de la variable `x`. Pour éviter les ambiguïtés sans démultiplier les noms de variables, on adopte une convention d'écriture. Étant donné une variable source `x`, la valeur d'un tirage de cette variable sera notée avec la même lettre mais préfixée par un rectangle noir vertial `❙x`. Ce préfixe dit de "materialisation" évoque la matérialisation d'un résultat c'est à dire la réalisation d'un tirage.

Par exemple dans l'expressions `❙x"="x`, le symbole `❙x` désigne le résultat d'un tirage de la variable `x`, qui, mis devant le signe égal, ouvre la définition d'un évènement. Le second membre de l'égalité doit alors être une valeur, et donc le deuxième symbole `x` ne peut pas être interprété comme une variable source, elle constitue donc la définition d'un paramètre libre, et reprenant la même lettre que la variable source, elle définie implicitement un paramètre appartenant au domaine où évolue la variable source `x`, noté `"Im"(x)`.

De même dans l'expression `❙x"∈["x, x"+"dx"[` le symbole `❙x` désigne le résultat d'un tirage de la variable `x`, qui, mis devant le signe d'appartenance `"∈"`, ouvre la définition d'un évènement. Le second membre de l'appartenance doit alors être égal à un ensemble, et donc le deuxième symbole `x` ne peut pas être interprété comme une variable source, elle constitue donc une définition d'un paramètre libre, et reprenant la même lettre que la variable source `x`, elle définit implicitement un paramètre appartenant à `"Im"(x)`.

Cette convention n'est pas obligatoire. Elle n'est là que pour lever des ambiguités qui n'auraient pas été levées par le typage ou le contexte.

Un évènement est une condition logique vrai ou fausse qui s'exprime à chaque tirage. Étant donné une variable source continue `x`, et étant donné une valeur du paramètre `x`, l'évènement `❙x"=" x` se réalise si et seulement si, lors du tirage, la valeur du tirage de la variable `x` est égale à la valeur du paramètre fixé `x`. L'évènement `❙x"∈" ]x, x"+"dx[` se réalise si et seulement si lors du tirage, la valeur du tirage de la variable `x` est strictement comprise entre les valeurs du paramètre `x` et `x"+"dx` `x` représente un paramètre libre et où `dx` représente une variation infinitésimale du paramètre `x` que l'on pose positive `dx">"0`. Et l'évènement `❙x"∈""["x, x"+"dx"["` se réalise si et seulement si lors du tirage, la valeur du tirage de la variable `x` est soit égale à la valeur du paramètre `x` ou bien est strictement comprise entre les valeurs du paramètre `x` et `x"+"dx`.

On utilise la même lettre pour désigner la variable source de données et un paramètre libre. Seul le contexte ou le typage permet de différentier leur rôle.

Considérons l'évènement suivant :

`(❙x x)^2 +❙x x + 1 = 0`

Cette évènement se réalise si le résultat du tirage de la variable `x` produit une valeur `v` vérifiant `(vx)^2 "+" vx "+" 1 = 0``x` désigne ici un paramètre libre appartenant à `"Im"(x)`.

Si on doit distinguer plusieurs tirages, on les numérote et on utilise ce numéro comme argument. Un évènement devient alors une condition logique qui se manifeste sur plusieurs tirages successifs. Néanmoins l'évènement se réalise ou pas à chaque tirage. L'évènement `❙x(0)"="❙x(1)` se réalise quand lors de deux tirages successifs de la variable `x`, les deux tirages produisent une même valeur. D'après le principe d'indépendance des tirages, la probabilité que deux tirages successif soient égaux, est égale à la probabilité que deux tirages, non nécessairement successifs mais séparés selon n'importe quel critère non discriminant, soit égaux.

Considérons l'évènement suivant :

`❙x(0) = ❙x(❙x(1))`

Cette évènement se réalise si la valeur du tirage de la variable `x` est égale à la valeur du `i`-ième tirage suivant où `i` est déterminé par le tirage suivant. Pour que cet évènement est un sens, il faut que `"Im"(x)` soit inclus dans `ZZ`.

La portée d'un itérateur ( `sum` ou `prod` ou `int`) se prolonge tout au long de la ligne jusqu'à la fermeture d'une parenthèse qui a été ouverte avant le symbole itérateur ou bien, si c'est une somme ou une intégrale, jusqu'à la rencontre d'une addition au premier niveau et, si c'est un produit jusqu'à la rencontre d'un produit au premier niveau, l'expression sur laquelle porte le symbole d'itération somme étant considéré comme un produit et l'expression sur laquelle porte le symbole d'itération produit étant considéré comme une somme :

`sum xyz+t = (sum xyz) +t`

`int xydz+t = (int xydz) +t`

`prod (x"+"y"+"z)t = (prod x"+"y"+"z)t`

Par convention, l'égalité notée en indice qui suit juste après un symbole itérateur ( `sum` ou `prod` ou `int` ) définie une variable d'itération. La définition précédente de la variable de même nom est alors masquée dans le corps de l'itération. Pour y faire référence on adopte la convention suivante : on utilise un triangle noir, pour évoquer la définition parente de la variable. Par exemple considérons l'expression suivante :

`g(x) = int_(x=0)^x overset(▴)(x) x dx`

L'itérateur fait varier `x` de `0` à `x`. Cela définit une variable d'itération `x` variant de `0` à `x`. Noter alors que le deuxième symbole `x` (en haut), utilisé pour définir la borne de fin de cette variable d'itération, ne fait pas référence à la variable d'itération car celle-ci n'est pas encore définie et la définition n'est pas sensée être recursive. Elle fait donc référence à la définition parente qui indique que `x` est l'argument de `g`. Après cette égalité, la variable d'itération `x` est définie, et tout symbole `x` qui suit dans la portée du symbole d'itération, fera référence à la variable d'itération, sauf s'il est préfixé d'un triangle noir, auquel cas il fera référence à la définition parente. Ainsi par exemple, nous avons :

`g(x) = int_(x=0)^x overset(▴)(x)xdx`
`g(x) = x int_(x=0)^x xdx`
`g(x) = x[x^2/2]_(x=0)^x`
`g(x) = x^3/2`

L'égalité `g(x) = int_(x=0)^x overset(▴)(x)xdx` est équivalente à l'égalité `g(x) = int_(y=0)^x xydy`.

L'usage du triangle noir permet d'éviter de démultiplier les noms de variable.

Autre convention, lorsque l'on manipule une variable source discrète `x` évoluant dans un ensemble de valeurs `"Im"(x) = A`, les sommes utilisant le symbole de la variable source `x` comme variable de sommation et qui ne mentionnent pas de domaine de sommation, auront comme domaine de sommation par défaut l'ensemble image de la variable source `x`.

`sum_x`  signifie  `sum_(x in A)`

Et si l'ensemble où évolut `x` est standardisé en `"A"={0,1,2...,n"-"1}` alors cela correspondra à :

`sum_x`  signifie  `sum_(x = 0)^(n-1)`

Et, l'ensemble image étant utilisé par défaut, une condition peut être mise en indice pour désigner seulement une partie de cet ensemble. Par exemple :

`sum_(x<b)`  signifie  `sum_(x in A "et" x<b)`

De même lorsque l'on manipule une variable source absolument continue `x` évoluant dans un intervalle `Im(x) "=" A`, les intégrales utilisant comme variable d'intégration `x` et qui ne mentionnent pas de domaine d'intégration, auront comme domaine d'intégration par défaut cet ensemble image de `x` qui est standardisé en une boule ouverte dans un espace métrique où l'on peut utiliser le calcul différentiel. Cela nous permet de ne pas entrer dans les détailles de la théorie de la mesure.

`int_x`  signifie  `int_(x in A)`

Et si l'ensemble où évolut `x` est standardisé en `A"=]"0,1"["` alors cela correspondra à :

`int_x`  signifie  `int_(x=0)^1`

Et, l'ensemble image étant utilisé par défaut, un bornage peut être mise en indice pour désigner seulement la partie bornée de cet ensemble. Par exemple :

`int_(x<1)`  signifie  `int_(x in A "et" x<1)`

Puis, par défaut, l'intégrale intègre selon l'élément différentiel présent et sur tout son domain qui est l'ensemble image de la variable correspondante,  faisant qu'il n'est pas besoin de rappeller la variable d'intégration ni le domaine d'intégration. Le domaine d'intégration sera celui de l'élément différentiel présent, et qui est l'ensemble image de la variable correspondante.

`int f(x)dx`

L'élément différentiel présent est `dx` donc le domaine d'intégration sera l'ensemble image de la variable aléatoire `x`, c'est à dire `A`.

3) Loi de probabilité discrète

Considérons une variable discrète `x`. Autrement dit, `"Im"(x)` est un ensemble fini. La variable est définie par la suite de ses valeurs `x(1),x(2),x(3)...`.

Un évènement est une condition logique vrai ou fausse qui s'exprime à chaque tirage. L'évènement `❙x"="x` se réalise lorsque la valeur du tirage de la variable `x` est égale à la valeur du paramètre `x`.

La probabilités de l'évènement `❙x"="x` se note `P(❙x"="x)`. On désigne la loi de probabilité d'une variable par la même lettre que la variable mais en majuscule. La loi de probabilité de la variable `x` est l'application `X` de `"Im"(x)"→"[0,1]` définie par `X(x) = P(❙x"="x)`. Elle associe à chaque valeur du paramètre `x∈"Im"(x)` la probabilité qu'un tirage de `x` soit égale au paramètre `x` si cette probabilité existe.

Lorsque la loi de probabilité `X` est défini partout sur l'ensemble discret "Im"(x), autrement dit, pour une variable `x` de loi de probabilié discrète, la loi de probailité `X` constitue une distribution normée, c'est à dire qu'elle satisfait `sum_x X(x)=1`.

Loi de probabilité discrète et évènements élémentaires de ` x`
`X : (("Im"(x)->[0,1]),( x|->P(❙x"="x) ))`                      `sum_x X(x) = 1`
`x` Variable discrète de loi de probabilité partout définie.
`x` Paramètre appartenant à `"Im"(x)`.
`X` Loi de probabilité de la variable `x`.
`X(x)` Densité de probabibilté au point `x`.
`"Im"(x)` Domaine où évolue la variable `x`.
`❙x` Tirage de la variable `x`.
`❙x"="x` Evenement élémentaire de la variable `x`.
`P(❙x"="x)`   Probabilité que le tirage de la variable `x` soit égal au paramètre `x`.

La probabilités de l'évènement `❙x"="x` se définit formellement comme étant la limite, lorsque le nombre de tirages tend vers l'infini, du nombre de tirages réalisant `❙x"="x` divisé par le nombre total de tirages.

Loi de probabilité discrète de `x`
`X(x) = lim_(k->∞) 1/k sum_(k=1)^k (x(k)"="x)`
`x` Variable discrète de loi de probabilité partout définie.
`x` Paramètre appartenant à `"Im"(x)`.
`x(k)` `k`-ième tirage de la variable `x` selon sa définition.
`"Im"(x)`  Domaine où évolue la variable `x`. Nous avons `"Im"(x)={x(1),x(2),x(3)...}`.
`X` Loi de probabilité de la variable `x`.
`X(x)` Probabilité que le tirage de la variable `x` soit égal au paramètre `x`.
`k` Nombre de tirages.
`k` Indexe des tirages.

Dans cette expression, l'égalité `(x(k)"="x)` est évaluée et vaut `1` si il y a égalité et `0` sinon. Le premier membre de l'égalité est le `k`-ième tirage de `x` donné par la définition de `x` et appelé aussi la valeur de `x` à l'instant `k`, tandis que le second membre de l'égalité ne pouvant pas être une variable est le paramètre `x`.

Remarquez le mécanisme de masquage des variables dans cette expression : Le premier `k` désigne un nombre de tirages tendant vers l'infini. Le deuxième `k` en bas est la création d'une variable désignant l'indice du tirage. Le troisième `k` en haut fait partie de la définition en cours qui n'est pas récurcive et donc qui fait référence au `k` précédent, désigant le nombre de tirages. Le quatrième `k` désigne l'indice de tirage, car la définition de cet indice `k` masque la définition parente de `k` représentant le nombre de tirage.

Dans certains cas, cette limite ne converge pas, et la probabilité ne peut donc pas être définie par une valeur. Par exemple, pour la variable `x` définie comme suit :

 `x(t) = (EEn "∈" NN, 2^(2n)<t<2^(2n+1))`

Où la proposition logique qui est entre parenthèse est évaluée à `1` si elle est vrai, et `0` sinon. Les probabilités des évènements `❙x"="1` et `❙x"="0` sont des limites qui ne convergent pas, et donc leur probabilité n'est pas une valeur mais un ensemble de valeurs, les valeurs adhérentes à la suite. Nous avons :

`1/omega sum_(k=1)^omega (x(k)"="1)    =    1/omega sum_(k=1)^omega (x(k)"="0)    =    {0,1}`

Dans la suite du document, on ne considèrera que des variables dont la loi de probabilité est définie partout.

Une loi de probabilité discrète `X` est une distribution discrète normée. Si la variable `x` évolue dans `{0,1,2...,n"-"1}` alors la loi `X` est définie par les `"n"` probabilités élémentaires `X(0),X(1),X(2)...,X(n"-"1)` que l'on note parfois de manière condensée `p_0,p_1,p_2...,p_(n"-"1)`. Et comme la somme des probabilités doit être égale à `1`, il suffit d'en connaître `n"-"1` pour toutes les connaître.

Par exemple, la connaissance `X(5) = 1"/"3` signifie que lors d'un tirage, la variable aléatoire a une probabilité `1"/"3` de valoir `5`.

4) Loi de probabilité continue

Le calcul différentiel est rendu facile grace au corps des hyperréels qui permet de manipuler les infiniment grands et les infiniment petits comme des nombres. Une égalité dans le corps des hyperréels doit toujours préciser l'ordre près à la quelle l'égalité s'applique. Voici les notations de Landau et de Hardy qui permettent de préciser cela :

Notation
de Laudau
Notation
de Hardy
Description
`o(u)`
`{r "/" |r| "≺"|u|}` Ensemble des valeurs négligeables devant `u`.
`O(u)`
`{r "/" |r| "≼" |u|}` Ensemble des valeurs d'ordre inférieur ou égal à `u`.
`Theta(u)`
`{r "/" |r| "≍" |u|}` Ensemble des valeurs d'ordre de `u`.

 
Notation
de Laudau
Notation
de Hardy
Définition
`o(u)`
`{r "/" |r| "≺"|u|}`
`{r "/" AAn"∈"NN,n|r|"<"|u|`}
`O(u)`
`{r "/" |r| "≼" |u|}`
`{r "/" EEn"∈"NN,|r|"⩽"n|u|}`
`Theta(u)`
`{r "/" |r| "≍" |u|}`

`{r "/" EE(n,m)"∈"NN^2,|r|"⩽"n|u| "et" |u|"⩽"m|r|}`

Considérons une variable continue `x` évoluant dans l'intervalle `"]"0,1"["`. La variable est définie par la suite de ses valeurs `x(1),x(2),x(3)...`.

L'évènement `❙x"="x` se réalise lorsque la valeur du tirage de la variable `x` est égale à la valeur du paramètre `x`. Sa probabilité se définit toujours comme étant la limite lorsque le nombre de tirages tend vers l'infini, du nombre de tirages satisfaisant `❙x"="x` divisé par le nombre total de tirages. Et elle se note :

`P(❙x"="x)`

L'évènement `❙x"∈"]x, x"+"dx[` se réalise lorsque la valeur du tirage de la variable `x` appartient à l'intervalle `]x, x"+"dx[``dx` est choisi positif `dx">"0`. Sa probabilité se définit toujours comme étant la limite lorsque le nombre de tirages tend vers l'infini, du nombre de tirages satisfaisant `❙x"∈"]x, x"+"dx[` divisé par le nombre total de tirages. C'est un infiniment petit du premier ordre, et elle se note :

`P(❙x"∈"]x, x"+"dx[)`

Comme nous supposons que la loi de probabilité est continue, cela signifie que la probabilité est proportionnelle à `dx` et donc que quelque soit `r">"0`, nous avons :

`P(❙x"∈"]x, x"+"rdx[) = rP(❙x"∈"]x, x"+"dx[) + o(dx)`

Le petit `o` de `dx`, noté `o(dx)`, représente l'ensemble des valeurs de norme infiniment petite devant `dx`, et indique que l'égalité est à l'écart près d'une valeur de norme infiniment petite devant `dx`.

On définie la densité de probabilité `X` comme étant ce rapport de proportionnalité :

`X(x) = (P(❙x"∈"]x, x"+"rdx[))/dx + o(1)`

Le petit `o` de `1`, noté `o(1)`, représente l'ensemble des valeurs de norme infiniment petite devant `1`, et indique que l'égalité est à l'écart près d'une valeur de norme infiniment petite devant `1`. Lorsque les termes de l'égalité sont de l'ordre `O(1)` sans ambiguité, alors l'égalité est implicitement valable à l'écart près d'une valeur de norme infiniment petite devant `1`.

`X(x) = (P(❙x"∈"]x, x"+"rdx[))/dx`

Cette règle peut s'appliquer aussi pour tous les ordres, faisant qu'une égalité `A=B` est implicitement une égalité à `o(A)` près et à `o(B)` près, c'est à dire à l'écart près d'une valeur de norme infiniment petite devant `A` ou `B`. Mais pour cela il faut que l'ordre de `A` ou que l'ordre de `B` soit connue.

La loi de probabilité de `x` est l'application `x|->X(x)dx` tandis que l'application `x|->X(x)` est la loi de densité de probabilité, néanmoins on l'appelle aussi la loi de probabilité continue de `x`, et c'est elle qui est désignée ainsi par la même lettre que la variable source mais en majuscule.

La densité de probabilité multipliée par un élément différentiel d'espace donne la probabilité que le tirage de la variable `x` soit dans cet intervalle différentiel d'espace.

`X(x)dx = P(❙x"∈"]x, x"+"dx[) + o(dx)`

Cette fonction de densité de probabilité `X`, appelée également loi de probabilité continue de `x`, associe à chaque valeur `x` envisageable, un rapport entre deux valeurs infinitésimales. Le numérateur contient la probabilité que le tirage soit dans l'intervalle différentiel `]x, x"+"dx[`. Le dénominateur contient la valeur infinitésimale positive `dx`.

Loi de probabilité continue et évènements élémentaires de ` x`

`X(x) = (P(❙x"∈"]x, x"+"dx[))/dx`

`x` Variable continue de loi de probabilité continue `X`.
`x` Paramètre appartenant à `"Im"(x)`.
`dx` Variation infinitésimale du paramètre `"x"` avec `dx` positif.
`]x, x"+"dx[` Intervalle différentiel
`"Im"(x)`  Domaine où évolue la variable `x`. Nous avons `"Im"(x)={x(1),x(2),x(3)...}`.
`X` Loi de densité de probabilité de la variable `x`.
      Appelé aussi loi de probabilité continue de la variable `x`.
`X(x)` Densité de probabilité au point `x`.
`X(x)dx` Probabilité que le tirage de `x` appartienne à l'intervalle différentiel `]x, x"+"dx[`.
`❙x` Tirage de la variable `x`
`P(❙x"∈"]x, x"+"dx[ )`  Probabilité que le tirage de `x` appartienne à l'intervalle différentiel `]x, x"+"dx[`.

Notez que les termes de l'égalité sont de l'ordre de `O(1)` et donc que l'égalité est définie à `o(1)` près, c'est à dire à l'écart près d'une valeur de norme infiniment petite devant `1`.

On adopte une convention d'écriture plus souple des intervalles sans avoir à respecter l'ordre des bornes. Ainsi nous avons par exemple `[0, 1[ = ]1, 0]`. On peut alors considérer un élément `dx` de signe quelconque, et définir l'intervalle `]x, x"+"dx[` sans respecter l'ordre des bornes. La formule doit alors, pour rester valable lorsque `dx` est de signe quelconque, utiliser la norme `|dx|`

`X(x) = (P(❙x"∈"]x, x"+"dx[))/|dx| + o(1)`

`X(x)|dx| = P(❙x"∈"]x, x"+"dx[ ) + o(dx)`

Dans le cas général, sauf mention contraire, les éléments différentiels tel que `dx` seront toujours supposés positifs. Nous avons avec `dx` positif :

`P(❙x"∈"]x, x"+"dx[ ) = X(x)dx + o(dx)`
`P(❙x"∈"]x, x"-"dx[) = X(x)dx+ o(dx)`
`P(❙x"∈"]x"-"dx, x"+"dx[) = 2X(x)dx+ o(dx)`

La loi `X` étant continue, nous avons l'approximation suivante :

`X(x"+"dx) = X(x) + o(1)`
`X(x"+"dx)dx = X(x)dx + o(1)dx`
`X(x"+"dx)dx = X(x)dx + o(dx)`

La probabilité que le tirage ait lieu dans un même intervalle, mais translaté d'une valeur infinitésimale de l'ordre de `dx`, est la même à `o(dx)` près, c'est à dire à l'écart près d'une valeur de norme infiniment petite devant `dx`.

`P(❙x"∈"]x"+"dx, x"+"2dx[ ) = P(❙x"∈"]x, x"+"dx"[) + o(dx)`

Considérons une variable de loi de probabilité continue `X`. Par exemple, la connaissance `f(5) = 3` signifie que, lors d'un tirage, la variable a une probabilité `3 dx` d'appartenir à l'intervalle `]5, 5"+"dx[`, et également une probabilité `3 dx` d'appartenir à l'intervalle `]5"-"dx,5[`, et une probabilité `9 dx` d'appartenir à l'intervalle `]5"-"dx, 5"+"2dx[`.

Les évènements élémentaires d'une variable de loi continue à tirage indépendant sont de la forme `❙x"∈""]"x,x"+"dx"["`. La probabilité de l'évènement se définit toujours comme étant la limite lorsque le nombre de tirages tend vers l'infini, du nombre de tirages satisfaisant `❙x"∈""]"x,x"+"dx"["` divisé par le nombre total de tirages. Et le calcul peut être fait pour des valeurs de `dx` arbitrairement petite. La probabilité `X(x)` s'obtient par le passage à la limite lorsque `epsilon` tend vers zéro, de la probabilité `P(❙x"∈""]"x, x"+"epsilon"[")`, et chaque telle probabilité s'obtient par passage à la limite lorsque le nombre de tirages `k` tend vers l'inifni, du nombre de tirages où `❙x"∈""]"x, x"+"epsilon"["` divisé par le nombre de tirages total `k`. Ainsi les deux passages à la limite se font dans un ordre particulier. Pour chaque `epsilon` on considère un `k` tendant vers l'infini, cela correspond au fait que le nombre de tirages `k` est d'un ordre strictement supérieur au nombre d'intervalles différentiels `1"/"epsilon`, ce qui se note :

`1 -< 1"/"epsilon -< k`

Mais l'expression, pour être exacte, doit désigner les grandeurs hyperréels vers lesquels `epsilon` et `k` tendent. la valeur `epsilon` tend vers `dx` qui représente un infiniment petit, et la valeur `k` tend vers `omega` qui représente un infiniment grand, et nous pouvons poser :

`1 ≺ 1"/"dx ≺ omega`

La probabilité `X(x)` s'obtient par le passage à la limite du nombre de tirages où `❙x"∈""]"x, x"+"epsilon"["` divisé par le nombre de tirages total `k`, lorsque `1"/"epsilon` et `k` tendent vers l'infini en respectant `1"/"epsilon -< k`.

Loi de probabilité continue de `x`

`X(x) = 1/(omegadx) sum_(omega=1)^omega (x(omega)"∈""]"x,x"+"dx"[")`    avec    `1 ≺ 1"/"dx ≺ omega`

`X(x) = lim_(epsilon->0) lim_(k->∞) 1/(kepsilon) sum_(k=1)^k (x(k)"∈""]"x,x"+"epsilon"[")`

`X` Loi de probabilité continue de la variable `x`.
`X(x)` Densité de probabilité au point `x`.
`X(x)dx` Probabilité que le tirage de `x` appartienne à l'intervalle différentiel `]x, x"+"dx[`.
`x` Variable loi de probabilité continue.
`x` Paramètre appartenant à `"Im"(x)`.
`dx` Variation infinitésimale du paramètre `x`.
`]x, x"+"dx[` Intervalle différentiel
`x(k)` `k`-ième tirage de la variable `x` selon sa définition.
`"Im"(x)`  Domaine où évolue la variable `x`. Nous avons `"Im"(x)={x(1),x(2),x(3)...}`.
`omega` Nombre infiniment grand de tirages.
`omega` Indexe des tirages.
`epsilon` Grandeur aussi petite que l'on souhaite. `epsilon` tend vers `dx`.
`k` Nombre de tirages aussi grand que l'on souhaite. `k` tend vers `omega`.
`k` Indexe des tirages.

Une variable mixte est la somme d'une variable de loi discrète et d'une variable de loi continue. Les évènements élémentaires sont alors de la forme `❙x"∈""["x,x"+"dx"["` où l'intervalle et fermé sur un coté. La probabilité de l'évènement se définit toujours comme étant la limite du nombre de tirages satisfaisant `❙x"∈""["x,x"+"dx"["` divisé par le nombre total de tirages, lorsque le nombre de tirages tend vers l'infini. Mais à la différence d'une variable continue, la probabilité `X(x)dx` est définie tantôt avec la grandeur `O(1)` lorsque l'évènement discret intervient et tantôt avec la grandeur `O(dx)` lorsqu'aucun évènement discret n'intervient.

`X(x)dx = 1/(omega)sum_(omega=1)^omega (x(omega)"∈""["x,x"+"dx"[") + o(dx)`    avec    `1 ≺ 1"/"dx ≺ omega`

`X(x)epsilon = lim_(k->∞) 1/k sum_(k=1)^k (x(k)"∈""["x,x"+"epsilon"[") + o(epsilon)`

5) Variable vectorielle

On généralise la notation différentielle pour pouvoir utiliser des variables vectorielles dans un espace orthonormé `RR^n`. Etant donné un vecteur position `vec v` de composantes `vec v=(x,y,z)`, ce vecteur désigne le point de coordonnées `(x,y,z)`. On note `d vecv` l'élément différentiel `d vecv=(dx,dy,dz)` et on note `vec v # d vec v` l'élément différentiel d'espace suivant :

`vec v # d vec v   =   ]x,x"+"dx[ × ]y,y"+"dy[ × ]z,z"+"dz[`

Et sans avoir à respecter l'ordre des bornes dans les intervalles et en considérant les éléments différentiels `dx,dy,dz` de signe quelconque. On note `Pi d vecv` le produits des composantes de `d vecv`. Nous avons :

`vec v=(x,y,z)`
`Pi d vecv = dxdydz`

Ainsi `vecv "+" d vecv` désigne un point infiniment voisin de `vecv` obtenue en le déplaçant selon le vecteur `d vecv`, et `vecv#d vecv` désigne un voisinage cartésien de `vecv + d vecv"/"2`, c'est à dire une portion infinitésimale de l'espace de centre `vecv + d vecv"/"2` et de volume `|Πd vecv| = |dxdydz|`. Le terme de volume correspond à la dimension `3`. On utilise le terme de taille ou de largeur en dimension `1`, de surface en dimension `2`, de volume en dimension `3`, et d'hypervolume en dimension supérieur. Le voisinage cartésien `vec v#d vecv` possède une quantité d'espace, un hypervolume, égale à la norme du produit des composantes de `d vecv` qui se note `|Πd vecv|`.

Dans le cas à une dimension, pour une valeur `x`, nous avons :

`x#dx = ]x, x+dx[ `

La loi de probabilité continue se formule de façon générale pour une variable source de donnée vectorielle `vec v` de composantes scalaires `vec v=(x,y,z)`. Chaque composante `x,y,z` constitue une variable source de loi de probabilité continue.

 

---- 19 juin 2019 ----

 

Loi de probabilité continue pour une variable vectorielle

`V(vec v)|Πd vecv| = P(❙vecv "∈" vecv#d vecv)`

`V(x,y,z)|dxdydz| = P((❙x, ❙y, ❙z) "∈" ]x,x"+"dx[×]y,y"+"dy[×]z,z"+"dz[)`
`V(x,y,z)|dxdydz| = P(❙x "∈" ]x,x"+"dx[  "et"  ❙y "∈" ]y,y"+"dy[  "et"  ❙z "∈" ]z,z"+"dz[)`


`P(❙vec v "∈"A)` : Probabilité que le tirage de la variable `vec v` appartienne à l'ensemble `"A"`
`vecv#d vecv` : Voisinage cartésien de centre `vecv + d vecv"/"2` et de volume `|Pi d vecv| = |dxdydz|`
`vec v` : paramètre vectoriel de composante `vecv=(x,y,z)` et appartenant à `"Im"(vec v)`
`d vec v` : paramètre vectoriel infinitésimal de composante `d vecv=(dx,dy,dz)`
`|Pi d vecv|` : volume infinitésimal. `|Pi d vecv| = |dxdydz|`
`V` : Loi de densité de probabilité de la variable `vec v`
`f(vecv)` : Densité de probabilité au point `vec v`
`❙vec v =(❙x,❙y,❙z)` : Tirage de la variable vectoriel `vec v`
`x, y, z` : Paramètres tel que `(x,y,z) in "Im"(vec v)`
`dx, dy, dz` : Valeurs infinitésimales réels.
`vec v` : Variable vectorielle de loi continue `f`
`x` : Première composante de la variable `vec v`
`y` : Seconde composante de la variable `vec v`
`z` : Troisième composante de la variable `vec v`
`"Im"(vec v)` : Domaine où évolue la variable `vec v`

`f(vec "v")` est la densité de probabilité de la variable `vec v` au point `vec"v"`, et `f(vec "v") |Pi d vec"v"|` est la probabilité que le tirage la variable `vec v` soit dans le volume `vec "v"#d vec"v"`.

Par convention, on simplifie l'écriture en `f("(" "x","y","z" ")" ) = f("x","y","z")`.

6) Fonction cumulative

Dans la notation française que nous utilisons, la fonction cumulative de la variable aléatoire `x`, notée `F`, est définie comme étant la probabilité d'obtenir un tirage strictement inférieur à `"x"`.

Fonction cumulative

`F("x") = P(bbx"<x")`

`P(bbx"<x")` : Probabilité que le tirage de la variable `x` soit inférieur strictement au paramètre `"x"`.
`F` : Fonction cumulative de la variable `x`
`bbx` : Tirage de la variable aléatoire `x`
`"x"` : Paramètre.
Variable `x` : Variable aléatoire.
`Dom(x)`: Domaine de définition de la variable `x`.

Toute fonction croissante `F`, définie de `Dom(x)` vers `[0, 1]`, est une fonction cumulative et donc permet de définir une loi de probabilité.

Dans le cas d'une variable aléatoire discrète `x` définie sur `{0, 1, 2, 3..., "n"-1}` et de loi `f`, sa fonction cumulative `F` se calcule comme suit :

`F("x") = P(bbx"<x")`
`F("x") = P(bbx"="0) + P(bbx"="1) + P(bbx"="2)... + P(bbx"=" "x"-1)`
`F("x") = f(0) + f(1) + f(2)... + f("x"-1) `
`F("x") = sum_("x"=0)^("x"-1) f("x")`

Le pas de la fonction cumulative donne la loi de probabilité : `f("x") = F("x"+1) - F("x")`

Et dans le cas d'une variable aléatoire continue `x` définie sur `]0, n[` et de loi `f`, sa fonction cumulative `F` se calcul comme suit :

`F("x") = P(bbx"<x")`
`F("x") = int_0^"x" P(bbx "∈" ["x", "x"+d"x"[ )`
`F("x") = int_0^"x" f("x")d"x"`

Le différentiel de la fonction cumulative donne la loi de probabilité : `dF("x") = F("x"+d"x")-F("x") = f("x")d"x"`

La dérivé de la fonction cumulative donne la loi de densité de probabilité : `F'("x") = (dF("x"))/(d"x") = f("x")`

La fonction cumulative est appelée la primitive, l'intégrale ou la somme de la loi.

Par convention on étend le domaine de définition de `F`, et nous avons `F(0) = 0` et `F("n") = 1`.

La fonction cumulative peut se calculer de manière empirique en prenant la limite lorsque le nombre de tirages tend vers l'infini, du nombre de tirages satisfaisant `bbx"<x"` divisé par le nombre totale de tirages.

`F("x") = lim_("k"->∞) (1/"k")sum_("k"=1)^"k" (bbx_"k"<x)`

Fonction cumulative d'une variable discrète `x` de domaine `{0, 1, 2..., "n"-1}`

`F("x")  =  P(bbx"<x")  =  sum_("x"=0)^("x"-1) f("x")`

`f("x") = F("x"+1) - F("x")`

`P(bbx "∈" ["a","b"[) = F("b")-F("a")`


`P(bbx "∈" ["a", "b"[)` : Probabilité que le tirage de la variable `x` appartienne à `["a","b"[`
`f `: Loi de probabilité de la variable `x`
`F` : Fonction cumulative de la variable `x`
`bbx` : Tirage de la variable aléatoire `x`
`"x", "a", "b"` : Paramètres entiers
Variable `x` : Variable aléatoire continue définie sur `{0, 1, 2, 3..., "n"-1}`

Fonction cumulative d'une variable continue `x` de domaine `]0,"n"[`

`F("x")  =  P(bbx"<x")  =  int_0^"x" f("x")d"x"`

`f("x") = F'("x")`

`P(bbx "∈" ["a", "b"[ ) = F("b")-F("a")`


`P(bbx "∈" [a, b[)` : Probabilité que le tirage de la variable `x` appartienne à l'intervalle `[a, b[`
`f` : Loi de densité de probabilité de la variable `x`
`F` : Fonction cumulative de la variable `x`
`bbx` : Tirage de la variable aléatoire `x`
`"x", "a", "b"` : Paramètres réels.
Variable `x` : Variable aléatoire continue définie sur `]0, n[`

Dans le cas d'une variable aléatoire vectorielle `(x,y)` la fonction cumulative `F` est définie comme étant la probabilité d'obtenir un tirage dont la première composante est strictement inférieur à `"x"` et la seconde composante est strictement inférieur à `"y"`.

Fonction cumulative d'une variable discrète vectorielle `(x,y)`

`F("x","y") = P(bbx"<x" "et" bby"<y")`

`F("x","y") = sum_("x"<"x") sum_("y"<"y") f("x","y")`

`f("x","y") = P(bbx"=x" "et" bby"=y")`

`P(bbx"<x")` : Probabilité que le tirage de la variable `x` soit inférieur strictement au paramètre `"x"`.
`P(bbx"<y")` : Probabilité que le tirage de la variable `y` soit inférieur strictement au paramètre `"y"`.
`F` : Fonction cumulative de la variable `(x,y)`
`f `: Loi de probabilité de la variable `(x,y)`
`(bbx,bby)` : Tirage de la variable aléatoire `(x,y)`
`"x", "y"` : Paramètres.
Variable `(x,y)` : Variable aléatoire.

 

7) Les fractiles

La fonction inverse `F^(-1)` donne les fractiles. Le fractile `"x"` d'ordre `alpha` est `"x" = F^(-1)(alpha)`, c'est la valeur `"x"` tel quel la probabilité d'un tirage inférieur à `"x"` soit égale à `alpha` :

`P(bbx<"x") = alpha`

Le fractile peut ne pas être unique et constituer un intervalle.

Le fractile d'ordre `alpha` de la variable `x` se note parfois `"x"_alpha`.

Le fractile d'ordre `1"/"2` s'appelle la médiane.

Le fractile d'ordre `1"/"4` s'appelle le premier quartile.

Le fractile d'ordre `3"/"4` s'appelle le troisième quartile.

Les fractiles d'ordre `"k/"10` avec `"k"` entier compris entre `1` et `9` définissent les déciles.

Les fractiles d'ordre `"k/"100` avec `"k"` entier compris entre `1` et `99` définissent les centiles.

 

brouillon :


 

2) Variable

3) Événement

4) Probabilité

5) Variable aléatoire à tirages indépendants

 

Une variable `x` désigne une suite infinie de valeurs correspondant à une évolution pas à pas, et pour atteindre un niveau de généralité plus grand, on ne choisit pas de point de départ, c'est une suite infinie dans les deux sens `...x("-"3),x("-"2),x("-"1),x(0),x(1),x(2),x(3)...` `x(k)` est appelé le `k`-ième tirage de la variable `x`, et est aussi appelé la valeur de `x` à l'instant `k`. C'est donc une application de l'ensemble des entiers relatifs vers un domaine où évolue `x`, qui est l'ensemble image de `x` noté `"Im"(x)`.

`x : ( ( ZZ->"Im"(x) ),( k|->x(k) ) )`

Dans certain cas `x` fait référence à une variable, dans d'autre cas `x` désigne un paramètre libre parcourant les valeurs envisageables de la variable aléatoire. Pour éviter les ambiguïtés sans démultiplier les variables, on adopte une convention d'écriture, on choisie une notation de soulignement des tirages dans l'expression des évènements. Étant donné une variable aléatoire `x`, la valeur d'un tirage de cette variable sera désignée, dans l'expression d'un évènement, avec la même lettre mais soulignée et appliquée à un numéro de tirage ou simplement soulignée s'il s'agit d'un tirage quelconque, tandis que la variable `x`, dans l'expression d'un évènement, placée à un endroit où on attend une valeur, désignera un paramètre libre évoluant dans `"Im"(x)`. Cela définit une application `underline(x)` copie de l'application `x`, où seul le contexte change, le soulignement désignant la révélation des tirages en question, et l'absence de soulignement permettant d'évoquer un paramètre libre associé.

La variable est qualifiée de discrète si son ensemble image est fini.

On définit la probabilité par son sens commun. La probabilité d'un évènement s'obtient en passant à la limite du nombre de tirages où l'évènement se produit divisé par le nombre total `k` de tirages, lorsque le nombre `k` de tirages tend vers l'infini. Cela définit la probabilité sans avoir besoin d'utiliser la théorie de la mesure. Faut-il encore que cette limite existe, que la suite qui la définit soit convergente. C'est cette condition, appliquée aux évènements élémentaires de la variable, qui fait qu'une variable est une variable aléatoire ou non. Reste à définir quelles sont les évènements élémentaires d'une variable.

Un des évènements les plus simples consiste en l'égalité d'un tirage quelconque avec un paramètre, ce qui se note `underline(x) "=" x`. Cela signifie que la valeur d'un tirage de la variable `x` est égale à la valeur du paramètre `x`. Et la probabilité de cet évènement est définie par la série suivante :

`P(underline(x) "=" x) = lim_(k->∞) (1/k)sum_(k=1)^k (underline(x)(k)"="x)`

Un évènement plus complexe va faire intervenir plusieurs tirages successifs tel que par exemple l'évènement `underline(x)(0) "="underline(x)(underline(x)(1))`. Cela signifie que la valeur d'un tirage de la variable `x` est égale à la valeur du `n`-ième tirage suivant où le nombre `n` est désigné par le tirage suivant. Et la probabilité de cet évènement est définie par la série suivante :

`P(underline(x)(0) "="underline(x)(underline(x)(1)) ) = lim_(k->∞) (1/k)sum_(k=1)^k (underline(x)(k)"="underline(x)(underline(x)(k+1)))`

Alors se pose tout de suite la question de la localisation de l'évènement, à savoir si le nombre de tirages consécutifs consernés lors d'un seul tel évènement est borné par un entier ?. On commence modestement en ne considérant que des évènements localisés. Les évènements élémentaires de la variable `x` sont :

`{^^^_(i=-d)^d underline(x)(i)"="x(i) "/" EE d "∈" NN, i "∈" {"-"d...d}}`

Le paramètre `2d"+"1` s'appelle la dimension de l'évènement. Un évènement élémentaire de dimension `2d"+"1` est donc la succession des `2d"+"1` tirages de la variables égale à une suite de `2d"+"1` valeurs d'un paramètre libre :

`(underline(x)("-"d),...underline(x)("-"2),underline(x)("-"1),underline(x)(0),underline(x)(1),underline(x)(2)...,underline(x)(d)) = (x("-"d),...x("-"2),x("-"1),x(0),x(1),x(2)...,x(d))`

Nous utilisons donc deux infiniments grands, un pemier infiniment grand `k` qui correspond aux nombres de tirages de la variables, et un second nombre `d` qui détermine la dimension de l'évènement, le nombre `2d"+"1` de tirages successifs considérées. L'utilisation de deux infiniment grands d'ordre distinct se traduit dans `NN` par la notion de deux nombres arbitrairement grand et de différence arbitrairement grande. Leur définition ne pose pas de difficulté particulière et cela se note :

`1-<d-<k`

Pour que la variable `x` puisse revendiquer son statut de variable aléatoire, il est nécessaire que la probabilité de chacun de ses évènements élémentaires soit bien définie c'est à dire soit le résultat d'une série convergente.

À chaque évènement `e` correspond une probabilité `P(e)`. Un évènement symbolisé par `e` est en fait une variable aléatoire booléenne qui à chaque tirage vaut `0` si l'évènement ne se réalise pas et `1` si l'évènement se réalise.

 

variable `frx, fry, frz`

paramètre `x,y,z`

Pour une variable aléatoire `x`, l'ensemble `"Im"(x)` représente l'ensemble des valeurs envisageables pour `x`, c'est à dire l'ensemble des valeurs dans lequel est opéré le tirage au sort. On dira que la variable `x` évolue dans cet ensemble `"Im"(x)`. La loi de probabilité de la variable aléatoire `x` sera définit sur cet ensemble. Puis pour simplifier les exemples servant de modèles, on transforme l'ensemble image par dénombrement et changement de variable. On choisit comme ensemble image standard, l'ensemble des `n` premiers entiers naturels, `{0,1,2...,n}`, et on choisit comme ensemble image symétrique standard, l'ensemble des entiers relatifs de norme inférieure à `n` c'est à dire `{i "∈" NN "/" "-"n"<"i"<"n}`.

Une variable `x` est qualifiée de continue si son ensemble image est infini. Et on ne choisit alors comme ensembles image, que des ensembles munis d'une métrique et dans lesquelles on peut faire du calcul différentiel. Puis parmis ceux-ci, on ne choisira que des ensembles connexes et bornés tels des boules dans un espace métrique. Pour un espace réel à une dimension, ces boules correspondent aux intervalles bornés, que l'on ramène par changement de variable à l'intervalle `]"-"1, 1[`, qui sera l'ensemble image symétrique standart. Et on choisit comme ensemble image standard, celui qui s'obtient par la norme du précédent, et qui est `["0,1"["`. Puis on utilisera aussi les ensembles standards `"Im"(x)"="]"-"n, n[` et `"Im"(x)"=["0,n"["` pour établir un parallèle entre le cas discret et le cas absolument continu, et pour donner une approximation les lois de probabilité absolument continues par des lois de probabilité discrètes.

Puis nous ne retenons que les variables aléatoires absoluments continues, c'est à dire obéïssant à une loi de probabilité continue. Puis nous considérerons les variables aléatoires qui sont sommes d'une variable aléatoire absolument continue et d'une variable aléatoire discrète.

Il existe un parallèle entre variable dicrète et variable absolument continue, où l'élément pour l'un correspond à l'élément différentiel pour l'autre. Dans le cas discret, l'évènement est une égalité. Dans le cas absolument continue, l'évènement est l'appartenance à un intervalle différentiel.

Dans le cas d'une variable absolument continue, pour définir la loi de probabilité, nous utilisons deux infiniments grands, un pemier infiniment grand `1"/"dx` qui correspond aux nombre d'éléments différenciels compris dans `"["0,1"["`, et un second infiniment grand `k` qui est le nombre de tirages. L'utilisation de deux infiniment grands d'ordre distinct se traduit dans `NN` par la notion de deux nombres arbitrairement grand et de différence arbitrairement grande, Leur définition ne pose pas de difficulté particulière et cela se note :

`1<1"/"dx <k`

La probabilité d'un évènement s'obtient toujours en passant à la limite, lorsque le nombre de tirages tend vers l'infini, du nombre de tirages où l'évènement se produit divisé par le nombre total de tirages. C'est l'existence de cette limite pour tous les évènements élémentaires de lavariables qui fait d'une variable, une variable aléatoire ou non.

`"⬩"`

`"◂"x"▸"`    `"⯇"x"⯈"`

`"⬨"x"⬨"`

`"⋖"x"⋗"`

`"⁌"x"‣"`

`"∎"x"∎"`

`"▪"x"➧"`

`❰x❱`

`❬x❭`   `"⦗"x"⦘"`   `"፧"x"፨"`   `"〈"x"〉"`   `"⦁"x"⫸"`

`"‣"x‣`   `"⦗"x"⦘"`   `"፧"x"፨"`   `"〈"x"⮯"`   `"⮯"x"⫸"`

Le concept de tirage au sort doit être interprété ici comme l'affirmation d'une totale indépendance entre les tirages successifs. Cet unique principe, dit d'indépendance des tirages, non encore formalisé et aux conséquences innombrables, préside à la définition des lois de probabilité à tirages indépendants que nous étudions ici. Dans le cadre de ce principe, les évènements élémentaires d'une variable sont les tirages d'une valeur voulue.

Dans le cas générale d'une variable source `x` quelconque, la loi de probabilité de `x` retourne quelque chose de plus générale qu'une probabilité qui est un ensemble de probabilités, l'ensemble des valeurs adhérant à la suite.

 

En utilisant la structure des hyperréels et en notant par `omega`, un infini, nous avons :

`X : ( ("Im"(x)->ccP("["0,1"]")),(x|->1/omega sum_(k=1)^omega (x(k)"="x) ) )`


Dominique Mabboux-Stromberg