Sommaire
Suivant

I) Les lois de probabilité

1) Variable, source de données, `x`

Une source de données est représentée par une variable `x`, produisant une suite infinie de valeurs `x(0),x(1),x(2)...`. C'est donc une application de `NN` vers un ensemble d'arrivé qui est un ensemble de valeurs supposées possibles pour la variable `x` et qui se note `"Arr"(x)`. On définit pour chaque telle application `x` son ensemble de départ `"Dép"(x)=NN` et son ensemble arrivé `"Arr"(x)`, afin de pouvoir les dénombrer ou les énumérer.

`x in (NN"→Arr"(x))`

L'application `x` est aussi identifiée à un ensemble de couples qu'est le graphe de l'appliation. Et on laisse au contexte (et au mécanisme de typage par inférence) le soin de déterminer le type dont il est question.

`x = {t"↦"x(t) "/" t"∈"NN}`

Pour tout entier `t`, le terme `x(t)` est appelé le `(t"+"1)`-ième tirage de la variable `x`, ou encore la valeur de `x` à l'instant `t`. Ainsi la suite des valeurs `x(0),x(1),x(2)...` correspond à des tirages successifs, ou bien à une évolution pas à pas de la variable `x` au cours du temps.

Le domaine où évolue `x`, noté `"Arr"(x)`, est l'ensemble des valeurs supposées possibles pour la variable `x`, à ne pas confondre avec l'ensemble de départ de l'application `x` qui est ici `"Dép"(x)"="NN`.

L'image de `x`, notée `"Im"(x)`, est l'ensemble des valeurs réellement parcourues par la variable `x`. Ainsi nous avons `"Im"(x)"⊆Arr"(x)`.

On considérera des variables bornés, comprises entre `x_"min"` et `x_"max"`. Et parmi elles, on considèrera deux types de variable, les variables discrètes, et les variables continues :

Puis on considérera des variables définies sur une période de temps sans commencement de `"-"oo` à `"+"oo` c'est à dire telles que `"Dép"(x)"="ZZ`.
Puis on considérera les cas cycliques où `"Dép"(x)"="ZZ"/"kZZ`.
Puis on considérera des variables d'évolution temporelle continue, c'est à dire telles que `"Dép"(x)"="RR^"+"`.
Puis on considérera des variables d'évolution temporelle continue définies sur une période de temps sans commencement de `"-"oo` à `"+"oo` c'est à dire telles que `"Dép"(x)"="RR`.
Puis on considérera les cas cycliques où `"Dép"(x)"="RR"/"rRR`.

2) Événement `overset(***)x"="x` et `overset(***)x"∈]"x, x"+"dx"["`

Un évènement est une condition logique vrai ou fausse qui s'exprime à chaque tirage. On considère deux types d'évènements élémentaires que sont :

  1. L'évènement discret : Le résultat du tirage de la variable est égal à une valeur donnée
  2. L'évènement différentiel : Le résultat du tirage de la variable appartient à un intervalle différentiel donné.

L'évènement peut être identifié à une variable booléenne qui à chaque tirage vaut `1` si l'évènement se réalise, et `0` sinon.

L'esprit humain étant limité, on ne peut pas appréhender pleinement une proposition qui contiendrait trop de paramètres. L'essence de la formulation serait noyée dans les détails. C'est pourquoi il faut mettre en oeuvre des typages et des contextes puissants qui permettent de se libérer de la profusions des détails et de ne retenir que l'essentiel. Cela passe par une économie minutieuse du nombre de variables explicites, et par une intégration efficace des dépendances et des analogies dans la notation même.

Afin de ne pas démultiplier les noms de variables, dans certains cas, `x` fait référence à une variable c'est à dire à son application, et dans d'autres cas, `x` désigne un paramètre libre parcourant les valeurs possibles de la variable `x`. Et c'est au contexte et au typage par inférence que revient la charge de lever les ambiguïtés. Dans le premier cas, `x` est de type `NN"→Arr"(x)`. Et dans le second cas, il est de type `"Arr"(x)`.

On note la valeur d'un tirage de la variable `x` par la même lettre mais montée d'une étoile `overset(***)x` évoquant ainsi la matérialisation d'un résultat, la réalisation d'un tirage à un instant quelconque. Ainsi les évènements simples sont de l'une ou l'autre forment :

`overset(***)x=x`

`overset(***)x∈"]"x, x"+"dx"["`

Dans ces expressions, le symbole `overset(***)x` désigne un tirage de la variable `x`, tandis que le symbole `x` non surmonté de l'étoile `***` dit de "matérialisation" désigne un paramètre libre appartenant au domaine ou évolue la variable `x`. Et `dx` désigne une variation infinitésimale positive du paramètre `x`. Par contre l'expression `x(3)` désigne sans ambiguité le quatrième tirage de `x`, c'est à dire la valeur de `x` à l'instant `3` sachant que l'on démarre à zéro, donné par la définition de `x`, c'est à dire un tirage à une position absolue, à un instant absolu. Tandis que le tirage `overset(***)x` désigne un tirage à un instant inconnu mais qui ce réalise. Puis l'expression `overset(***)x(3)` désigne un tirage à un instant relatif `"+"3` et qui ce réalise. Ainsi nous avons `overset(***)x"="overset(***)x(0)`.

L'évènement `overset(***)x"="x` se réalise quand le résultat du tirage de la variable `x` est égal à la valeur du paramètre `x`. L'évènement différentiel `overset(***)x"∈]"x, x"+"dx"[` se réalise quand le résultat du tirage de la variable `x` appartient bien à l'intervalle différentiel de paramètres `]x, x"+"dx[`.

Considérons par exemple l'évènement suivant :

`(overset(***)x x)^2 + overset(***)x x + 1 = 0`

Cet évènement se réalise si le résultat du tirage de la variable `x` produit une valeur `v` vérifiant `(vx)^2 "+" vx "+" 1 = 0``x` désigne ici un paramètre libre appartenant à `"Arr"(x)`.

Si on doit distinguer plusieurs tirages, on les numérote pour indiquer l'ordre relatif du tirage et on utilise ce numéro comme argument. Un évènement devient alors une condition logique qui se manifeste sur plusieurs tirages successifs. Néanmoins l'évènement et susceptible de se réaliser à chaque tirage. L'évènement `overset(***)x(0)"="overset(***)x(1)` se réalise quand lors de deux tirages successifs de la variable `x`, les deux tirages produisent une même valeur, et par définition l'évènement se réalise à l'instant relatif `0`. Ainsi si on ne souhaite pas définir l'évènement en fonction de tirage future, on choisira la formulation `overset(***)x("-"1)"="overset(***)x(0)`. Et pour simplifier le modèle on pourra prendre une variable définie sur une période de temps sans commencement. `"Dép(x)="ZZ`.

Considérons une variable `x in (ZZ->ZZ)`. Considérons l'évènement suivant :

`overset(***)x(0) = overset(***)x(overset(***)x(1))`

Cet évènement se réalise si la valeur du tirage de la variable `x` est égale à la valeur du `i`-ième tirage suivant où `i` est déterminé par le tirage suivant.

Dans le cas d'une variable `x` d'évolution temporelle continue, l'ensemble de départ `"Dép"(x)` représente le temps, et le terme `x(t)` désigne la valeur de `x` à l'instant `t`. Pour des raisons relative à la physique on ne considérera que des variables analytiques, c'est à dire infiniment dérivable selon le temps et développable en série de Taylor en tout point.

3) Notation des sommes, des produits et des intégrales

La portée d'un itérateur ( `sum` ou `prod` ou `int`) se prolonge tout au long de la ligne jusqu'à la fermeture d'une parenthèse qui a été ouverte avant le symbole d'itération ou bien, si c'est une somme ou une intégrale, jusqu'à la rencontre d'une addition au premier niveau, l'expression sur laquelle porte le symbole d'itération "somme" étant considéré comme un produit, ou bien, si c'est un produit, jusqu'à la rencontre d'un produit au premier niveau, l'expression sur laquelle porte le symbole d'itération "produit" étant considéré comme une somme :

`sum xyz+t = (sum xyz) +t`

`int xydz+t = (int xydz) +t`

`prod (x"+"y"+"z)t = (prod x"+"y"+"z)t`

Par convention, l'égalité notée en indice qui suit juste après le symbole itérateur discret ( `sum` ou `prod` ) définie une variable locale d'itération. La définition précédente de la variable de même nom est alors masquée dans le corps de l'itération. Pour y faire référence on adopte la convention suivante : on utilise un triangle noir, pour évoquer la définition parente de la variable. Par exemple considérons l'expression suivante :

`U(x) = sum_(x=0)^x overset(▴)(x) x`

L'itérateur fait varier `x` de `0` à `x`. Cela définit une variable d'itération `x` variant de `0` à `x`. Noter alors que le deuxième symbole `x` (en haut), utilisé pour définir la borne de fin de cette variable d'itération, ne fait pas référence à la variable d'itération car celle-ci n'est pas encore définie, et la définition n'est pas sensée être récursive. Elle fait donc référence à la définition parente qui indique que `x` est l'argument de `U`. Après cette égalité, la variable d'itération `x` est définie, et tout symbole `x` qui suit dans la portée de l'itérateur, fera référence à la variable d'itération, sauf s'il est préfixé d'un triangle noir, auquel cas il fera référence à la définition parente. Ainsi par exemple, nous avons :

`U(x) = sum_(x=0)^x overset(▴)(x)x`
`U(x) = x sum_(x=0)^x x`
`U(x) = x(x(x"+"1))/2`
`U(x) = (x^2(x"+"1))/2`

L'égalité `U(x) = sum_(x=0)^x overset(▴)(x)x` est équivalente à l'égalité `U(x) = sum_(y=0)^x xy`.

L'usage du triangle noir permet d'éviter de démultiplier les noms de variable.

Dans le cas d'itérateur continu tel que l'intégrale, si l'élément différentiel utilisé par l'intégrale est déterminé, il n'est pas nécessaire de nommer spécifiquement la variable locale d'itération puiqu'alors elle est connue, et les bornes seules peuvent être écrites en indice et exposant du symbole d'intégrale. Et le masquage ce produit pour la variable de même nom. Pour y faire référence on adopte la même convention : on utilise un triangle noir, pour évoquer la définition parente de la variable. Par exemple considérons l'expression suivante :

`g(x) = int_0^x overset(▴)(x) x dx`

L'itérateur ne s'applique qu'au seul élément différentiel `dx` et donc définie une variable locale `x` qu'il fait varier de `0` à `x`. Noter alors que le symbole `x` (en haut), utilisé pour définir la borne de fin de cette variable d'itération, ne fait pas référence à la variable d'itération car celle-ci n'est pas encore définie, et la définition n'est pas sensée être récursive. Elle fait donc référence à la définition parente qui indique que `x` est l'argument de `g`. Après cette égalité, la variable d'itération `x` est définie, et tout symbole `x` qui suit dans la portée de l'itérateur, fera référence à la variable d'itération, sauf s'il est préfixé d'un triangle noir, auquel cas il fera référence à la définition parente. Ainsi par exemple, nous avons :

`g(x) = int_0^x overset(▴)(x)xdx`
`g(x) = x int_0^x xdx`
`g(x) = x[x^2/2]_(x=0)^x`
`g(x) = x^3/2`

L'égalité `g(x) = int_0^x overset(▴)(x)xdx` est équivalente à l'égalité `g(x) = int_0^x xydy`.

L'usage du triangle noir permet d'éviter de démultiplier les noms de variable.

S'il il y a plusieurs éléments différentiels alors il faut préciser sur quel élément différentiel porte l'intégrale, et cela se précise en nommant la variable locale en indice. Par exemple :

`g(x) = int_(x=0)^x f(x,y)dxdy`

Dans une intégrale, le domaine d'intégration peut être précisé en indice de l'intégrale. Etant donné un intervalle ouvert `A="]"a,b"["`. Nous avons :

`int_A f(x)dx = int_("]"a,b"[") f(x)dx = int_a^b f(x)dx`

Autre convention, lorsque l'on manipule une variable discrète `x` évoluant dans un ensemble de valeurs `A"=Arr"(x)`, les sommes utilisant le symbole de la variable `x` comme variable de sommation et qui ne mentionnent pas de domaine de sommation, auront comme domaine de sommation par défaut l'ensemble d'arrivé de la variable `x`.

`sum_x`  signifie  `sum_(x in A)`

Si l'ensemble où évolue `x` est standardisé en `"A"={0,1,2...,n}` alors cela correspondra à :

`sum_x`  signifie  `sum_(x = 0)^(n-1)`

L'ensemble d'arrivé étant utilisé par défaut, une condition peut être mise en indice pour désigner seulement une partie de cet ensemble. Par exemple :

`sum_(x<b)`  signifie  `sum_(x in A "et" x<b)`

De même lorsque l'on utilise une variable continue `x` évoluant dans un intervalle `A"=Arr"(x)`, les intégrales utilisant le symbole de la variable `x` mis en indice de l'itérateur et qui ne mentionnent pas de domaine d'intégration, auront comme domaine d'intégration par défaut cet ensemble d'arrivé de `x` qui constitue un intervalle ouvert.

`int_x`  signifie  `int_(x in A)`

Si l'ensemble où évolue `x` est standardisé en `A"=]"0,1"["` alors cela correspondra à :

`int_x`  signifie  `int_(x=0)^1`

L'ensemble d'arrivé étant utilisé par défaut, un bornage peut être mis en indice pour désigner seulement une partie bornée de cet ensemble. Par exemple :

`int_(x<1)`  signifie  `int_(x in A "et" x<1)`

Puis, lorsqu'il n'y a pas de domaine d'intégration spécifié ni de référence à une variable continue, alors l'intégrale désigne une fonction à une constante près, appellée la primitive de `f`.

`int f(x)dx`

4) Loi de probabilité discrète `L_([x])`

On définit la probabilité par son sens commun. La probabilité d'un évènement s'obtient en passant à la limite lorsque le nombre `t` de tirages tend vers l'infini. C'est ce vers quoi tend le nombre de tirages où l'évènement se produit divisé par le nombre total `t` de tirages, lorsque `t` tend vers l'infini. Cela définit la probabilité sans avoir besoin d'utiliser la théorie de la mesure. Faut-il encore que cette limite existe, que la suite qui la définit soit convergente. Dans le cas général, cette limite est égale à l'ensemble des points de l'espace complet qui adhérent à la suite, et lorsque la suite converge, cet ensemble est réduit à un singleton.

La probabilité de l'évènement `overset(***)x"="x` est définie par la limite suivante :

`P(overset(***)x"="x) = lim_(t->∞) 1/t sum_(t=1)^t(x(t)"="x)`

Dans cette expression, le terme `x(t)` désigne le tirage de la variable `x` à l'intant `t`, tandis que le terme `x` du second membre de l'égalité ne peut pas désigner la variable `x` pour une question de typage, et donc désigne un nouveau paramètre qui, puisqu'il possède le même nom que celui de la variable `x`, appartient à son ensemble d'arrivée `"Arr"(x)`. Puis, le terme `( x(t)"="x )` vaut `1` lorsque `x(t)"="x`, et vaut `0` lorsque `x(t)"≠"x`. Remarquez que l'itérateur de somme définit une variable locale `t` variant de `1` à `t` où ce dernier `t` fait référence au `t` parent défini dans l'opérateur limite. Le fait que cet indice local ne commence pas par zéro et qu'il ommet ainsi le premier tirage n'a aucune importance, l'omission d'un nombre fini de tirages ne change pas la valeur de la limite.

L'ensemble de ces probabilités, lorsqu'elles sont toutes définies, forme la loi de probabilité discrète de `x` que l'on note `L_([x])`.

`L_("["x"]") in ("Arr"(x)"→"[0,1])`

`L_("["x"]") = {x"↦"P(overset(***)x"="x) "/" x"∈Arr"(x)}`

Autrement dit :

`L_("["x"]")(x)=P(overset(***)x"="x)`

Puis par commodité on nomme parfois la loi avec la même lettre que la variable mais en majuscule.

`X=L_([x])`

`X(x)=P(overset(***)x"="x)`

On étudie les variables discrètes de loi de probabilité partout définie, que l'on appelle simplement variable de loi discrète. La loi de probabilité de `x` notée `X` constitue une distribution normée, c'est à dire qu'elle satisfait :

`sum_x X(x)=1`

Lorsque la variable est d'évolution temporelle continue c'est à dire lorsque `"Dép(x)="RR^"+"`, pour des raisons relative à la physique, on ne considèrera que des variables infiniment dérivables en fonction du temps. Dés lors, nous verrons plus tard que les évènements discrets pour de telles variables ont une probabilité d'un ordre strictement inférieur à ceux des évènements différentiels, et donc sont omis dans le calcul de la probabilité.

Récapitulons :

Loi de probabilité discrète `X`
de la variable `x`
`X in ("Arr"(x)"→"[0,1])`
   `sum_x X(x) = 1`   
`X(x) = P(overset(***)x"="x)`
`X(x) = lim_(t->∞) 1/t sum_(t=1)^t (x(t)"="x)`   
`"Arr"(x)` 
Domaine où évolue la variable `x`.
`x` de type `"Arr"(x)`
Paramètre désignant une valeur envisageable pour `x`.
`x` de type `NN"→Arr"(x)` Variable de loi discrète
`x(t)`
Valeur de la variable `x` à l'instant `t`.
`X`
Loi de probabilité de la variable `x`, notée également par `L_([x])`
`X(x)`
Probabilité que le tirage de la variable `x` soit égal au paramètre `x`.
`t`
Nombre de tirages.
`t` défini dans la somme
Indexe des tirages.
`overset(***)x`
Tirage de la variable `x`.
`overset(***)x"="x`

Événement lorsque le tirage de la variable `x` est égal au paramètre `x`.

`(x(t)"="x)`
Vaut `1` si `x(t)"="x`, et vaut `0` sinon.

Dans cette expression, l'égalité `(x(t)"="x)` est évaluée et vaut `1` si il y a égalité et `0` sinon. Le premier membre de l'égalité est le tirage à l'instant absolu `t` de la variable `x` donné par la définition de `x`, tandis que le second membre de l'égalité n'étant pas appliqué, il ne peut être interprété comme une variable, et il est donc interprété comme le paramètre `x`.
Remarquez le mécanisme de masquage des variables dans cette expression : Le premier `t` désigne un nombre de tirages tendant vers l'infini. Le `t` en bas de l'itérateur de sommation est la création d'une variable désignant l'indice du tirage. Le `t` en haut de l'itérateur de sommation fait partie de la définition en cours qui n'est pas récurcive et donc qui fait référence au `t` précédent, désigant le nombre de tirages. Le `t` apparaissant dans la sommation désigne l'indice de tirage, car la définition de cet indice `t` masque la définition parente de `t` représentant le nombre de tirage. Le fait que cet indice local `t` ne commence pas par zéro et qu'il ommet ainsi le premier tirage n'a aucune importance, l'omission d'un nombre fini de tirages ne change pas la valeur de la limite.

Une loi de probabilité discrète `X` est une distribution discrète normée. Si la variable `x` évolue dans `{0,1,2...,n}` alors la loi `X` est définie par les `n"+"1` probabilités élémentaires `X(0),X(1),X(2)...,X(n)` que l'on note parfois de manière condensée `p_0,p_1,p_2...,p_n`. Et comme la somme des probabilités doit être égale à `1`, il suffit d'en connaître `n` pour toutes les connaître.

La connaissance par exemple de `X(5) = 1"/"3` signifie que lors d'un tirage, la variable aléatoire a une probabilité `1"/"3` de valoir `5`.

4.1) Exemple d'une variable discrète qui n'est pas une variable de loi discrète

Dans le cas d'une variable discrète quelconque, cette limite ne converge pas nécessairement, et la probabilité peut alors ne pas être définie par une valeur. Par exemple, pour la variable `x` définie comme suit :

 `x(t) = (EEn "∈" NN, 2^(2n)"<"t"<"2^(2n+1))`

où la proposition logique qui est entre parenthèse est évaluée à `1` si elle est vrai, et `0` sinon. Les probabilités des évènements `overset(***)x"="1` et `overset(***)x"="0` s'avèrent identiques mais aucune des deux ne convergent, et donc leur probabilité n'est pas une valeur mais un ensemble de valeurs, les valeurs adhérentes à la suite. Nous avons :

`lim_(t->∞) sum_(t=1)^t (x(t)"="1)    =    lim_(t->∞) sum_(t=1)^t (x(t)"="0)    =    {0,1}`

Cette variable discrète n'est donc pas une variable de loi discrète.

4.2) Exemple de variables de loi discrète qui ne sont pas des « variables aléatoires ».

Puis, même si une variable discrète atteint le statut de variable de loi discrète, elle ne sera pas encore qualifiable de « variable aléatoire », car certains évènements complexes tel que par exemple l'évènement consistant en l'égalité de deux tirages successifs, et qui se note `overset(***)x(0)"="overset(***)x(1)`, n'ont pas forcement une probabilité bien définie (non convergente).

Parcontre dans le cas où les tirages sont indépendants, propriété que nous décrirons plus tard, la variable, même seulement de loi discrète, devient nécessairement de loi discrète et constitue une variable aléatoire, car tout les évènements définissables sur cette variable ont alors une probabilité bien définie (convergente).

5) Calcul différentiel

Le calcul différentiel est rendu facile grâce au corps des hyperréels `"*"RR` qui permet de manipuler les infiniment grands et les infiniment petits comme des nombres, et grâce à la notion formelle d'ordre de grandeur qui l'accompagne. Une égalité dans le corps des hyperréels précisera l'ordre près à la quelle elle s'applique. Et cela se fait en utilisant les notations de Landau.

Le corps des hyperréels est une extension de corps totalement ordonné, comprenant tous les infinis qu'il est possible de définir dans ce cadre d'un corps totalement ordonné.

5.1) Notation de Hardy

Présentons d'abord les notations de Hardy qui comparent les ordres de grandeurs. Considérons deux valeurs hyperréels positives `r` et `u` :

  1. Nous dirons que `r` est négligeable devant `u`, ce qui se note `r"≺"u`, si et seulement si multiplié par n'importe quel entier, il est toujours inférieur à `u`. C'est à dire lorsque `AAn"∈"NN, nr"<"u`.
     
  2. Nous dirons que `r` est de l'ordre de `u`, ce qui se note `r"≼"u`, si et seulement s'il est inférieur à un multiple entier arbitraire de `u`. C'est à dire lorsque `EEn"∈"NN,r"⩽"n u`. Par exemple, si `v` est proportionnel à `u` cela signifit que `v` est de l'ordre de `u`, mais pas l'inverse car le facteur de propostionnalité peut être zéro.
     
  3. Nous dirons que `r` est du même ordre que `u`, ce qui se note `r"≍"u`, si et seulement s'il est inférieur à un multiple entier arbitraire de `u` et que `u` est inférieur à un multiple entier arbitraire de `r`. C'est à dire lorsque `EE(n,m)"∈"NN^2,r"⩽"n u "et" u"⩽"mr`.
Description
Notation
de Hardy
Définition
`r` d'ordre inférieur à `u`,
négligeable devant `u`.
`r"≺"u`
`AAn"∈"NN, nr"<"u`
`r` d'ordre inférieur ou égal à `u`,
de l'ordre de `u`.
`r"≼"u`
`EEn"∈"NN,r"⩽"n u`
`r` d'ordre égal à `u`,
du même ordre que `u`.
`r"≍"u`
`EE(n,m)"∈"NN^2,r"⩽"n u "et" u"⩽"mr`  

Les mêmes notations sont utilisées pour comparer des applications dans `RR`. Les infinis sont remplacées par des applications qui tendent vers l'infini. Et la comparaison de ces infinis se manifeste par l'existence d'un indice `k` arbitrairement grand à partir duquel toutes les valeurs des applications obéïssent aux règles de comparaison demandées :

`f"≺"g <=> AAn"∈"NN, EEk"∈"E, AAx"⩾"k, nf(x)"<"g(x)`

`f"≼"g <=> EEn"∈"NN, EEk"∈"E, AAx"⩾"k, f(x) "⩽"ng(x)`

`r"≍"u <=> EE(n,m)"∈"NN^2, EEk"∈"E, AAx"⩾"k, f(x) "⩽"ng(x) "et" g(x)"⩽"mf(x)`  

Les même notations sont utilisées dans `NN` pour comparer des variables dites arbitrairement grandes, comparant en fait, la velléité du démonstrateur à les décider arbitrairement grandes.

5.2) Notation de Landau

Présentons les notations de Landau qui définissent des ordres de grandeurs. Considérons une valeur hyperréel `u` :

  1. L'ensemble des valeurs négligeable devant `u` se note `o(u)`, dit petit `o` de `u`. Il comprend toutes les valeurs dont la norme multipliée par n'importe qu'elle entier restent toujours inférieure à `|u|`.
     
  2. L'ensemble des valeurs de l'ordre de `u` se note `O(u)`, dit grand `O` de `u`. Il comprend toutes les valeurs dont la norme est inférieure à un multiple entier arbitraire de `|u|`. Par exemple, si `v` est proportionnel à `u` cela signifit que `v` est de l'ordre de `u`, ce qui se note `v"="O(u)`, mais pas l'inverse car le facteur de propostionnalité peut être zéro.
     
  3. L'ensemble des valeurs du même ordre que `u` se note `Theta(u)`. Il comprend toutes les valeurs `r` dont la norme est inférieure à un multiple entier arbitraire de `|u|` et tel que la norme de `u` est inférieure à un multiple entier arbitraire de `|r|`.
Description
Notation
de Landau
Définition
Ensemble des valeurs
d'ordre inférieur à `u`,
négligeable devant `u`.
`o(u)`
`{r "/" AAn"∈"NN,n|r|"<"|u|}`
Ensemble des valeurs
d'ordre inférieur ou égal à `u`,
de l'ordre de `u`.
`O(u)`
`{r "/" EEn"∈"NN,|r|"⩽"n|u|}`
Ensemble des valeurs
d'ordre égal à `u`,
du même ordre que `u`.
`Theta(u)`
`{r "/" EE(n,m)"∈"NN^2,|r|"⩽"n|u| "et" |u|"⩽"m|r|}`

Les notations de Landau et de Hardy sont liées comme suit :

`o(u) = {r "∈""*"RR "/" |r| "≺"|u|}`

`O(u) = {r "∈""*"RR "/" |r| "≼" |u|}`

`Theta(u) = {r "∈""*"RR "/" |r| "≍" |u|}`

Puis on adopte une convention d'écriture : Lorsque un ensemble de Landau apparait dans une équation, cela signifie que l'équation est valable pour au moins un élément de cet ensemble. Ainsi la proposition `v"="o(u)` est identique à `v"∈"o(u)`. Ainsi, l'égalité ci-dessous signifie que `A` est égale à `B` selon `u`, c'est à dire à une valeur près négligeable devant `u` :

`A=B+o(u)`

L'égalité ci-dessous signifie que `A` est égale à `B` à l'ordre de `|u|`, c'est à dire à un facteur fini près de u` :

`A=B+O(u)`

Et l'égalité ci-dessous signifie que `A` et `B` sont séparé d'un ordre égale à `u`, c'est à dire que `|A"-"B|` est égale à un facteur fini et non infinitésimal de `u` :

`A=B+Theta(u)`

Le grand `O` de `1`, noté `O(1)`, désigne l'ensemble des valeurs de l'ordre de `1` c'est à dire de norme finie, soit `RR`. Le petit `o` de `1`, noté `o(1)`, représente l'ensemble des valeurs négligeables devant `1` c'est à dire de norme infiniment petite devant `1`, soit `epsilonRR``epsilon` représente l'infiniment petit du premier ordre.

Puis on adopte une seconde convention d'écriture : Lorsque les termes d'une égalité `x"="y` sont de l'ordre `O(1)` c'est à dire qu'ils sont finis, alors l'égalité est implicitement valable à l'écart près d'une valeur de norme infiniment petite devant `1` ce qui se note explicitement par `x"="y"+"o(1)`. Et cette règle s'applique pour tous les ordres, faisant que si les termes `x` et `y` sont de l'ordre de `u` ce qui se note `x"="O(u)` et `y"="O(u)`, alors l'égalité `x"="y` signifiera `x"="y"+"o(u)`. Et si il l'ordre de grandeur du premier membre et du second membre est inconnue cela signifit nécessairement que `x"="y"+"o(x+y)`.

Les mêmes notations sont utilisées pour comparer des applications dans `RR`. Les infinis sont remplacées par des applications qui tendent vers l'infini. Et la comparaison de ces infinis se manifeste par l'existence d'un indice `k` arbitrairement grand à partir duquel toutes les valeurs des applications obéïssent aux règles de comparaison demandées :

`o(g) = {f "/" AAn"∈"NN, EEk"∈"E, AAx"⩾"k, n|f(x)|"<"|g(x)|}`

`O(g) = {f "/" EEn"∈"NN, EEk"∈"E, AAx"⩾"k, |f(x)| "⩽"n|g(x)|}`

`Theta(g) = {f "/" EE(n,m)"∈"NN^2, EEk"∈"E, AAx"⩾"k, |f(x)| "⩽"n|g(x)| "et" |g(x)|"⩽"m|f(x)|}`  

6) Loi de probabilité continue `L_([x])`

Considérons une variable continue `x` évoluant dans l'intervalle `"]"0,1"["`. La variable est définie par la suite de ses valeurs `x(1),x(2),x(3)...`.

L'élément différentiel `dx` désigne une variation du paramètre `x`, infiniment petite par rapport à `1`, ce qui se note `dx -< 1`. Mais le calcul différentiel se ramène toujours à un calcul de limite, en prenant comme valeurs différentielles des valeurs réels tendant vers zéro. Ainsi, `dx` représente une petite variation arbitrairement petite ce qui se note pareillement : `dx -< 1`.

L'évènement différentiel `overset(***)x"∈]"x, x"+"dx"["` se réalise lorsque la valeur du tirage de la variable `x` appartient à l'intervalle `"]"x, x"+"dx"["``dx` est choisi positif `dx">"0`. Sa probabilité différentielle se note `P(overset(***)x"∈]"x, x"+"dx"[")`

Pour définir la probabilité différentielle nous utilisons donc deux infiniments grands, un pemier infiniment grand `1"/"dx` qui correspond au nombre d'éléments différentiels couvrant `"]"0,1"["`, et un second infiniment grand `t` qui est le nombre de tirages, et qui doit être d'un ordre plus élevé que le premier. L'utilisation de deux infiniment grands d'ordre distinct se traduit dans `NN` par la notion de deux nombres arbitrairement grand et de différence arbitrairement grande, leur définition formelle peut aboutire à la structure des hyperréels, et cela se note :

`1-<1/dx -<t`

La probabilité de l'évènement différentiel `overset(***)x"∈]"x"+"dx"["` est alors définie ainsi :

`P(overset(***)x"∈]"x"+"dx"[") = lim_(t->∞) 1/t sum_(t=1)^t (x(t)"∈]"x"+"dx"[")`

Dans cette expression, le terme `x(t)` désigne le tirage de la variable `x` à l'instant `t`, tandis que le terme `x` non appliqué ne peut pas désigner la variable `x` pour une question de typage, et donc désigne un nouveau paramètre qui, puisqu'il possède le même nom que celui de la variable `x`, appartient à son ensemble d'arrivée `"Arr"(x)`. Puis, le terme `(x(t)"∈]"x"+"dx"[")` vaut `1` lorsque `x(t)"∈]"x"+"dx"["`, et vaut `0` lorsque `x(t)"∉]"x"+"dx"["`. Remarquez que l'itérateur de somme définie une variable locale `t` variant de `1` à `t` où ce dernier `t` fait référence au `t` parent définie dans l'opérateur limite. Le fait que cet indice local ne commence pas par zéro et qu'il ommet ainsi le premier tirage n'a aucune importance, l'omission d'un nombre fini de premiers tirages ne change pas la valeur de la la limite.

Puis, on considère des variables continues qui se manifestent continûment, autrement dit nous supposons que la loi de probabilité est continue, cela signifie que la probabilité différentielle est proportionnelle à `dx` c'est à dire est de l'ordre de `dx`.

`P(overset(***)x"∈]"x, x"+"dx"[") = O(dx)`

Et quelque soit un entier `n-<1"/"dx` nous avons :

`P(overset(***)x"∈]"x, x"+"ndx"[") = nP(overset(***)x"∈]"x, x"+"dx"[") + o(dx)`

Et en particulier, nous avons `P(overset(***)x"="x) = o(dx)` qui est négligeable devant `dx`. La probabilité différentielle étant de l'ordre de `dx`, elle est divisée par `dx` pour définir une densité de probabilité de l'ordre de `1` :

`(P(overset(***)x"∈]"x"+"dx"["))/dx = O(1)`

L'ensemble de ces densités de probabilités, lorsqu'elles sont toutes définies, forme la loi de probabilité continue de `x` que l'on note pareillement que dans le cas discret, par un grand `L` indicé par le nom de la variable entre crochets droits, `L_([x])`.

`L_([x]) in ("Arr"(x)"→"[0,1])`

`L_([x]) = {x"↦"(P(overset(***)x"∈]"x"+"dx"["))/dx "/" x"∈Arr"(x)}`

Autrement dit :

`L_([x])(x)=(P(overset(***)x"∈]"x"+"dx"["))/dx`

Puis par commodité on nomme parfois la loi avec la même lettre que la variable mais en majuscule.

`X=L_([x])`

`X(x)=(P(overset(***)x"∈]"x"+"dx"["))/dx`

On étudie les variables continue de loi de probabilité continue, que l'on appelle simplement variable de loi continue.

La loi de probabilité de `x` est l'application `x|->X(x)dx` tandis que l'application `x|->X(x)` est la loi de densité de probabilité, néanmoins on l'appelle aussi la loi de probabilité continue de `x`, et c'est elle qui est désignée ainsi par la même lettre que la variable source mais en majuscule.

La densité de probabilité multipliée par un élément différentiel d'espace donne la probabilité que le tirage de la variable `x` soit dans cet intervalle différentiel d'espace. Notez que les termes de l'égalité définissant `X(x)` sont de l'ordre de `O(1)` et donc que l'égalité est définie à `o(1)` près, c'est à dire à l'écart près d'une valeur de norme infiniment petite devant `1` :

`X(x)=(P(overset(***)x"∈]"x"+"dx"["))/dx + o(1)`

Cette fonction de densité de probabilité `X`, appelée également loi de probabilité continue de `x`, associe à chaque valeur `x` envisageable, un rapport entre deux valeurs infinitésimales. Le numérateur contient la probabilité que le tirage soit dans l'intervalle différentiel `"]"x, x"+"dx"["`. Le dénominateur contient la valeur infinitésimale positive `dx`.

On en déduit que :

`X(x)dx = P(overset(***)x"∈]"x, x"+"dx"[") + o(dx)`

La loi de probabilité de `x` notée `X` constitue une distribution normée, c'est à dire qu'elle satisfait :

`int_x X(x)dx = 1`

Lorsque la variable est d'évolution temporelle continue c'est à dire lorsque `"Dép(x)="RR^"+"`, la somme des tirages est remplacée par l'intégrale des tirages :

`P(overset(***)x"∈]"x"+"dx"[") = lim_(t->∞) 1/t int_(t=0)^t (x(t)"∈]"x"+"dx"[") dt`

Récapitulons :

Loi de probabilité continue `X`
de la variable `x`
`X in ("Arr"(x)"→"]0,1[)`
    `int_x X(x)dx = 1`   
`X(x)dx = P(overset(***)x"∈]"x, x"+"dx"[")`
`X(x) = lim_(dx->0) lim_(t->∞) 1/(tdx) sum_(t=1)^t (x(t)"∈]"x,x"+"dx"[")`      
`X(x) = lim_(dx->0) lim_(t->∞) 1/(tdx) int_(t=0)^t (x(t)"∈]"x"+"dx"[") dt`  
`"Arr"(x)` 
Domaine où évolue la variable `x`.
`x` de type `"Arr"(x)`
Paramètre désignant une valeur envisageable pour `x`.
`x` de type `NN"→Arr"(x)` Variable de loi discrète
`x(t)`
Valeur de la variable `x` à l'instant `t`.
`X`
Loi de probabilité de la variable `x`, notée également par `L_([x])`
`X(x)`
Densité de probabilité en `x`.
`X(x)dx`
Probabilité que le tirage de `x` appartienne à l'intervalle différentiel `"]"x, x"+"dx"["`.
`dx`
Variation arbitrairement petite de `x` telle que `1 ≺ 1"/"dx ≺ t`
`t`
Nombre de tirages arbitrairement grand tel que `1 ≺ 1"/"dx ≺ t`
`t` défini dans la somme
Indexe des tirages. Temps discret.
`overset(***)x`
Tirage de la variable `x`.
`overset(***)x"="x`

Événement lorsque le tirage de la variable `x` est égal au paramètre `x`.

`(x(t)"∈]"x,x"+"dx"[")`
Vaut `1` si `x(t)"∈]"x,x"+"dx"["`, et vaut `0` sinon.

L'ordre des limites détermine l'ordre des arbitrairement grands. Par exemple, l'expression `lim_(a->∞) lim_(b->∞) f(a,b)` introduit deux arbitrairements grands `a` et `b` tels que `1 ≺ a ≺ b`, car pour chaque valeur de `a` , une limite lorsque `b` tend vers l'infini est calculée, faisant que nécessairement `a ≺ b`.

`dx` étant déjà un infiniment petit, il parait redondant de prendre la limite lorsqu'il tend vers zéro. Cette redondance est nécessaire pour préciser l'ordre des différentes valeurs arbitraires, et faire que les arbitrairement grands invoqués soient dans cet ordre :

`1 ≺ 1"/"dx ≺ t`

Dans le cas général, sauf mention contraire, les éléments différentiels tels que `dx` sont supposés positifs. Nous avons avec `dx` positif :

`P(overset(***)x"∈]"x, x"+"dx"[" ) = X(x)dx + o(dx)`
`P(overset(***)x"∈]"x, x"-"dx"[") = X(x)dx+ o(dx)`
`P(overset(***)x"∈]"x"-"dx, x"+"dx"[") = 2X(x)dx+ o(dx)`
`P(overset(***)x"∈]"x"+"rdx, x"+"(r"+"n)dx"[") = nX(x)dx+ o(dx)`
  avec  `r ≺ 1"/"dx` et `n≺ 1"/"dx` et `n>=0`

La loi `X` étant continue, nous avons l'approximation suivante :

`X(x"+"dx) = X(x) + o(1)`
`X(x"+"dx)dx = X(x)dx + o(1)dx`
`X(x"+"dx)dx = X(x)dx + o(dx)`
`X(x"+"rdx)dx = X(x)dx + o(dx)`  
avec  `r≺ 1"/"dx`

La probabilité que le tirage ait lieu dans un même intervalle, mais translaté d'une valeur infinitésimale de l'ordre de `dx`, est la même à `o(dx)` près, c'est à dire à l'écart près d'une valeur négligeable devant `dx`.

`P(overset(***)x"∈]"x"+"dx, x"+"2dx"[" ) = P(overset(***)x"∈]"x, x"+"dx"[") + o(dx)`

Considérons une variable de loi de probabilité continue `X`. Par exemple, la connaissance `f(5) = 3` signifie que, lors d'un tirage, la variable a une probabilité `3 dx` d'appartenir à l'intervalle `"]"5, 5"+"dx"["`, et également une probabilité `3 dx` d'appartenir à l'intervalle `"]"5"-"dx,5"["`, et une probabilité `9 dx` d'appartenir à l'intervalle `"]"5"-"dx, 5"+"2dx"["`.

7) Parallélisme entre loi discrète et loi continue

On étudie les variables de loi discrète et les variables de loi continue. Pour ces dernières variables, les probabilités des évènements `overset(***)x"="x` sont d'un ordre différentiel strictement inférieur à celles des évènements `overset(***)x"∈]"x"+"dx"["`, et peuvent donc être omises.

Puis on étudie les variables de loi mixte qui sont sommes d'une variable de loi continue et d'une variable de loi discrète.

On pose une hypothèse théorique sur les sources de données afin d'éviter d'avoir à étudier la théorie de la mesure. Et avec cette hypothèse, chaque variable source de données pour laquelle la probabilité peut être définie, se décompose de façon unique en une somme d'une variable de loi continue et d'une variable de loi discrète.

Il existera une transcriptions formelles entre variable de loi discrète et variable de loi continue, où l'élément pour l'un correspond à l'élément différentiel pour l'autre, où l'évènement discret élémentaire pour l'un correspond à l'évènement différentiel élémentaire pour l'autre. Et certaines conditions supplémentaires rendront cette transcription biunivoque.

8) Tirage indépendant et variable aléatoire

Le concept de tirage au sort doit être interprété ici comme l'affirmation d'une totale indépendance entre les tirages successifs. Cet unique principe, dit d'indépendance des tirages, non encore formalisé et aux conséquences innombrables, préside à la définition des lois de probabilité à tirages indépendants.

Si les tirages sont indépendants alors la variables discrète est nécessairement aléatoire, c'est à dire que toutes les évènements exprimables dans le langage décrit au paragraphe 2, possède une probabilité bien définie (convergente). Et pour une telle variable à tirage indépendant, la probabilité de n'importe quel évènement définissable sur cette variable se ramène toujours à une fonction de une ou plusieurs probabilités d'évènement élémentaire de la forme `overset(***)x"="x` ou `overset(***)x"∈]"x, x"+"dx"["`

Un moyen pour transfomer une variable discrète `x` en une variable `y` à tirage indépendant, consiste à définir `y` comme étant le résultat d'un tirage au sort équiprobable sur un nombre `m` de tirages consécutifs de `x`, où le nombre `m` est arbitrairement grand et s'inscrit dans la suite :

`1 -< 1"/"dx -< t -<m`

9) Anti-intervalle, anti-espace

On généralise la notation d'intervalle pour autoriser des intervalles à l'envers tel que `[1,0]`. La différence entre l'intervalle `[0,1]` et l'intervalle `[1,0]` est qu'ils ne sont pas parcourus dans le même sens, le premier est parcouru dans le sens croissant ou dit positif, le second est parcouru dans le sens décroissant ou dit négatif.

Soit on considère qu'il n'y a pas de différence entre un intervalle de sens positif et un intervalle de sens négatif, auquel cas le lien entre la probabilité et la densité de probabilité consiste en le facteur normé `|dx|` comme suit :

`X(x) = (P(overset(***)x"∈]"x, x"+"dx"["))/|dx|`       sous-entendu  `+ o(1)`

`X(x)|dx| = P(overset(***)x"∈]"x, x"+"dx"[" )`       sous-entendu  `+ o(dx)`

Mais il existe une autre interprétation beaucoup plus intéressante qui laisse inchangée la définition de la probabilité en fonction de la densité de probabilité et que l'on étend pour les éléments différentiels `dx` négatifs :

`X(x) = (P(overset(***)x"∈]"x, x"+"dx"["))/dx`       sous-entendu  `+ o(1)`

`X(x)dx = P(overset(***)x"∈]"x, x"+"dx"[" )`       sous-entendu  `+ o(dx)`

Cela introduit des probabilités négatives pour les intervalles de sens négatif, délors appelés anti-intervalles. La notion d'anti-espace correspond à un espace que l'on retire, et qui peut être défini même si on le retire de rien. Ainsi, on peut définir à l'aide d'un élément `dx` de signe quelconque l'intervalle `"]"x, x"+"dx"["` qui représentera un espace lorsque `dx">"0` et un anti-espace lorsque `dx"<"0`.

10) Variable vectorielle continue

On se place dans un espace orthonormé `RR^n`. Etant donné un vecteur position `vec v` de composantes `vec v=(x,y,z)`, ce vecteur désigne le point de coordonnées `(x,y,z)`. On note `d vecv` l'élément différentiel `d vecv=(dx,dy,dz)` et on note `vec v # d vec v` l'élément différentiel d'espace suivant :

`vec v # d vec v   =   ]x,x"+"dx[ × ]y,y"+"dy[ × ]z,z"+"dz[`

On note `Pi d vecv` le produits des composantes de `d vecv`. Nous avons :

`vec v=(x,y,z)`
`d vecv = (dx,dy,dz)`
`Pi d vecv = dxdydz`

Ainsi `vecv "+" d vecv` désigne un point infiniment voisin de `vecv` obtenue en le déplaçant selon le vecteur `d vecv`, et `vecv#d vecv` désigne un voisinage cartésien de `vecv + d vecv"/"2`, c'est à dire une portion infinitésimale de l'espace, de centre `vecv + d vecv"/"2` et de volume `Πd vecv = dxdydz`, (Le signe indique si c'est un anti-espace ou non, si c'est un espace à retirer ou à ajouter). Le terme de volume correspond à la dimension `3`. On utilise le terme de taille ou de largeur en dimension `1`, de surface en dimension `2`, de volume en dimension `3`, et d'hypervolume en dimension supérieur, ou de quantité d'espace en dimension quelconque. Le voisinage cartésien `vec v#d vecv` possède une quantité d'espace égale à la norme du produit des composantes de `d vecv` qui se note `Πd vecv`.

Dans le cas à une dimension, pour une valeur `x`, nous avons :

`x#dx = ]x, x"+"dx[ `

Une variable vectorielle continue `vec v` comprend des composantes scalaires qui sont des variables continue, par exemple `vec v=(x,y,z)`. Chaque composante `x,y,z` constitue alors une variable continue. Et nous avons :

`"Arr"(vec v) = "Arr"(x)"×Arr"(y)"×Arr"(z)`

Une variable vectorielle `vec v` de loi continue se décrit comme suit :

Loi de probabilité continue `V`
de la variable vectorielle `vec v`
`V in ("Arr"(vec v)"→"]0,1[)`
    `int_vec v V(vec v) Πd vecv = 1`   
`V(vec v) = (P(overset(***)(vec v)"∈vec v # d vec v))/(Πd vecv)`
`V(vec v) = lim_(d vec v ->0) lim_(t->∞) 1/(tΠd vecv) sum_(t=1)^t ( vec v (t)"∈vec v # d vec v )`     
`V(vec v) = lim_(d vec v ->0) lim_(t->∞) 1/(tΠd vecv) int_(t=0)^t ( vec v (t)"∈vec v # d vec v )dt`     
`"Arr"(vec v)` 
Domaine où évolue la variable `vec v`.
`vec v` de type `"Arr"(vec v)`
Paramètre désignant une valeur envisageable pour `vec v`.
`vec v` de type `NN"→Arr"(vec v)` Variable vectorielle de loi discrète.
`vec v(t)`
Valeur de la variable `vec v` à l'instant `t`.
`V`
Loi de probabilité de la variable `vec v`, notée également par `L_([vec v])`.
`V(vec v)`
Densité de probabilité en `vec v`.
`V(vec v)Πd vec v`
Probabilité que le tirage de `vec v` appartienne à la quantité d'espace différentiel `vec v # d vec v`.
`dvec v`
Variation arbitrairement petite de `vec v` telle que `1 ≺ 1"/"|Πd vecv|≺ t`
`t`
Nombre de tirages arbitrairement grand tel que `1 ≺ 1"/"|Πd vecv|≺ t`
`t` défini dans la somme
Indexe des tirages. Temps discret.
`overset(***)(vec v)`
Tirage de la variable `vec v`.
`overset(***)(vec v)"="vec v `

Événement lorsque le tirage de la variable `vec v` est égal au paramètre `vec v`.

`( x(t)"∈vec v # d vec v )`
Vaut `1` si `x(t)"∈vec v # d vec v`, et vaut `0` sinon.

Considérons une variable vectorielle de loi continue suivante :

`vec v=((x),(y),(z))`

Nous avons :

`V(vec v)Πd vecv = P(overset(***)(vecv) ∈ vecv#d vecv)`

`V(vec v)dxdydz = P(overset(***)x "∈]"x,x"+"dx"["  "et"  overset(***)y "∈" "]"y,y"+"dy"["  "et"  overset(***)z "∈" "]"z,z"+"dz"[")`

`V(vec "v")` est la densité de probabilité de la variable `vec v` au point `vec v`, et `V(vec v) Pi d vec v` est la probabilité que le tirage la variable `vec v` soit dans le volume `vec v # d vec v`.

11) Fonction cumulative

Etant donné une variable `x`, on considère la probabilité `P(overset(***)x<x)` d'obtenir un tirage inférieur au paramètre `x`. L'ensemble de ces probabilités, lorsqu'elles sont toutes définies, forme la fonction cumulative de la variable `x` que l'on note `F_([x])`.

`F_("["x"]") in ("Arr"(x)"→"[0,1])`

`F_("["x"]") = {x"↦"P(overset(***)x"<"x) "/" x"∈Arr"(x)}`

Autrement dit :

`F_("["x"]")(x)=P(overset(***)x"<"x)`

Puis par commodité on nomme parfois la loi avec la même lettre que la variable mais en gras majuscule `bbX` faisant que `bbX"="F_([x])` et donc que `bbX(x)"="P(overset(***)x"<"x)`. Puis il existe une autre façon courante de nommer la loi ainsi que la fonction cumulative d'une variable simplement par `f` et `F` en sous entendant que cela s'applique à la variable en question, faisant que `f"="L_([x])` et `F"="F_([x])`.

La fonction cumulative d'une variable `x` appliquée au paramètre `x`, notée `F_([x])(x)` où simplement `F(x)`, est définie comme étant la probabilité d'obtenir un tirage inférieur au paramètre `x`, avec une petite nuance dans le cas discret selon les traditions, pour la conception anglaise, notée `F_[⩽x](x)` où simplement `F_⩽(x)` , inférieur ou égal au paramètre `x`, et pour la conception française, notée `F_[x](x)` où simplement `F(x)`, inférieur strictement au paramètre `x`. Cela ne change rien pour les variables de loi continue, mais cela décale d'un cran pour les variables de loi discrète. En effet, pour une variable de loi discrète `f` définie sur `{0,1,2,...,n}`, la fonction cummulative `F` peut se définir de façon formelle et universellement admise comme suit :

`{0,1,2,...,n}"±"½ = {0"-"½,1"-"½,2"-"½,...,n"-"½,n"+"½}`

Et nous avons :

`F("-"½) = 0`

`F(1"-"½) = f(1)`

`F(2"-"½) = f(1)+f(2)`

...

`F(n"-"½) = f(1)+f(2)+f(3)+...+f(n"-"1)`

`F(n"+"½) = 1`

Mais si nous voulons absolument aligner le domaine de définition de la fonction cumulative sur celui de la loi de probabilité, alors il nous faut choisire une des deux solutions évoquées plus haut, la stricte notée `F`, ou la non stricte notée `F_⩽`.

Fonction cumulative stricte :
`F(x) = P(overset(***)x"<"x)`
Fonction cumulative non stricte :
`F_⩽(x) = P(overset(***)x"⩽"x) = F(x) "+" f(x)`

`F_⩽(x) = P(overset(***)x"⩽"x)`
`F_⩽(x) = P(overset(***)x"="0) + P(overset(***)x"="1) + P(overset(***)x"="2)... + P(overset(***)x"="x)`
`F_⩽(x) = f(0) + f(1) + f(2)... + f(x) `
`F_⩽(x) = sum_(x=0)^x f(x)`

`F(x) = f(0) + f(1) + f(2)... + f(x"-"1) `
`F(x) = sum_(x=0)^(x-1) f(x)`

Par convention on étend les fonctions `F` et `F_⩽` aux autres entiers comme suit :

`x"<"0 => F(x)"="0`

`x">"n => F(x)"="1`

Le pas de la fonction cumulative donne la loi de probabilité :

`AAx "∈" NN, f(x) = F_⩽(x) - F_⩽(x"-"1)`

`AAx "∈" NN, f(x) = F(x"+"1) - F(x)`

Et dans le cas d'une variable `x` de loi continue `f` définie sur `]0, n[`, la problèmatique précédente n'existe plus, et sa fonction cumulative `F` se calcul comme suit et constitue la primitive de la loi de probabilité :

`F(x) = P(overset(***)x"<"x)`
`F(x) = int_0^x P(overset(***)x "∈]"x, x"+"dx"[" )`
`F(x) = int_0^x f(x)dx`

Le différentiel de la fonction cumulative donne la loi de probabilité :

`dF(x) = F(x"+"dx)-F(x) = f(x)dx`

La dérivé de la fonction cumulative donne la loi de densité de probabilité :

`F'(x) = (dF(x))/(dx) = f(x)`

La fonction cumulative est appelée la primitive, l'intégrale ou la somme de la loi. Et dans le cas de variables continue, nous avons toujours : `F(0) "=" 0` et `F(n) "=" 1`.

Toute fonction croissante `F` de `"Arr"(x)"→"[0, 1]`, après centrage et normage, peut être une fonction cumulative, et donc permet de définir une loi de probabilité.

La fonction cumulative peut se calculer de manière empirique en prenant la limite lorsque le nombre de tirages tend vers l'infini, du nombre de tirages satisfaisant `overset(***)x"<"x` divisé par le nombre totale de tirages. Lorsque la variable `x` est d'évolution temporelle continue, la somme est remplacée par l'intégrale.

Fonction cumulative `F` d'une variable `x`

  `F(x) = P(overset(***)x"<"x)`

  `F(x) = lim_(t->∞) 1/t sum_(t=1)^t (x(t)<x)`

  `F(x) = lim_(t->∞) 1/t int_(t=0)^t (x(t)<x)dt`

  `P(overset(***)x "∈["a,b"[") = F(b)-F(a)`

Cas d'une variable `x`
de loi discrète `f`
définie sur `{0,1,2,...,n}`

  `F(0) = 0`

  `F(n) = 1-f(n)`

  `F(x) =  sum_(x=0)^(x-1) f(x)`

  `f(x) = F(x"+"1) - F(x)`

Cas d'une variable `x`
de loi continue `f`
définie sur `]0..n[`

  `F(0) = 0`

  `F(n) = 1`

  `F(x) =  int_0^x f(x)dx`

  `f(x) = (F(x"+"dx)-F(x))/dx`

  `f(x) = F'(x)=(dF(x))/(dx)`

  `P(overset(***)x "∈["a, b"[")` : Probabilité que le tirage de la variable `x` appartienne à `"["a,b"["`.
  `F` : Fonction cumulative de la variable `x`, notée également par `F_([x])` dans le cas continu.
  `F` : Fonction cumulative stricte de la variable `x`, notée également par `F_([x])` dans le cas discret.
  `f` : Loi de la variable `x`, notée également par `L_([x])`.
  `overset(***)x` : Tirage de la variable `x`.
  `x, a, b` : Paramètres appartenant à `"Arr"(x)`.
  `t`
: Nombre de tirages.
  `t`
défini dans la somme : Indexe des tirages. Temps discret.
  `t` défini dans l'intégrale : Temps continu.
  `x(t)` : Valeur de la variable `x` à l'instant `t`.

Dans le cas d'une variable vectorielle `(x,y)` la fonction cumulative `F` est définie comme étant la probabilité d'obtenir un tirage dont la première composante est inférieure strictement à `x` et la seconde composante est inférieure strictement à `y`.

Fonction cumulative `F` d'une variable vectorielle `(x,y)`

    `F(x,y) = P(overset(***)x"<"x "et" overset(***)y"<"y)`

    `F(x,y) = lim_(t->∞) 1/t sum_(t=1)^t (x(t)"<"x)(y(t)"<"y)`

  `F(x,y) = lim_(t->∞) 1/t int_(t=0)^t (x(t)"<"x)(y(t)"<"y)`

  `P(overset(***)x "∈["x_1,x_2"[" "et" overset(***)y"∈["y_1,y_2"[") = F(x_2,y_2)+F(x_1,y_1)-F(x_2,y_1)-F(x_1,y_2)`

Cas d'une variable vectorielle `(x,y)` de loi discrète `f`
définie sur `{0,1,2,...,n}×{0,1,2,...,m}`

  `F(0,0)=0`

  `F(n,m) = sum_xf(x,m) + sum_yf(n,y) - f(n,m)`   

  `F(x,y) = sum_(x<x) sum_(y<y) f(x,y)`

  `f(x,y) = F(x"+"1,y"+"1) + F(x,y) - F(x"+"1,y) - F(x,y"+"1)`

Cas d'une variable vectorielle `(x,y)` de loi continue `f`

  `F(x,y) = int_(x<x) int_(y<y) f(x,y)dxdy`

  `f(x,y) = (del^2F(x,y))/(delx dely) = ( F(x"+"dx,y"+"dy) + F(x,y) - F(x"+"dx,y) - F(x,y"+"dy))/(dxdy)`

  `P(overset(***)x"∈["x_1, x_2"[")` : Probabilité que le tirage de la variable `x` appartienne à   `"["x_1,x_2"["`.
  `P(overset(***)y"∈["y_1, y_2"[")` : Probabilité que le tirage de la variable `y` appartienne à   `"["y_1,y_2"["`.
  `P(overset(***)x"<"x)` : Probabilité que le tirage de la variable `x` soit inférieur strictement au paramètre `x`.
  `P(overset(***)x"<"y)` : Probabilité que le tirage de la variable `y` soit inférieur strictement au paramètre `y`.
  `F` : Fonction cumulative de la variable vectorielle `(x,y)`, noté également par `F_("["x,y"]")` dans le cas continu.
  `F` : Fonction cumulative stricte de la variable vectorielle `(x,y)`, noté également par `F_("["x,y"]")` dans le cas discret..
  `f` : Loi de la variable vectorielle `(x,y)`, noté également par `L_("["x,y"]")`.
  `overset(***)x` : Tirage de la variable aléatoire `x`.
  `overset(***)y` : Tirage de la variable aléatoire `y`.
  `(overset(***)x,overset(***)y)` : Tirage de la variable aléatoire `(x,y)`
  `x, x_1, x_2` : Paramètres appartenant à `"Arr"(x)`.
  `y, y_1, y_2`
: Paramètres appartenant à `"Arr"(y)`.
  `t` : Nombre de tirages.
  `t` défini dans la somme : Indexe des tirages. Temps discret.
  `t` défini dans l'intégrale
: Temps continu.
  `x(t)` : Valeur de la variable `x` à l'instant `t`.
  `y(t)`
: Valeur de la variable `y` à l'instant `t`.

12) Fractile

Pour une variable d'évolution temporelle discrète `x`, la suite des valeurs `x(0),x(1),x(2),...,x(t)` constitue un jeu de données. Les fractiles, synonyme de quantile, sont les valeurs qui divise ce jeu de données en intervalles contenant le même nombre de données. Pour une variable d'évolution temporelle continue, les fractiles sont les valeurs qui divise de façon égale les durée de parcours de la variables dans l'intervalle. Remarquez qu'il y a un quantile de moins que le nombre d'intervalles créés.

- Le quantil d'ordre `1"/"2` s'appelle la médiane. C'est la valeur pour laquelle il y a une chance sur `2` que le tirage de la variable soit inférieur.
- Le fractile d'ordre `1"/"4` s'appelle le premier quartile. C'est la valeur pour laquelle il y a une chance sur `4` que le tirage de la variable soit inférieur.
- Le fractile d'ordre `3"/"4` s'appelle le troisième quartile. C'est la valeur pour laquelle il y a `3` chances sur `4` que le tirage de la variable soit inférieur.
- Les fractiles d'ordre `k"/"10` avec `k` entier compris entre `1` et `9` définissent les déciles. Le premier décile est la valeur pour laquelle il y a une chance sur `10` que le tirage de la variable soit inférieur.
- Les fractiles d'ordre `k"/"100` avec `k` entier compris entre `1` et `99` définissent les centiles. Le premier centile est la valeur pour laquelle il y a une chance sur `100` que le tirage de la variable soit inférieur.


Le fractile d'ordre `alpha` de la variable `x` se note parfois `x_alpha`. C'est la valeur pour laquelle il y a une probabilité `alpha` que le tirage de la variable soit inférieur :

`P(overset(***)x"<"x_alpha) = alpha`   

`F_([x])(x_alpha) = alpha`   

Le fractile peut ne pas être unique et constituer un intervalle s'il y a des plages de probabilité nulle.

Pour une variable scalaire `x` de fonction cumulative continue `F`, la fonction inverse `F^(-1)` donne les fractiles. Le fractile d'ordre `alpha` est :

`x_alpha = F^(-1)(alpha)`


Dominique Mabboux-Stromberg