Loi de Dirichlet

Page d’aide sur l’homonymie

Pour les articles homonymes, voir Dirichlet (homonymie).

Plusieurs images de la densité de la loi de Dirichlet lorsque K=3 pour différents vecteurs de paramètres α. Dans le sens horaire à partir du coin supérieur gauche : α=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4).

En probabilité et statistiques, la loi de Dirichlet, souvent notée Dir(α), est une famille de lois de probabilité continues pour des variables aléatoires multinomiales. Cette loi (ou encore distribution) est paramétrée par le vecteur α de nombres réels positifs et tire son nom de Johann Peter Gustav Lejeune Dirichlet. Elle est vue comme la généralisation multinomiale de la loi bêta.

Densité de probabilité

Illustration du changement de la log-densité avec K=3 lorsque le vecteur α varie de α=(0.3, 0.3, 0.3) à (2.0, 2.0, 2.0), en conservant toutes les composantes individuelles α i {\displaystyle \alpha _{i}} égales entre elles.

La loi de Dirichlet d'ordre K ≥ 2 de paramètres α1, ..., αK > 0 possède pour densité de probabilité :

f ( x 1 , , x K ; α 1 , , α K ) = 1 B ( α ) i = 1 K x i α i 1 {\displaystyle f(x_{1},\dots ,x_{K};\alpha _{1},\dots ,\alpha _{K})={\frac {1}{\mathrm {B} (\alpha )}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}

pour tous les x1, ..., xK > 0 vérifiant x1 + ... + xK-1 < 1, où xK est une abréviation pour 1 – x1 – ... – xK–1. La densité est nulle en dehors de ce simplexe ouvert de dimension (K − 1).

La constante de normalisation est la fonction bêta multinomiale, qui s'exprime à l'aide de la fonction gamma :

B ( α ) = i = 1 K Γ ( α i ) Γ ( i = 1 K α i ) , α = ( α 1 , , α K ) . {\displaystyle \mathrm {B} (\alpha )={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma \left(\sum _{i=1}^{K}\alpha _{i}\right)}},\qquad \alpha =(\alpha _{1},\dots ,\alpha _{K}).}

Propriétés

Soit X = ( X 1 , , X K ) Dir ( α ) {\displaystyle X=(X_{1},\ldots ,X_{K})\sim \operatorname {Dir} (\alpha )} , signifiant que les K – 1 premières composantes possèdent la distribution précédente et que

X K = 1 X 1 X K 1 . {\displaystyle X_{K}=1-X_{1}-\cdots -X_{K-1}.}

Posons α 0 = i = 1 K α i {\displaystyle \textstyle \alpha _{0}=\sum _{i=1}^{K}\alpha _{i}} . Alors

E [ X i ] = α i α 0 , {\displaystyle \mathrm {E} [X_{i}]={\frac {\alpha _{i}}{\alpha _{0}}},}

et

V a r [ X i ] = α i ( α 0 α i ) α 0 2 ( α 0 + 1 ) , {\displaystyle \mathrm {Var} [X_{i}]={\frac {\alpha _{i}(\alpha _{0}-\alpha _{i})}{\alpha _{0}^{2}(\alpha _{0}+1)}},}

En fait, les densités marginales sont des lois bêta :

X i Beta ( α i , α 0 α i ) . {\displaystyle X_{i}\sim \operatorname {Beta} (\alpha _{i},\alpha _{0}-\alpha _{i}).}

Qui plus est pour i j {\displaystyle i\neq j} ,

C o v [ X i X j ] = α i α j α 0 2 ( α 0 + 1 ) . {\displaystyle \mathrm {Cov} [X_{i}X_{j}]=-{\frac {\alpha _{i}\alpha _{j}}{\alpha _{0}^{2}(\alpha _{0}+1)}}.}

Le mode de la distribution est le vecteur (x1, ..., xK) avec

x i = α i 1 α 0 K , α i > 1. {\displaystyle x_{i}={\frac {\alpha _{i}-1}{\alpha _{0}-K}},\quad \alpha _{i}>1.}


Agrégation

Si X = ( X 1 , , X K ) Dir ( α 1 , , α K ) {\displaystyle X=(X_{1},\ldots ,X_{K})\sim \operatorname {Dir} (\alpha _{1},\ldots ,\alpha _{K})} ,alors X = ( X 1 , , X i + X j , , X K ) Dir ( α 1 , , α i + α j , , α K ) {\displaystyle X'=(X_{1},\ldots ,X_{i}+X_{j},\ldots ,X_{K})\sim \operatorname {Dir} (\alpha _{1},\ldots ,\alpha _{i}+\alpha _{j},\ldots ,\alpha _{K})} . Cette propriété d'agrégation permet d'obtenir la distribution marginale de X i {\displaystyle X_{i}} mentionnée plus haut.

Distributions associées

  • Si, pour i { 1 , 2 , , K } , {\displaystyle i\in \{1,2,\ldots ,K\},}
Y i γ ( α i , 1 ) , {\displaystyle Y_{i}\sim \gamma (\alpha _{i},1),} , où γ désigne la distribution Gamma, indépendamment
alors
V = i = 1 K Y i γ ( i = 1 K α i , 1 ) , {\displaystyle V=\sum _{i=1}^{K}Y_{i}\sim \gamma \left(\sum _{i=1}^{K}\alpha _{i},1\right),}
et
( X 1 , , X K ) = ( Y 1 / V , , Y K / V ) Dir ( α 1 , , α K ) . {\displaystyle (X_{1},\ldots ,X_{K})=(Y_{1}/V,\ldots ,Y_{K}/V)\sim \operatorname {Dir} (\alpha _{1},\ldots ,\alpha _{K}).}
Bien que les Xi ne soient pas indépendants, ils peuvent néanmoins générer un échantillon de K {\displaystyle K} variables aléatoires, distribuées selon une distribution Gamma. Malheureusement, puisque la somme V {\displaystyle V} est perdue lors de la génération de X = (X1, ..., XK), il n'est pas possible de retrouver les variables Gamma initiales.
  • Les marginales d'une loi de Dirichlet sont des lois bêta :
X i Beta ( α i , k = 1 K α k α i ) . {\displaystyle X_{i}\sim \operatorname {Beta} \left(\alpha _{i},\sum _{k=1}^{K}\alpha _{k}-\alpha _{i}\right).}

Génération de (pseudo-)nombres aléatoires (RNG)

Une méthode pour obtenir un vecteur aléatoire x = ( x 1 , , x K ) {\displaystyle x=(x_{1},\ldots ,x_{K})} à partir de la distribution de Dirichlet de dimension K de paramètres ( α 1 , , α K ) {\displaystyle (\alpha _{1},\ldots ,\alpha _{K})} est fournie par la remarque précédente. Tout d'abord, on tire K variables indépendantes y 1 , , y K {\displaystyle y_{1},\ldots ,y_{K}} selon des distributions Gamma, chacune avec la densité

Gamma ( α i , 1 ) = y i α i 1 e y i Γ ( α i ) , {\displaystyle {\textrm {Gamma}}(\alpha _{i},1)={\frac {y_{i}^{\alpha _{i}-1}\;e^{-y_{i}}}{\Gamma (\alpha _{i})}},\!}

et on pose finalement

x i = y i / j = 1 K y j . {\displaystyle x_{i}=y_{i}/\sum _{j=1}^{K}y_{j}.\!}

Interprétations intuitives des paramètres

Découpage d'une ficelle

Une illustration de la distribution de Dirichlet apparaît lorsque l'on désire découper des ficelles (toutes de longueur initiale 1.0) en K pièces de différentes longueurs, et où chaque pièce a, en moyenne, une longueur désignée mais cette longueur est autorisée à varier. Les valeurs α/α0 spécifient les longueurs moyennes des découpes résultant de la distribution. La variance (disparité autour de la moyenne) varie inversement avec α0.

Example of Dirichlet(1/2,1/3,1/6) distribution
Example of Dirichlet(1/2,1/3,1/6) distribution

Modèles d'urne et simulations du cas particulier des urnes de Pólya

Considérons une urne contenant K couleurs différentes. Initialement, l'urne contient α1 boules de couleur 1, α2 boules de couleur 2, etc. Procédons alors à N tirages dans l'urne suivant ce protocole : chaque boule tirée est replacée dans l'urne et on y ajoute une boule supplémentaire de même couleur. Lorsque N devient très grand, les proportions des boules de différentes couleurs sont distribuées selon Dir ( α 1 , , α K ) {\displaystyle \operatorname {Dir} (\alpha _{1},\ldots ,\alpha _{K})} [1].

Notons que chaque tirage modifie la probabilité d'obtenir une couleur donnée. Cette modification s'atténue d'ailleurs avec le nombre de tirages, puisque l'effet marginal de l'ajout d'une boule supplémentaire diminue avec l'augmentation du nombre total de boules dans l'urne.

Références

  1. D. Blackwell and J. B. MacQueen 1973. Ferguson distributions via Pólya urn schemes. The Annals of Statistics, volume 1, number 2, pp353--355

Voir aussi

Articles connexes

Liens externes

  • Dirichlet Distribution
  • Estimating the parameters of the Dirichlet distribution

Non-Uniform Random Variate Generation, par Luc Devroye http://cg.scs.carleton.ca/~luc/rnbookindex.html

  • SciencesPo: Un package de R qui contient des fonctions pour simuler des paramètres d'une distribution de Dirichlet.
v · m
Lois discrètes
à support fini
0 paramètre de forme
1 paramètre de forme
2 paramètres de forme
3 paramètres de forme
N paramètres de forme
à support infini
0 paramètre de forme
1 paramètre de forme
2 paramètres de forme
3 paramètres de forme
Lois absolument continues
à support compact
0 paramètre de forme
1 paramètre de forme
2 paramètres de forme
3 paramètres de forme
à support semi-infini
0 paramètre de forme
1 paramètre de forme
2 paramètres de forme
3 paramètres de forme
N paramètres de forme
à support infini
0 paramètre de forme
1 paramètre de forme
2 paramètres de forme
Autres types de lois
Lois à support mixte continu-discret
Lois à support variable
Lois multidimensionnelles
Discrètes
Continues
Matricielles
Lois directionnelles
Univariantes
Sphériques bidimensionnelles
Toroïdales bidimensionnelles
Multidimensionnelles
Lois singulières
Familles de lois
  • icône décorative Portail des probabilités et de la statistique