Sűrűségfüggvény

Annak a valószínűsége, hogy egy valószínűségi változó értéke a {\displaystyle a} és b {\displaystyle b} közé esik, megfelel a valószínűségi sűrűségfüggvény a {\displaystyle a} és b {\displaystyle b} közötti szakaszának görbe alatti területének

A valószínűségszámításban az X valószínűségi változó sűrűségfüggvénye f pontosan akkor, ha az X-nek az F-fel jelölt eloszlásfüggvénye előállítható a következő alakban:

F ( x ) = x f ( t ) d t . {\displaystyle F(x)=\int \limits _{-\infty }^{x}f(t)\,\mathrm {d} t.}

Szemben a valószínűségekkel, a sűrűségfüggvények felvehetnek 1-nél nagyobb értéket is. A valószínűségi eloszlások sűrűségfüggvényeken alapuló konstrukciója szempontjából nem a sűrűségfüggvény által felvett érték a fontos, hanem az integrál.

A sűrűségfüggvény általánosítása az általánosított sűrűségfüggvény, ahol is a Lebesgue-mértékre vonatkozó sűrűségfüggvények a valószínűségi sűrűségfüggvények. A továbbiakban sűrűségfüggvényen valószínűségi sűrűségfüggvényt értünk, kivéve ha azt máshogy jelezzük.

Diszkrét esetben az események valószínűsége megkapható a tartalmazott elemi események valószínűségeinek összegzésével. Folytonos esetben azonban ez nem tehető meg, mivel a nullaszor végtelen értéke bármi lehet. Például két ember csak ritkán pont egyforma magas, eltér egymástól egy hajszállal vagy csak néhány atomnyival. A sűrűségfüggvénnyel tetszőleges intervallum valószínűsége meghatározható, így a nullaszor végtelen probléma megkerülhető.

Definíció

A sűrűségfüggvény definiálható valószínűségeloszlás alapján, vagy pedig a valószínűségeloszlást lehet levezetni a sűrűségfüggvényből.

Az önálló definícióban szerepel az f : R R {\displaystyle f\colon \mathbb {R} \to \mathbb {R} } tulajdonság, a nemnegativitás, az integrálhatóság és a normáltság, azaz a teljes R {\displaystyle \mathbb {R} } -en vett integrál egy. Ekkor definiálható hozzá

P ( [ a , b ] ) := a b f ( x ) d x {\displaystyle P([a,b]):=\int _{a}^{b}f(x)\,\mathrm {d} x} valószínűségeloszlás.

Megfordítva, levezethető valószínűségi mértékből. Ekkor, ha az f {\displaystyle f} függvényre minden a R {\displaystyle a\in \mathbb {R} } esetén

P ( ( , a ] ) = a f ( x ) d x {\displaystyle P((-\infty ,a])=\int _{-\infty }^{a}f(x)\,\mathrm {d} x}

illetve

P ( X a ) = a f ( x ) d x {\displaystyle P(X\leq a)=\int _{-\infty }^{a}f(x)\,\mathrm {d} x}

akkor f {\displaystyle f} sűrűségfüggvény.

Tulajdonságai

Létezés

Különböző lognormális eloszlások sűrűségfüggvényei, ahol μ = 0 {\displaystyle \mu =0}
Különböző lognormális eloszlások eloszlásfüggvényei, ahol μ = 0 {\displaystyle \mu =0}
  • Diszkrét eloszlású valószínűségi változóknak nincs sűrűségfüggvénye.
  • Sűrűségfüggvénye csak folytonos eloszlású valószínűségi változónak lehet.
  • Még a folytonos eloszlású valószínűségi változók közül sincs mindnek sűrűségfüggvénye, csak egy speciális osztályuknak, az abszolút folytonos valószínűségi változóknak, melyeket pontosan azzal a tulajdonsággal definiálunk, hogy van sűrűségfüggvényük.

Általános tulajdonságok

  • A definícióból nyilvánvalóan látszik, hogy
+ f ( t ) d t = 1 {\displaystyle \int \limits _{-\infty }^{+\infty }f(t)\,dt=1}
bármely sűrűségfüggvény esetén. Ám az is megmutatható, hogy egy tetszőleges f mérhető függvény pontosan akkor sűrűségfüggvény (vagyis pontosan akkor található hozzá olyan valószínűségi változó, melynek sűrűségfüggvénye) ha f(x) ≥ 0 majdnem mindenütt és a fenti tulajdonság teljesül rá.
  • A sűrűségfüggvény ismeretében több, a valószínűségi változóval kapcsolatos esemény valószínűsége megadható. Bármely A Borel-halmaz esetén
P ( X A ) = A f ( t ) d t . {\displaystyle \mathbf {P} (X\in A)=\int \limits _{A}f(t)\,dt.}
  • Speciálisan
P ( a X < b ) = a b f ( t ) d t . {\displaystyle \mathbf {P} (a\leq X<b)=\int \limits _{a}^{b}f(t)\,dt.}

a két definíció egyenértékű.

Kapcsolat az eloszlásfüggvénnyel

Ha az F {\displaystyle F} eloszlásfüggvény folytonos, és legfeljebb megszámlálható végtelen pontban nem differenciálható, akkor van sűrűségfüggvénye, és:

F ( x ) = d F ( x ) d x = f ( x ) {\displaystyle F^{\prime }(x)={\frac {\mathrm {d} F(x)}{\mathrm {d} x}}=f(x)}

Más jelöléssel, F '(x)=f(x), vagyis az eloszlásfüggvényből egyszerű deriválással kapjuk a sűrűségfüggvényt.

Vannak olyan eloszlások, mint a Cantor-eloszlás, amelyek eloszlásfüggvénye folytonos, és majdnem mindenütt differenciálható, de nincs sűrűségfüggvényük. A folytonos eloszlások eloszlásfüggvénye majdnem mindenütt differenciálható, de a derivált csak az abszolút folytonos részt foglalja magába.

Megfordítva, a sűrűségfüggvényből is kiszámítható az eloszlásfüggvény (abszolút folytonos) része:

F X ( x ) = x f X ( t ) d t {\displaystyle F_{X}(x)=\int _{-\infty }^{x}f_{X}(t)\,\mathrm {d} t}
F P ( x ) = x f P ( t ) d t {\displaystyle F_{P}(x)=\int _{-\infty }^{x}f_{P}(t)\,\mathrm {d} t}

ami azonnal következik a definícióból.

Sűrűségfüggvény részintervallumon

Ha egy X {\displaystyle X} valószínűségi változó csak egy I {\displaystyle I} részintervallumból vesz fel elemeket, akkor a sűrűségfüggvény választható úgy, hogy az I {\displaystyle I} intervallumon kívül a 0 értéket veszi fel. Erre példa az exponenciális eloszlás, ahol I = [ 0 , [ {\displaystyle I=[0,\infty [} . Egy alternatív lehetőség az értelmezési tartomány leszűkítése, azaz f : I R {\displaystyle f\colon I\to \mathbb {R} } definiálása. Ekkor az eloszlás sűrűségét az I {\displaystyle I} intervallumon adja meg a Lebesgue-mérték szerint.

Nemlineáris transzformáció

A nemlineáris Y = g ( X ) {\displaystyle Y=g(X)} transzformáció esetén

E ( Y ) = E ( g ( X ) ) = g ( x ) f ( x ) d x {\displaystyle \operatorname {E} (Y)=\operatorname {E} (g(X))=\int _{-\infty }^{\infty }g(x)f(x)\,\mathrm {d} x} .

Konvolúció

Abszolút folytonos eloszlás esetén a valószínűségeloszlások konvolúciója visszavezethető a sűrűségfüggvények konvolúciójára. Ha P , Q {\displaystyle P,Q} abszolút folytonos eloszlások az f P {\displaystyle f_{P}} és f Q {\displaystyle f_{Q}} eloszlásfüggvényekkel, akkor : f P Q = f P f Q {\displaystyle f_{P*Q}=f_{P}*f_{Q}} .

Itt P Q {\displaystyle P*Q} a P {\displaystyle P} és Q {\displaystyle Q} konvolúciója, és f g {\displaystyle f*g} az f {\displaystyle f} és g {\displaystyle g} konvolúciója. Tehát a konvolúció és a sűrűségfüggvény képzése felcserélhető.

Ez a tulajdonság közvetlenül átvihető független valószínűségi változók összegére. Legyenek X , Y {\displaystyle X,Y} valószínűségi változók az f X {\displaystyle f_{X}} és f Y {\displaystyle f_{Y}} sűrűségfüggvényekkel, ekkor

f X + Y = f X f Y {\displaystyle f_{X+Y}=f_{X}*f_{Y}} .

Tehát az összeg sűrűségfüggvénye megegyezik a tagok sűrűségfüggvényeinek konvolúciójával.

Példák

Az exponenciális eloszlás sűrűségfüggvénye különböző paraméterekkel

Az exponenciális eloszlás abszolút folytonos eloszlás, sűrűségfüggvénye

f λ ( x ) = { λ e λ x x 0 0 x < 0 {\displaystyle f_{\lambda }(x)={\begin{cases}\displaystyle \lambda \mathrm {e} ^{-\lambda x}&x\geq 0\\0&x<0\end{cases}}}

ahol λ > 0 {\displaystyle \lambda >0} valós paraméter. Ha λ > 1 {\displaystyle \lambda >1} , akkor az x = 0 {\displaystyle x=0} helyen 1-nél nagyobb értéket vesz fel. Az, hogy f λ ( x ) {\displaystyle f_{\lambda }(x)} sűrűségfüggvény, adódik az exponenciális függvény elemi integrációs szabályából, a nemnegativitás közvetlenül következik a hatványozás szabályaiból, és az integrálhatóság is bizonyítható.

A véges intervallumon egyenletes eloszlásnak is van sűrűségfüggvénye, például a [ 0 , 1 ] {\displaystyle [0,1]} intervallumon. Az általa megadott valószínűség

P ( [ a , b ] ) = b a {\displaystyle P([a,b])=b-a} , ha a b {\displaystyle a\leq b} és a , b [ 0 , 1 ] {\displaystyle a,b\in [0,1]}

Az intervallumon kívüli események valószínűsége nulla. Az f {\displaystyle f} sűrűségfüggvény megfelel az

a b f ( x ) d x = P ( [ a , b ] ) = b a {\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} x=P([a,b])=b-a}

feltételeknek. Az f ( x ) = 1 {\displaystyle f(x)=1} alkalmas függvény, amit a [ 0 , 1 ] {\displaystyle [0,1]} intervallumon kívül nulla folytat az integrálhatóság kedvéért. Ezzel a folytonos egyenletes eloszlás sűrűségfüggvénye:

f ( x ) = { 1  ha  x [ 0 , 1 ] 0  egyébként  {\displaystyle f(x)={\begin{cases}\displaystyle 1&{\text{ ha }}x\in [0,1]\\0&{\text{ egyébként }}\end{cases}}}

Egy másik megfelelő függvény:

f ( x ) = { 1  ha  x ( 0 , 1 ) 0  egyébként  {\displaystyle f(x)={\begin{cases}\displaystyle 1&{\text{ ha }}x\in (0,1)\\0&{\text{ egyébként }}\end{cases}}}

A két függvény egy Lebesgue-nullmértékű halmazon különbözik csak, és mindkettő megfelel a követelményeknek. Mivel egy tetszőleges pontban meg lehet változtatni az értéket, azért egy valószínűségeloszlásnak legalább kontinuum sok sűrűségfüggvénye van. Az integrálok értéke nem változik, tehát a módosított sűrűségfüggvény is sűrűségfüggvény marad.

Megjegyzések a definícióhoz

Szigorúan véve a definícióban egy λ {\displaystyle \lambda } Lebesgue-mérték szerinti integrál szerepel, amit úgy kellene jelölni, hogy d λ ( x ) {\displaystyle \mathrm {d} \lambda (x)} . Többnyire azonban a Riemann-integrál is megfelel, emiatt szoktak a definícióban d x {\displaystyle \mathrm {d} x} integrált írni. A különbséget az jelenti, hogy a Riemann-integrálnak nincs mértékelméleti háttere, míg a Lebesgue-integrálnak van.

A német szakirodalom meg is különbözteti a két eljárást. Amiből a valószínűségeloszlást származtatják, az a Wahrscheinlichkeitsdichte, a másik a Verteilungsdichte.[1]

Létezés és egyértelműség

Valószínűségeloszlásból származtatva

A valószínűségeloszlással definiált esetben a P {\displaystyle P} valószínűségi mértékből származik a valószínűségeloszlás. A normáltságból következik P ( R ) = 1 {\displaystyle P(\mathbb {R} )=1} . Mivel a valószínűségek nem lehetnek negatívak, a függvény sehol se negatív. a σ-additív tulajdonság következik a majorált konvergencia tételéből, a sűrűségfüggvénnyel mint majoránssal és az

f n := i = 1 n f χ A i {\displaystyle f_{n}:=\sum _{i=1}^{n}f\chi _{A_{i}}}

függvénysorozattal, ahol az A i {\displaystyle A_{i}} halmazok páronként diszjunktak, és χ A {\displaystyle \chi _{A}} az A {\displaystyle A} halmaz karakterisztikus függvénye.

Az egyértelműség következik a mérték egyértelműségének tételéből, és a Borel-σ-algebra generátorainak metszetstabil tulajdonságából, ami itt a zárt intervallumok.

A másik definíció alapján

A Radon-Nikodým-tétellel belátható, hogy adott valószínűségeloszláshoz létezik sűrűségfüggvény:

Ha P {\displaystyle P} valószínűségeloszlás, akkor akkor és csak akkor van sűrűségfüggvénye, ha abszolút folytonos a λ {\displaystyle \lambda } Lebesgue-mértékre. Ez azt jelenti, hogy ha λ ( A ) = 0 {\displaystyle \lambda (A)=0} , akkor P ( A ) = 0 {\displaystyle P(A)=0} .

Ez nem zárja ki, hogy több sűrűségfüggvény létezik, de mindegyik csak Lebesgue-nullmértékű halmazon különbözik a többitől, azaz majdnem mindenütt egyenlőek.

Emiatt a diszkrét valószínűségeloszlásoknak nincs sűrűségfüggvénye, mivel egy alkalmas k R {\displaystyle k\in \mathbb {R} } elemre mindig teljesül, hogy P ( { k } ) > 0 {\displaystyle P(\{k\})>0} . Ezeknek a ponthalmazoknak azonban a Lebesgue-mértéke nulla, vagyis a diszkrét valószínűségeloszlások nem abszolút folytonosak.

A valószínűségek számítása

Alapok

Adva legyen az f {\displaystyle f} sűrűségfüggvény, ekkor az [ a , b ] {\displaystyle [a,b]} intervallum valószínűsége

P ( X [ a , b ] ) = a b f ( x ) d x {\displaystyle P(X\in [a,b])=\int _{a}^{b}f(x)\,\mathrm {d} x} .

Itt mindegy, hogy az intervallum zárt-e, vagy nyílt, félig nyílt, mivel a folytonos valószínűségi változók esetén egy pont valószínűsége nulla. Formálisan,

x R : P ( X = x ) = 0 {\displaystyle \forall x\in \mathbb {R} \colon \,P(X=x)=0}
P ( a X b ) = P ( a < X b ) = P ( a X < b ) = P ( a < X < b ) {\displaystyle P(a\leq X\leq b)=P(a<X\leq b)=P(a\leq X<b)=P(a<X<b)}

Bonyolultabb halmazok esetén az egyes intervallumokon vett integrálokat kell összeadni. Ekkor a képlet

P ( X A ) = A f ( x ) d x {\displaystyle P(X\in A)=\int _{A}f(x)\,\mathrm {d} x} .

Alkalmazható a σ-additivitás is, ami azt jelenti, hogy a A 1 , A 2 , A 3 {\displaystyle A_{1},A_{2},A_{3}\dotsc } páronként diszjunkt intervallumok, és

A = i = 1 A i {\displaystyle A=\bigcup _{i=1}^{\infty }A_{i}}

az összes egyesítése, akkor

P ( A ) = P ( i = 1 A i ) = i = 1 a i b i f ( x ) d x {\displaystyle P(A)=P\left(\bigcup _{i=1}^{\infty }A_{i}\right)=\sum _{i=1}^{\infty }\int _{a_{i}}^{b_{i}}f(x)\,\mathrm {d} x} .

ahol A i = ( a i , b i ) {\displaystyle A_{i}=(a_{i},b_{i})} . Ez érvényes véges sok és végtelen számú intervallumra. Diszjunkt intervallumok valószínűsége összeadódik.

Példa

Egy callcenterben két hívás között eltelt idő megközelítően exponenciális eloszlású. Legyen ennek paramétere λ {\displaystyle \lambda } ! Ekkor a sűrűségfüggvény

f λ ( x ) = { λ e λ x x 0 0 x < 0 {\displaystyle f_{\lambda }(x)={\begin{cases}\displaystyle \lambda \mathrm {e} ^{-\lambda x}&x\geq 0\\0&x<0\end{cases}}} .

Az x tengely beosztását a λ {\displaystyle \lambda } paraméter határozza meg úgy, hogy λ {\displaystyle \lambda } idő alatt várható értékben egy hívás fut be. Annak a valószínűsége, hogy a következő hívás egy és két időegység után következik be:

P ( X [ 1 , 2 ] ) = 1 2 λ e λ x d x = [ e λ x ] 1 2 = e 2 λ + e λ {\displaystyle P(X\in [1,2])=\int _{1}^{2}\lambda \mathrm {e} ^{-\lambda x}\,\mathrm {d} x=\left[-\mathrm {e} ^{-\lambda x}\right]_{1}^{2}=-\mathrm {e} ^{-2\lambda }+\mathrm {e} ^{-\lambda }} .

Tegyük fel, hogy egy munkatárs öt időegység hosszú szünetet tart! Annak a valószínűsége, hogy közben nem érkezik hívás, egyenlő azzal a valószínűséggel, hogy a következő hívásig öt vagy több időegység telik el. Ennek valószínűsége

P ( X 5 ) = 1 P ( X 5 ) = 1 0 5 λ e λ x d x = 1 [ e λ x ] 0 5 = 1 ( e 5 λ + 1 ) = e 5 λ {\displaystyle P(X\geq 5)=1-P(X\leq 5)=1-\int _{0}^{5}\lambda \mathrm {e} ^{-\lambda x}\,\mathrm {d} x=1-\left[-\mathrm {e} ^{-\lambda x}\right]_{0}^{5}=1-\left(-\mathrm {e} ^{-5\lambda }+1\right)=\mathrm {e} ^{-5\lambda }}

Jellemző számadatok meghatározása

Egy valószínűségi változó jellemző számadatai közül több is megadható a valószínűségi változó sűrűségfüggvényének segítségével.

Módusz

Egy valószínűségeloszlás illetve valószínűségi változó módusza definiálható a sűrűségfüggvénnyel: Ahol a sűrűségfüggvénynek maximuma van, ott van a módusz. Formálisan, x mod R {\displaystyle x_{\text{mod}}\in \mathbb {R} } akkor módusza az f {\displaystyle f} sűrűségfüggvényű valószínűségi változónak, ha az x mod {\displaystyle x_{\text{mod}}} hely lokális maximumhely.[2] ez azt jelenti, hogy

van ε > 0 {\displaystyle \varepsilon >0} , hogy f ( x ) f ( x mod ) {\displaystyle f(x)\leq f(x_{\text{mod}})} minden x ( x mod ε ; x mod + ε ) {\displaystyle x\in (x_{\text{mod}}-\varepsilon ;x_{\text{mod}}+\varepsilon )} helyen.

Egy sűrűségfüggvénynek több lokális maximumhelye is lehet, ekkor az eloszlás bimodális vagy multimodális. Az egyenletes eloszlás esetén minden hely módusz.

Medián

A mediánt rendszerint az eloszlásfüggvénnyel és kvantilisekkel definiálják. Abszolút folytonos eloszlás mediánja számítható sűrűségfüggvénnyel: x med {\displaystyle x_{\text{med}}} az eloszlás vagy a valószínűségi változó mediánja, ha:

x med f ( x ) d x = 1 2 {\displaystyle \int _{-\infty }^{x_{\text{med}}}f(x)\,\mathrm {d} x={\frac {1}{2}}}

és

x med + f ( x ) d x = 1 2 {\displaystyle \int _{x_{\text{med}}}^{+\infty }f(x)\,\mathrm {d} x={\frac {1}{2}}}

Folytonosság miatt x med {\displaystyle x_{\text{med}}} mindig létezik, de az egyértelműség nem garantált, például csak két diszjunkt intervallum unióján nullától különböző értékeket felvevő szimmetrikus sűrűségfüggvény esetén.

Várható érték

Ha az X {\displaystyle X} valószínűségi változó sűrűségfüggvénye f X {\displaystyle f_{X}} , akkor X {\displaystyle X} várható értéke:

E ( X ) = + x f X ( x ) d x {\displaystyle \operatorname {E} (X)=\int _{-\infty }^{+\infty }xf_{X}(x)\,\mathrm {d} x} ,

ha az integrál konvergens. Ha nem konvergens, akkor a valószínűségi változónak nincs várható értéke.

Szórásnégyzet és szórás

Ha az X {\displaystyle X} valószínűségi változó sűrűségfüggvénye f X {\displaystyle f_{X}} , és várható értéke μ = E ( X ) {\displaystyle \mu =\operatorname {E} (X)} , akkor X {\displaystyle X} szórásnégyzete

Var ( X ) = E ( ( X μ ) 2 ) = + ( x μ ) 2 f X ( x ) d x {\displaystyle \operatorname {Var} (X)=\operatorname {E} \left((X-\mu )^{2}\right)=\int _{-\infty }^{+\infty }(x-\mu )^{2}f_{X}(x)\,\mathrm {d} x} .

Vagy az eltolási tétellel:

Var ( X ) = E ( X 2 ) ( E ( X ) ) 2 = x 2 f X ( x ) d x μ 2 {\displaystyle \operatorname {Var} (X)=\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}=\int _{-\infty }^{\infty }x^{2}f_{X}(x)\,\mathrm {d} x-\mu ^{2}} .

Ezek a képletek csak akkor használhatók, ha az integrálok konvergensek. A szórás a szórásnégyzetből számítható gyökvonással, de sokszor elég a szórásnégyzetet használni.

Magasabb momentumok, ferdeség és lapultság

A fent leírt nemlineáris transzformáció felhasználásával közvetlenül kiszámíthatók a további momentumok. Így ha az X {\displaystyle X} valószínűségi változó sűrűségfüggvénye f X {\displaystyle f_{X}} , akkor:

m k = + x k f X ( x ) d x {\displaystyle m_{k}=\int _{-\infty }^{+\infty }x^{k}f_{X}(x)\,\mathrm {d} x}

és a k-adik abszolút momentum

M k = + | x | k f X ( x ) d x {\displaystyle M_{k}=\int _{-\infty }^{+\infty }|x|^{k}f_{X}(x)\,\mathrm {d} x} .

Ha X {\displaystyle X} várható értéke μ {\displaystyle \mu } , akkor a centrális momentumok:

μ k = + ( x μ ) k f X ( x ) d x {\displaystyle \mu _{k}=\int _{-\infty }^{+\infty }(x-\mu )^{k}f_{X}(x)\,\mathrm {d} x}

és az abszolút centrális momentumok:

μ ¯ k = + | x μ | k f X ( x ) d x {\displaystyle {\overline {\mu }}_{k}=\int _{-\infty }^{+\infty }|x-\mu |^{k}f_{X}(x)\,\mathrm {d} x} .

Példa

Példaként tekintsük az exponenciális eloszlást:

f λ ( x ) = { λ e λ x x 0 0 x < 0 {\displaystyle f_{\lambda }(x)={\begin{cases}\displaystyle \lambda \mathrm {e} ^{-\lambda x}&x\geq 0\\0&x<0\end{cases}}}

ahol λ > 0 {\displaystyle \lambda >0} paraméter!

Az exponenciális eloszlásnak mindig módusza a nulla. A ( , 0 ) {\displaystyle (-\infty ,0)} intervallumon a sűrűségfüggvény konstans nulla, és az [ 0 , + ) {\displaystyle [0,+\infty )} intervallumon szigorúan monoton csökken, így a 0 helyen lokális maximum van. A monotóniából következik, hogy nincs több lokális maximum, a módusz egyértelmű.

A centrális momentumokból meghatározható a ferdeség és a lapultság.

A medián meghatározásához elég a [ 0 , ) {\displaystyle [0,\infty )} félegyenesen integrálni, mivel a negatív számokon a függvény értéke konstans nulla:

0 c λ e λ x d x = [ e λ x ] 0 c = e λ c + 1 = ! 1 2 {\displaystyle \int _{0}^{c}\lambda \mathrm {e} ^{-\lambda x}\,\mathrm {d} x=\left[-\mathrm {e} ^{-\lambda x}\right]_{0}^{c}=-\mathrm {e} ^{-\lambda c}+1\;{\stackrel {!}{=}}\;{\frac {1}{2}}} .

Rövid számolással

c = ln 2 λ {\displaystyle c={\frac {\ln 2}{\lambda }}} .

Ez teljesíti a mediánra vonatkozó második egyenlőséget is, tehát valóban medián.

A várható érték meghatározható parciális integrállal:

E ( X ) = 0 + x λ e λ x d x = [ x e λ x ] 0 + 0 + e λ x d x = [ 1 λ e λ x ] 0 + = 1 λ {\displaystyle \operatorname {E} (X)=\int _{0}^{+\infty }x\lambda \mathrm {e} ^{-\lambda x}\,\mathrm {d} x=\left[-xe^{-\lambda x}\right]_{0}^{+\infty }-\int _{0}^{+\infty }-e^{-\lambda x}\,\mathrm {d} x=\left[{\tfrac {1}{-\lambda }}e^{-\lambda x}\right]_{0}^{+\infty }={\frac {1}{\lambda }}} .

A parciális integrál kétszeri alkalmazásával számítható a szórásnégyzet is.

További példák

Legyen most az f ( x ) {\displaystyle f(x)} sűrűségfüggvény f ( x ) = 3 x 2 {\displaystyle f(x)=3x^{2}} , ha x [ 0 , 1 ] {\displaystyle x\in [0,1]} ; f ( x ) = 0 {\displaystyle f(x)=0} ha x < 0 {\displaystyle x<0} ; és f ( x ) = 0 {\displaystyle f(x)=0} ha x > 1 {\displaystyle x>1} ! Ekkor f : R R {\displaystyle f\colon \mathbb {R} \to \mathbb {R} } valóban sűrűségfüggvény, mivel nemnegatív teljes R {\displaystyle \mathbb {R} } -en, továbbá

f ( x ) d x = 0 1 3 x 2 d x = 1 {\displaystyle \int _{-\infty }^{\infty }f(x)\,\mathrm {d} x=\int _{0}^{1}3x^{2}\,\mathrm {d} x=1} .

Minden x [ 0 , 1 ] {\displaystyle x\in [0,1]} esetén:

F ( x ) = x f ( t ) d t = 0 x 3 t 2 d t = x 3 {\displaystyle F(x)=\int _{-\infty }^{x}f(t)\,\mathrm {d} t=\int _{0}^{x}3t^{2}\,\mathrm {d} t=x^{3}}

Az eloszlásfüggvény

F X ( x ) = { 0  ha  x < 0 x 3  ha  0 x 1 1  ha  x > 1 {\displaystyle F_{X}(x)={\begin{cases}0&{\text{ ha }}x<0\\x^{3}&{\text{ ha }}0\leq x\leq 1\\1&{\text{ ha }}x>1\end{cases}}}

Ha X {\displaystyle X} valószínűségi változó, aminek sűrűségfüggvénye f {\displaystyle f} , akkor például

P ( X 1 2 ) = F ( 1 2 ) = 1 8 {\displaystyle P\left(X\leq {\tfrac {1}{2}}\right)=F\left({\tfrac {1}{2}}\right)={\tfrac {1}{8}}} .

Az X {\displaystyle X} változó várható értéke

E ( X ) = x f ( x ) d x = 0 1 3 x 3 d x = 3 4 {\displaystyle \operatorname {E} (X)=\int _{-\infty }^{\infty }xf(x)\,\mathrm {d} x=\int _{0}^{1}3x^{3}\,\mathrm {d} x={\frac {3}{4}}} .

Többdimenziós sűrűségfüggvény

Többdimenziós valószínűségi változókra is definiálható sűrűségfüggvény, ha eloszlásuk abszolút folytonos. Legyen az X {\displaystyle X} valószínűségi vektorváltozó R n {\displaystyle \mathbb {R} ^{n}} értékű; ekkor f : R n [ 0 , ) {\displaystyle f\colon \mathbb {R} ^{n}\to [0,\infty )} az X {\displaystyle X} (Lebesgue-mérték szerinti) sűrűségfüggvénye, ha

P ( X A ) = A f ( x ) d n x {\displaystyle P(X\in A)=\int _{A}f(x)\,\mathrm {d} ^{n}x}

minden A B ( R n ) {\displaystyle A\in {\mathcal {B}}(\mathbb {R} ^{n})} Borel-halmazra.

Speciálisan, az n {\displaystyle n} dimenziós I = [ a 1 , b 1 ] × × [ a n , b n ] {\displaystyle I=[a_{1},b_{1}]\times \dotsb \times [a_{n},b_{n}]} intervallumokra, ahol a 1 < b 1 , , a n < b n {\displaystyle a_{1}<b_{1},\dotsc ,a_{n}<b_{n}} valós számok:

P ( X I ) = a n b n a 1 b 1 f ( x 1 , , x n )   d x 1 d x n {\displaystyle P(X\in I)=\int _{a_{n}}^{b_{n}}\dotsi \int _{a_{1}}^{b_{1}}f(x_{1},\dotsc ,x_{n})\ \mathrm {d} x_{1}\dotso \mathrm {d} x_{n}} .

Valószínűségi vektorváltozóknak is definiálható eloszlásfüggvény. Itt F ( x ) = P ( X x ) {\displaystyle F(x)=P(X\leq x)} , ahol az egyenlőtlenség komponensenként értendő. Ekkor F {\displaystyle F} az R n {\displaystyle \mathbb {R} ^{n}} teret a [0,1] intervallumra képezi úgy, hogy

F ( x 1 , , x n ) = x n x 1 f ( t 1 , , t n )   d t 1 d t n {\displaystyle F(x_{1},\dotsc ,x_{n})=\int _{-\infty }^{x_{n}}\dotsi \int _{-\infty }^{x_{1}}f(t_{1},\dotsc ,t_{n})\ \mathrm {d} t_{1}\dotso \mathrm {d} t_{n}} .

Ha F {\displaystyle F} n-szer folytonosan differenciálható, akkor a sűrűségfüggvény parciális differenciálással megkapható:

f ( x 1 , x 2 , , x n ) = n F ( x 1 , x 2 , , x n ) x 1 x n . {\displaystyle f(x_{1},x_{2},\dotsc ,x_{n})={\frac {\partial ^{n}F(x_{1},x_{2},\dotsc ,x_{n})}{\partial x_{1}\dotso \partial x_{n}}}.}

Az X i {\displaystyle X_{i}} komponensek f i {\displaystyle f_{i}} sűrűségfüggvényei a peremeloszlások többi komponens szerinti integrálásával kaphatók.

Továbbá: Ha X = ( X 1 , X n ) {\displaystyle X=(X_{1},\dotsc X_{n})} R n {\displaystyle \mathbb {R} ^{n}} értékű sűrűségfüggvényes valószínűségi vektorváltozó, akkor a következők ekvivalensek:

  • Az X {\displaystyle X} sűrűségfüggvényének alakja f ( x 1 , , x n ) = f 1 ( x 1 ) f n ( x n ) {\displaystyle f(x_{1},\dotsc ,x_{n})=f_{1}(x_{1})\cdot \ldots \cdot f_{n}(x_{n})} , ahol f i {\displaystyle f_{i}} az X i {\displaystyle X_{i}} sűrűsége.
  • Az X 1 , , X n {\displaystyle X_{1},\dotsc ,X_{n}} valószínűségi változók függetlenek.

Becslés diszkrét adatok alapján

Gyakorisági sűrűség (hisztogram)

Folytonosnak tekintett eloszlásból származó, de diszkréten mért adatok, például testmagasság centiméterben mérve reprezentálhatók gyakorisági sűrűségfüggvényként. Magsűrűségbecslőkkel a sűrűségfüggvény folytonos függvénnyel becsülhető. Az ehhez használt magnak a mérési hibához kell alkalmazkodnia.

Legyen X a {\displaystyle X_{a}} approximáló véletlen változó, az x i {\displaystyle x_{i}} jellemző mennyiségekkel és p i {\displaystyle p_{i}} valószínűségekkel. Az X a {\displaystyle X_{a}} diszkrét approximáló valószínűségi változó határátmenete az X {\displaystyle X} folytonos valószínűségi változóba valószínűségi hisztogrammal modellezhető. Ehhez X {\displaystyle X} lehetséges értékeit a [ c i 1 , c i ] {\displaystyle [c_{i-1},c_{i}]} szakaszokra osztujk fel. Ezek a Δ x i {\displaystyle \Delta x_{i}} hosszú intervallumok és a hozzájuk tartozó x i {\displaystyle x_{i}} osztályközepek a sűrűségfüggvény approximációját szolgálják, szemléletesen a valószínűségi hisztogrammal, ami az osztályközepekre emelt p i = f ( x i ) Δ x i {\displaystyle p_{i}=f(x_{i})\Delta x_{i}} téglalapokból áll. Kis Δ x i {\displaystyle \Delta x_{i}} esetén X a {\displaystyle X_{a}} felfogható a folytonos X {\displaystyle X} valószínűségi változó approximációjaként. Minél rövidebbek a [ c i 1 , c i ] {\displaystyle [c_{i-1},c_{i}]} szakaszok, annál jobban közelíti X a {\displaystyle X_{a}} a folytonos X {\displaystyle X} valószínűségi változót. Az Δ x i 0 {\displaystyle \Delta x_{i}\rightarrow 0} határátmenet minden intervallumra a következőhöz vezet:[3]

a szórásnégyzet esetén
i ( x i μ ) 2 f ( x i ) Δ x i R ( x μ ) 2 f ( x ) d x {\displaystyle \sum _{i}(x_{i}-\mu )^{2}f(x_{i})\Delta x_{i}\longrightarrow \int _{\mathbb {R} }(x-\mu )^{2}f(x)\,\mathrm {d} x\quad }
a várható érték esetén
i x i f ( x i ) Δ x i R x f ( x ) d x {\displaystyle \sum _{i}x_{i}f(x_{i})\Delta x_{i}\longrightarrow \int _{\mathbb {R} }xf(x)\,\mathrm {d} x} .

A sűrűségfüggvény általánosítása

Létezik a matematikai statisztikában a sűrűségfüggvénynek egy általánosítása, az általánosított sűrűségfüggvény, mely a valószínűségi mező egy általánosításán, a statisztikai mezőn értelmezett, s definíciójában olyan mély mértékelméleti eszközöket használ, mint a Radon–Nikodym-derivált. Általánosított sűrűségfüggvénye minden valószínűségi változónak van, s abszolút folytonos esetben a sűrűségfüggvénnyel, míg diszkrét esetben a P függvénnyel azonos.

Jegyzetek

  1. Georgii: Stochastik. 2009, S. 19, 24.
  2. A.V. Prokhorov: Mode
  3. L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 262 ff.

Források

  • Bognár J.-né – Mogyoródi J. – Prékopa A. – Rényi A. – Szász D. (2001): Valószínűségszámítási feladatgyűjtemény. Typotex Kiadó, Budapest.
  • Fazekas I. (szerk.) (2000): Bevezetés a matematikai statisztikába. Kossuth Egyetemi Kiadó, Debrecen.
  • Lukács O. (2002): Matematikai statisztika. Műszaki Könyvkiadó, Budapest.
  • Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. de Gruyter Lehrbuch, Berlin 2009, ISBN 978-3-11-021526-7.
  • Norbert Henze: Stochastik für Einsteiger. 7. Auflage. Vieweg Verlag, Wiesbaden 2008, ISBN 978-3-8348-0423-5.
  • Achim Klenke: Wahrscheinlichkeitstheorie. 2. Auflage. Springer-Verlag, ISBN 978-3-540-76317-8.
  • Lothar Sachs, Jürgen Hedderich: Angewandte Statistik: Methodensammlung mit R. 12. Auflage. Springer-Verlag, Berlin / Heidelberg 2006, ISBN 978-3-540-32160-6.
  • N.G. Ushakov: Density of a probability distribution
  • Weisstein, Eric W.: Probability Density Function (angol nyelven). Wolfram MathWorld

Fordítás

Ez a szócikk részben vagy egészben a Wahrscheinlichkeitsdichtefunktion című német Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

  • Matematika Matematikaportál • összefoglaló, színes tartalomajánló lap