Sűrűségfüggvény

Innen: testwiki
Ugrás a navigációhoz Ugrás a kereséshez
Annak a valószínűsége, hogy egy valószínűségi változó értéke a és b közé esik, megfelel a valószínűségi sűrűségfüggvény a és b közötti szakaszának görbe alatti területének

A valószínűségszámításban az X valószínűségi változó sűrűségfüggvénye f pontosan akkor, ha az X-nek az F-fel jelölt eloszlásfüggvénye előállítható a következő alakban:

F(x)=xf(t)dt.

Szemben a valószínűségekkel, a sűrűségfüggvények felvehetnek 1-nél nagyobb értéket is. A valószínűségi eloszlások sűrűségfüggvényeken alapuló konstrukciója szempontjából nem a sűrűségfüggvény által felvett érték a fontos, hanem az integrál.

A sűrűségfüggvény általánosítása az általánosított sűrűségfüggvény, ahol is a Lebesgue-mértékre vonatkozó sűrűségfüggvények a valószínűségi sűrűségfüggvények. A továbbiakban sűrűségfüggvényen valószínűségi sűrűségfüggvényt értünk, kivéve ha azt máshogy jelezzük.

Diszkrét esetben az események valószínűsége megkapható a tartalmazott elemi események valószínűségeinek összegzésével. Folytonos esetben azonban ez nem tehető meg, mivel a nullaszor végtelen értéke bármi lehet. Például két ember csak ritkán pont egyforma magas, eltér egymástól egy hajszállal vagy csak néhány atomnyival. A sűrűségfüggvénnyel tetszőleges intervallum valószínűsége meghatározható, így a nullaszor végtelen probléma megkerülhető.

Definíció

A sűrűségfüggvény definiálható valószínűségeloszlás alapján, vagy pedig a valószínűségeloszlást lehet levezetni a sűrűségfüggvényből.

Az önálló definícióban szerepel az f: tulajdonság, a nemnegativitás, az integrálhatóság és a normáltság, azaz a teljes -en vett integrál egy. Ekkor definiálható hozzá

P([a,b]):=abf(x)dx valószínűségeloszlás.

Megfordítva, levezethető valószínűségi mértékből. Ekkor, ha az f függvényre minden a esetén

P((,a])=af(x)dx

illetve

P(Xa)=af(x)dx

akkor f sűrűségfüggvény.

Tulajdonságai

Létezés

Különböző lognormális eloszlások sűrűségfüggvényei, ahol μ=0
Különböző lognormális eloszlások eloszlásfüggvényei, ahol μ=0

Általános tulajdonságok

  • A definícióból nyilvánvalóan látszik, hogy
+f(t)dt=1
bármely sűrűségfüggvény esetén. Ám az is megmutatható, hogy egy tetszőleges f mérhető függvény pontosan akkor sűrűségfüggvény (vagyis pontosan akkor található hozzá olyan valószínűségi változó, melynek sűrűségfüggvénye) ha f(x) ≥ 0 majdnem mindenütt és a fenti tulajdonság teljesül rá.
𝐏(XA)=Af(t)dt.
  • Speciálisan
𝐏(aX<b)=abf(t)dt.

a két definíció egyenértékű.

Kapcsolat az eloszlásfüggvénnyel

Ha az F eloszlásfüggvény folytonos, és legfeljebb megszámlálható végtelen pontban nem differenciálható, akkor van sűrűségfüggvénye, és:

F(x)=dF(x)dx=f(x)

Más jelöléssel, F '(x)=f(x), vagyis az eloszlásfüggvényből egyszerű deriválással kapjuk a sűrűségfüggvényt.

Vannak olyan eloszlások, mint a Cantor-eloszlás, amelyek eloszlásfüggvénye folytonos, és majdnem mindenütt differenciálható, de nincs sűrűségfüggvényük. A folytonos eloszlások eloszlásfüggvénye majdnem mindenütt differenciálható, de a derivált csak az abszolút folytonos részt foglalja magába.

Megfordítva, a sűrűségfüggvényből is kiszámítható az eloszlásfüggvény (abszolút folytonos) része:

FX(x)=xfX(t)dt
FP(x)=xfP(t)dt

ami azonnal következik a definícióból.

Sűrűségfüggvény részintervallumon

Ha egy X valószínűségi változó csak egy I részintervallumból vesz fel elemeket, akkor a sűrűségfüggvény választható úgy, hogy az I intervallumon kívül a 0 értéket veszi fel. Erre példa az exponenciális eloszlás, ahol I=[0,[. Egy alternatív lehetőség az értelmezési tartomány leszűkítése, azaz f:I definiálása. Ekkor az eloszlás sűrűségét az I intervallumon adja meg a Lebesgue-mérték szerint.

Nemlineáris transzformáció

A nemlineáris Y=g(X) transzformáció esetén

E(Y)=E(g(X))=g(x)f(x)dx.

Konvolúció

Abszolút folytonos eloszlás esetén a valószínűségeloszlások konvolúciója visszavezethető a sűrűségfüggvények konvolúciójára. Ha P,Q abszolút folytonos eloszlások az fP és fQ eloszlásfüggvényekkel, akkor :fP*Q=fP*fQ.

Itt P*Q a P és Q konvolúciója, és f*g az f és g konvolúciója. Tehát a konvolúció és a sűrűségfüggvény képzése felcserélhető.

Ez a tulajdonság közvetlenül átvihető független valószínűségi változók összegére. Legyenek X,Y valószínűségi változók az fX és fY sűrűségfüggvényekkel, ekkor

fX+Y=fX*fY.

Tehát az összeg sűrűségfüggvénye megegyezik a tagok sűrűségfüggvényeinek konvolúciójával.

Példák

Az exponenciális eloszlás sűrűségfüggvénye különböző paraméterekkel

Az exponenciális eloszlás abszolút folytonos eloszlás, sűrűségfüggvénye

fλ(x)={λeλxx00x<0

ahol λ>0 valós paraméter. Ha λ>1, akkor az x=0 helyen 1-nél nagyobb értéket vesz fel. Az, hogy fλ(x) sűrűségfüggvény, adódik az exponenciális függvény elemi integrációs szabályából, a nemnegativitás közvetlenül következik a hatványozás szabályaiból, és az integrálhatóság is bizonyítható.

A véges intervallumon egyenletes eloszlásnak is van sűrűségfüggvénye, például a [0,1] intervallumon. Az általa megadott valószínűség

P([a,b])=ba, ha ab és a,b[0,1]

Az intervallumon kívüli események valószínűsége nulla. Az f sűrűségfüggvény megfelel az

abf(x)dx=P([a,b])=ba

feltételeknek. Az f(x)=1 alkalmas függvény, amit a [0,1] intervallumon kívül nulla folytat az integrálhatóság kedvéért. Ezzel a folytonos egyenletes eloszlás sűrűségfüggvénye:

f(x)={1 ha x[0,1]0 egyébként 

Egy másik megfelelő függvény:

f(x)={1 ha x(0,1)0 egyébként 

A két függvény egy Lebesgue-nullmértékű halmazon különbözik csak, és mindkettő megfelel a követelményeknek. Mivel egy tetszőleges pontban meg lehet változtatni az értéket, azért egy valószínűségeloszlásnak legalább kontinuum sok sűrűségfüggvénye van. Az integrálok értéke nem változik, tehát a módosított sűrűségfüggvény is sűrűségfüggvény marad.

Megjegyzések a definícióhoz

Szigorúan véve a definícióban egy λ Lebesgue-mérték szerinti integrál szerepel, amit úgy kellene jelölni, hogy dλ(x). Többnyire azonban a Riemann-integrál is megfelel, emiatt szoktak a definícióban dx integrált írni. A különbséget az jelenti, hogy a Riemann-integrálnak nincs mértékelméleti háttere, míg a Lebesgue-integrálnak van.

A német szakirodalom meg is különbözteti a két eljárást. Amiből a valószínűségeloszlást származtatják, az a Wahrscheinlichkeitsdichte, a másik a Verteilungsdichte.[1]

Létezés és egyértelműség

Valószínűségeloszlásból származtatva

A valószínűségeloszlással definiált esetben a P valószínűségi mértékből származik a valószínűségeloszlás. A normáltságból következik P()=1. Mivel a valószínűségek nem lehetnek negatívak, a függvény sehol se negatív. a σ-additív tulajdonság következik a majorált konvergencia tételéből, a sűrűségfüggvénnyel mint majoránssal és az

fn:=i=1nfχAi

függvénysorozattal, ahol az Ai halmazok páronként diszjunktak, és χA az A halmaz karakterisztikus függvénye.

Az egyértelműség következik a mérték egyértelműségének tételéből, és a Borel-σ-algebra generátorainak metszetstabil tulajdonságából, ami itt a zárt intervallumok.

A másik definíció alapján

A Radon-Nikodým-tétellel belátható, hogy adott valószínűségeloszláshoz létezik sűrűségfüggvény:

Ha P valószínűségeloszlás, akkor akkor és csak akkor van sűrűségfüggvénye, ha abszolút folytonos a λ Lebesgue-mértékre. Ez azt jelenti, hogy ha λ(A)=0, akkor P(A)=0.

Ez nem zárja ki, hogy több sűrűségfüggvény létezik, de mindegyik csak Lebesgue-nullmértékű halmazon különbözik a többitől, azaz majdnem mindenütt egyenlőek.

Emiatt a diszkrét valószínűségeloszlásoknak nincs sűrűségfüggvénye, mivel egy alkalmas k elemre mindig teljesül, hogy P({k})>0. Ezeknek a ponthalmazoknak azonban a Lebesgue-mértéke nulla, vagyis a diszkrét valószínűségeloszlások nem abszolút folytonosak.

A valószínűségek számítása

Alapok

Adva legyen az f sűrűségfüggvény, ekkor az [a,b] intervallum valószínűsége

P(X[a,b])=abf(x)dx.

Itt mindegy, hogy az intervallum zárt-e, vagy nyílt, félig nyílt, mivel a folytonos valószínűségi változók esetén egy pont valószínűsége nulla. Formálisan,

x:P(X=x)=0
P(aXb)=P(a<Xb)=P(aX<b)=P(a<X<b)

Bonyolultabb halmazok esetén az egyes intervallumokon vett integrálokat kell összeadni. Ekkor a képlet

P(XA)=Af(x)dx.

Alkalmazható a σ-additivitás is, ami azt jelenti, hogy a A1,A2,A3 páronként diszjunkt intervallumok, és

A=i=1Ai

az összes egyesítése, akkor

P(A)=P(i=1Ai)=i=1aibif(x)dx.

ahol Ai=(ai,bi). Ez érvényes véges sok és végtelen számú intervallumra. Diszjunkt intervallumok valószínűsége összeadódik.

Példa

Egy callcenterben két hívás között eltelt idő megközelítően exponenciális eloszlású. Legyen ennek paramétere λ! Ekkor a sűrűségfüggvény

fλ(x)={λeλxx00x<0.

Az x tengely beosztását a λ paraméter határozza meg úgy, hogy λ idő alatt várható értékben egy hívás fut be. Annak a valószínűsége, hogy a következő hívás egy és két időegység után következik be:

P(X[1,2])=12λeλxdx=[eλx]12=e2λ+eλ.

Tegyük fel, hogy egy munkatárs öt időegység hosszú szünetet tart! Annak a valószínűsége, hogy közben nem érkezik hívás, egyenlő azzal a valószínűséggel, hogy a következő hívásig öt vagy több időegység telik el. Ennek valószínűsége

P(X5)=1P(X5)=105λeλxdx=1[eλx]05=1(e5λ+1)=e5λ

Jellemző számadatok meghatározása

Egy valószínűségi változó jellemző számadatai közül több is megadható a valószínűségi változó sűrűségfüggvényének segítségével.

Módusz

Egy valószínűségeloszlás illetve valószínűségi változó módusza definiálható a sűrűségfüggvénnyel: Ahol a sűrűségfüggvénynek maximuma van, ott van a módusz. Formálisan, xmod akkor módusza az f sűrűségfüggvényű valószínűségi változónak, ha az xmod hely lokális maximumhely.[2] ez azt jelenti, hogy

van ε>0, hogy f(x)f(xmod) minden x(xmodε;xmod+ε) helyen.

Egy sűrűségfüggvénynek több lokális maximumhelye is lehet, ekkor az eloszlás bimodális vagy multimodális. Az egyenletes eloszlás esetén minden hely módusz.

Medián

A mediánt rendszerint az eloszlásfüggvénnyel és kvantilisekkel definiálják. Abszolút folytonos eloszlás mediánja számítható sűrűségfüggvénnyel: xmed az eloszlás vagy a valószínűségi változó mediánja, ha:

xmedf(x)dx=12

és

xmed+f(x)dx=12

Folytonosság miatt xmed mindig létezik, de az egyértelműség nem garantált, például csak két diszjunkt intervallum unióján nullától különböző értékeket felvevő szimmetrikus sűrűségfüggvény esetén.

Várható érték

Ha az X valószínűségi változó sűrűségfüggvénye fX, akkor X várható értéke:

E(X)=+xfX(x)dx,

ha az integrál konvergens. Ha nem konvergens, akkor a valószínűségi változónak nincs várható értéke.

Szórásnégyzet és szórás

Ha az X valószínűségi változó sűrűségfüggvénye fX, és várható értéke μ=E(X), akkor X szórásnégyzete

Var(X)=E((Xμ)2)=+(xμ)2fX(x)dx.

Vagy az eltolási tétellel:

Var(X)=E(X2)(E(X))2=x2fX(x)dxμ2.

Ezek a képletek csak akkor használhatók, ha az integrálok konvergensek. A szórás a szórásnégyzetből számítható gyökvonással, de sokszor elég a szórásnégyzetet használni.

Magasabb momentumok, ferdeség és lapultság

A fent leírt nemlineáris transzformáció felhasználásával közvetlenül kiszámíthatók a további momentumok. Így ha az X valószínűségi változó sűrűségfüggvénye fX, akkor:

mk=+xkfX(x)dx

és a k-adik abszolút momentum

Mk=+|x|kfX(x)dx.

Ha X várható értéke μ, akkor a centrális momentumok:

μk=+(xμ)kfX(x)dx

és az abszolút centrális momentumok:

μk=+|xμ|kfX(x)dx.

Példa

Példaként tekintsük az exponenciális eloszlást:

fλ(x)={λeλxx00x<0

ahol λ>0 paraméter!

Az exponenciális eloszlásnak mindig módusza a nulla. A (,0) intervallumon a sűrűségfüggvény konstans nulla, és az [0,+) intervallumon szigorúan monoton csökken, így a 0 helyen lokális maximum van. A monotóniából következik, hogy nincs több lokális maximum, a módusz egyértelmű.

A centrális momentumokból meghatározható a ferdeség és a lapultság.

A medián meghatározásához elég a [0,) félegyenesen integrálni, mivel a negatív számokon a függvény értéke konstans nulla:

0cλeλxdx=[eλx]0c=eλc+1=!12.

Rövid számolással

c=ln2λ.

Ez teljesíti a mediánra vonatkozó második egyenlőséget is, tehát valóban medián.

A várható érték meghatározható parciális integrállal:

E(X)=0+xλeλxdx=[xeλx]0+0+eλxdx=[1λeλx]0+=1λ.

A parciális integrál kétszeri alkalmazásával számítható a szórásnégyzet is.

További példák

Legyen most az f(x) sűrűségfüggvény f(x)=3x2, ha x[0,1]; f(x)=0 ha x<0; és f(x)=0 ha x>1! Ekkor f: valóban sűrűségfüggvény, mivel nemnegatív teljes -en, továbbá

f(x)dx=013x2dx=1.

Minden x[0,1] esetén:

F(x)=xf(t)dt=0x3t2dt=x3

Az eloszlásfüggvény

FX(x)={0 ha x<0x3 ha 0x11 ha x>1

Ha X valószínűségi változó, aminek sűrűségfüggvénye f, akkor például

P(X12)=F(12)=18.

Az X változó várható értéke

E(X)=xf(x)dx=013x3dx=34.

Többdimenziós sűrűségfüggvény

Többdimenziós valószínűségi változókra is definiálható sűrűségfüggvény, ha eloszlásuk abszolút folytonos. Legyen az X valószínűségi vektorváltozó n értékű; ekkor f:n[0,) az X (Lebesgue-mérték szerinti) sűrűségfüggvénye, ha

P(XA)=Af(x)dnx

minden A(n) Borel-halmazra.

Speciálisan, az n dimenziós I=[a1,b1]××[an,bn] intervallumokra, ahol a1<b1,,an<bn valós számok:

P(XI)=anbna1b1f(x1,,xn) dx1dxn.

Valószínűségi vektorváltozóknak is definiálható eloszlásfüggvény. Itt F(x)=P(Xx), ahol az egyenlőtlenség komponensenként értendő. Ekkor F az n teret a [0,1] intervallumra képezi úgy, hogy

F(x1,,xn)=xnx1f(t1,,tn) dt1dtn.

Ha F n-szer folytonosan differenciálható, akkor a sűrűségfüggvény parciális differenciálással megkapható:

f(x1,x2,,xn)=nF(x1,x2,,xn)x1xn.

Az Xi komponensek fi sűrűségfüggvényei a peremeloszlások többi komponens szerinti integrálásával kaphatók.

Továbbá: Ha X=(X1,Xn) n értékű sűrűségfüggvényes valószínűségi vektorváltozó, akkor a következők ekvivalensek:

  • Az X sűrűségfüggvényének alakja f(x1,,xn)=f1(x1)fn(xn), ahol fi az Xi sűrűsége.
  • Az X1,,Xn valószínűségi változók függetlenek.

Becslés diszkrét adatok alapján

Gyakorisági sűrűség (hisztogram)

Folytonosnak tekintett eloszlásból származó, de diszkréten mért adatok, például testmagasság centiméterben mérve reprezentálhatók gyakorisági sűrűségfüggvényként. Magsűrűségbecslőkkel a sűrűségfüggvény folytonos függvénnyel becsülhető. Az ehhez használt magnak a mérési hibához kell alkalmazkodnia.

Legyen Xa approximáló véletlen változó, az xi jellemző mennyiségekkel és pi valószínűségekkel. Az Xa diszkrét approximáló valószínűségi változó határátmenete az X folytonos valószínűségi változóba valószínűségi hisztogrammal modellezhető. Ehhez X lehetséges értékeit a [ci1,ci] szakaszokra osztujk fel. Ezek a Δxi hosszú intervallumok és a hozzájuk tartozó xi osztályközepek a sűrűségfüggvény approximációját szolgálják, szemléletesen a valószínűségi hisztogrammal, ami az osztályközepekre emelt pi=f(xi)Δxi téglalapokból áll. Kis Δxi esetén Xa felfogható a folytonos X valószínűségi változó approximációjaként. Minél rövidebbek a [ci1,ci] szakaszok, annál jobban közelíti Xa a folytonos X valószínűségi változót. Az Δxi0 határátmenet minden intervallumra a következőhöz vezet:[3]

a szórásnégyzet esetén
i(xiμ)2f(xi)Δxi(xμ)2f(x)dx
a várható érték esetén
ixif(xi)Δxixf(x)dx.

A sűrűségfüggvény általánosítása

Létezik a matematikai statisztikában a sűrűségfüggvénynek egy általánosítása, az általánosított sűrűségfüggvény, mely a valószínűségi mező egy általánosításán, a statisztikai mezőn értelmezett, s definíciójában olyan mély mértékelméleti eszközöket használ, mint a Radon–Nikodym-derivált. Általánosított sűrűségfüggvénye minden valószínűségi változónak van, s abszolút folytonos esetben a sűrűségfüggvénnyel, míg diszkrét esetben a P függvénnyel azonos.

Jegyzetek

Sablon:Jegyzetek

Források

  • Bognár J.-né – Mogyoródi J. – Prékopa A. – Rényi A. – Szász D. (2001): Valószínűségszámítási feladatgyűjtemény. Typotex Kiadó, Budapest.
  • Fazekas I. (szerk.) (2000): Bevezetés a matematikai statisztikába. Kossuth Egyetemi Kiadó, Debrecen.
  • Lukács O. (2002): Matematikai statisztika. Műszaki Könyvkiadó, Budapest.
  • Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. de Gruyter Lehrbuch, Berlin 2009, Sablon:ISBN.
  • Norbert Henze: Stochastik für Einsteiger. 7. Auflage. Vieweg Verlag, Wiesbaden 2008, Sablon:ISBN.
  • Achim Klenke: Wahrscheinlichkeitstheorie. 2. Auflage. Springer-Verlag, Sablon:ISBN.
  • Lothar Sachs, Jürgen Hedderich: Angewandte Statistik: Methodensammlung mit R. 12. Auflage. Springer-Verlag, Berlin / Heidelberg 2006, Sablon:ISBN.
  • Sablon:Cite web
  • Sablon:MathWorld

Fordítás

Sablon:Fordítás

Sablon:Portál

  1. Georgii: Stochastik. 2009, S. 19, 24.
  2. Sablon:Cite web
  3. L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 262 ff.