Kumulánsgeneráló függvény

Innen: testwiki
Ugrás a navigációhoz Ugrás a kereséshez

A kumulánsok a valószínűségszámításban és statisztikában a valószínűségi változókhoz rendelt mennyiségek. Független valószínűségi változók esetén egyszerű velük számolni. Sorozatuk a várható értékkel és a szórásnégyzettel kezdődik.

Definíció

Ha az X valószínűségi változó momentumgeneráló függvénye MX(t), azaz

MX(t)=E(etX)

akkor a

gX(t)=lnMX(t)=lnE(etX)

függvény az X kumulánsgeneráló függvénye.

Az n-edik kumulánst κn jelöli, és definíciója

κn=ntngX(t)|t=0.

A karakterisztikus függvény segítségével is definiálhatók:

κn=1inntnlnGX(t)|t=0

ahol GX(t)=E(eitX) a karakterisztikus függvény.

Tulajdonságok

Eltolásinvariancia

A kumulánsokat a p(x) sűrűségfüggvény szemiinvariánsainak is tekintik, azaz κ1 kivételével nem változnak a várható érték eltolásával együtt. Kegyen X valószínűségi változó, ekkor tetszőleges c konstansra:

κ1(X+c)=κ1(X)+c
κn(X+c)=κn(X) ha n2

Homogenitás

Az n-edik kumuláns n-edfokban homogén, azaz ha c tetszőleges konstans, akkor:

κn(cX)=cnκn(X)

Additivitás

Legyenek X1 és X2 független valószínűségi változók, ekkor az Y=X1+X2 valószínűségi változóra:

κn(Y)=κn(X1)+κn(X2)

Független valószínűségi változók esetén a karakterisztikus függvények szorzódnak,

GY(k)=GX1(k)GX2(k)

ebből a logaritmus összeget csinál:

lnGY(t)=lnGX1(t)+lnGX2(t)=n=1(it)nn![κn(X1)+κn(X2)]=n=1(it)nn!κn(Y)

Ha a független valószínűségi változók száma N, és a valószínűségi változók X1,X2,,XN, akkor

κn(Y)=i=1Nκn(Xi)

Normális eloszlás

Tekintsünk egy normális eloszlást, aminek várható értéke μ, szórásnégyzete σ2! Ekkor karakterisztikus függvénye G(t)=exp(iμtσ2t2/2), így kumulánsai:

κ1=μ;κ2=σ2;κn=0 für n3.

Minden 2-nél nagyobb rendű kumuláns nulla. Ez azonosítja a normális eloszlást.

Megmutatható, hogy:

  • vagy az első két kumulánst követő összes többi nulla
  • vagy pedig végtelen sok nem nulla kumuláns van.

Másként, az lnG(k) kumulánsgeneráló függvény nem lehet 2-nél magasabb fokú polinom.

Kumulánsok és momentumok

Kumulánsok mint a momentumok függvényei

Jelölje egy X valószínűségi változó n-edik momentumát mn! G(k)-val kifejezhető mn, mint

mn=1inntnG(t)|t=0

Az első néhány kumuláns a momentumok segítségével:

κ1=m1
κ2=m2m12
κ3=m33m2m1+2m13
κ4=m44m3m13m22+12m2m126m14
κ5=m5+5m1(6m22m4)10m3m2+20m3m1260m2m13+24m15

Általában, az összefüggés a következő rekurzióval fejezhető ki:

κn=mnk=1n1(n1k1)κkmnk

Egy alternatív kifejezési mód Faà di Bruno képlete, ami a momentumok mellett a Bn,k Bell-polinomokat is felhasználja:

κn=k=1n(k1)!(1)k+1Bn,k(m1,,mnk+1).

A μn centrális momentumokkal a képletek egyszerűbbek:

κ1=m1
κ2=μ2
κ3=μ3
κ4=μ43μ22
κ5=μ510μ3μ2
κ6=μ615μ4μ210μ32+30μ23

Az első két kumuláns külön jelentéssel bír: κ1 a várható érték, κ2 a szórásnégyzet. A negyediktől kezdve a kumulánsok és a momentumok nem esnek többé egybe.

A kumulánsok levezetése

Az lnG(t) függvényt G(t)=1 körül hatványsorba fejtjük:

lnG(t)=n=1(1)n+1(G(t)1)nn=(G(t)1)(G(t)1)22+(G(t)1)33

Ebbe helyettesítjük G(k) hatványsorát:

G(t)=n=0(it)nn!mn=1+itm1+(it)22m2+(it)36m3+

A helyettesítést elvégezve:

lnG(t)=[itm1+(it)22m2+(it)36m3+]12[itm1+(it)22m2+]2+13[itm1+(it)22m2+]3=[itm1+(it)22m2+(it)36m3+]12[(it)2m12+2(it)32m1m2+(it)44m22+]+13[(it)3m13+2(it)42m12m2+2(it)54m1m22+(it)68m23+]

A t hatványai szerint rendezve kapjuk a kumulánsokat:

lnG(t)=it[m1]κ1+(it)22[m2m12]κ2+(it)36[m33m1m2+2m13]κ3+

Momentumok kifejezése kumulánsokkal

Az n-edik momentum az első n kumuláns n-edfokú polinomja. Az első hat momentum:

m1=κ1
m2=κ2+κ12
m3=κ3+3κ2κ1+κ13
m4=κ4+4κ3κ1+3κ22+6κ2κ12+κ14
m5=κ5+5κ4κ1+10κ3κ2+10κ3κ12+15κ22κ1+10κ2κ13+κ15
m6=κ6+6κ5κ1+15κ4κ2+15κ4κ12+10κ32+60κ3κ2κ1+20κ3κ13+15κ23+45κ22κ12+15κ2κ14+κ16.

Az együtthatókat Faà di Bruno képlete adja meg. Általában, az n-edik momentum a Bn teljes Bell-polinom értéke az κ1,,κn helyen:

mn=Bn(κ1,,κn).

A centrális momentumok kifejezéséhez a κ1 kumuláns nullának tekintendő:

μ1=0
μ2=κ2
μ3=κ3
μ4=κ4+3κ22
μ5=κ5+10κ3κ2
μ6=κ6+15κ4κ2+10κ32+15κ23.

Kumulánsok és partíciók

A momentumokat a kumulánsok segítségével kifejező polinomok kombinatoikailag is értelmezhetők: együtthatóik halmazpartíciókat számlálnak. A polinomok általános képlete

mn=πΠBπκ|B|

ahol:

  • π befutja egy n elemű halmaz partícióit;
  • "Bπ" azt jelenti, hogy B a partíció egy blokkja
  • |B| a B blokk mérete

Több dimenzióban

Az X1, ..., Xn valószínűségi változók közös kumulánsai szintén kumulánsgeneráló függvénnyel generálhatók:

K(t1,t2,,tn)=logE(ej=1ntjXj).

Az egy dimenziós esethez hasonlóan ennek is van kombinatorikai jelentése:

κn(X1,,Xn)=π(|π|1)!(1)|π|1BπE(iBXi)

ahol:

  • π befutja egy n elemű halmaz partícióit;
  • "Bπ" azt jelenti, hogy B a partíció egy blokkja
  • |B| a B blokk mérete

Például

κ3(X,Y,Z)=E(XYZ)E(XY)E(Z)E(XZ)E(Y)E(YZ)E(X)+2E(X)E(Y)E(Z).

Ez a kombinatorikai összefüggés a kumulánsok és momentumok között egyszerűbb alakot nyer, hogyha a momentumokat kumulánsokkal fejezzük ki:

E(X1Xn)=πBπκ(Xi:iB).

Ekkor például:

E(XYZ)=κ(X,Y,Z)+κ(X,Y)κ(Z)+κ(X,Z)κ(Y)+κ(Y,Z)κ(X)+κ(X)κ(Y)κ(Z).

Az első kumuláns a várható érték, két valószínűségi változó közös második kumulánsa a kovarianciájuk. Független valószínűségi változók vegyes kumulánsai eltűnnek. Ha a valószínűségi változók ugyanazok, akkor a κn(X,,X) kumuláns ugyanaz, mint X közönséges κn kumulánsa.

További fontos tulajdonság a multilinearitás a valószínűségi változókban:

κn(X+Y,Z1,Z2,)=κn(X,Z1,Z2,)+κn(Y,Z1,Z2,).

Szabad kumulánsok

A fenti kombinatorikus

E(X1Xn)=πBπκ(Xi:iB)

momentum-kumuláns képlet végigfut az {1,,n} halmaz partícióin. Ha ehelyett csak a nem keresztező partíciókat számoljuk, akkor a szabad kumulánsokhoz jutunk. Roland Speicher vezette be őket.[1]

Alkalmazások

A továbbiakban adva legyenek X1,X2,,XN független, azonos eloszlású valószínűségi változók!

Centrális határeloszlás-tétel

Az Y=1N(X1+X2++XN) valószínűségi változóra a homogenitás és additivitás felhasználásával a következő kumulánsok adódnak:

κn(Y)=1Nni=1Nκn(Xi)𝒪(N1n/2)

Mivel a rend az egyenkénti rendek összege, adódik az 𝒪(N) nagyságrend. Az első kumulánsok nagyságrendjei:

κ1(Y)=𝒪(N1/2) ,κ2(Y)=𝒪(N0) ,κ3(Y)=𝒪(N1/2) ,κ4(Y)=𝒪(N1)

n3 esetén az N rendje negatív kitevőt kap, így a határérték végtelen sok valószínűségi változóra:

limNκn(Y)=0han3

Azaz csak az első két kumuláns marad, ami éppen a normális eloszlásra jellemző. Emiatt tetszőleges valószínűségi változók összege osztva a tagok számának négyzetgyökével normális eloszláshoz tart. Ez a centrális határeloszlás-tétel. A bizonyítás befejezéséhez még fel kell használni a karakterisztikus függvény néhány tulajdonságát is.

A centrális határeloszlás tétele miatt a normális eloszlás szerepe különleges, mivel ha valamire sok, független, egyenként kevés hatással bíró hatás működik, akkor a hatások összessége normális eloszlással közelíthető.

Speciális esetben Xi=X, várható értéke nulla, szórásnégyzete σ2, magasabb momentumai tetszőlegesek. Ekkor

κ1(Y)=1Ni=1N0=0 ,κ2(Y)=1Ni=1Nσ2=σ2 ,κ3(Y)=1N3i=1Nκ3(X)=κ3(X)NN0

A Z

Z:=YE(Y)=1N(X1E(X1)+X2E(X2)++XNE(XN))

valószínűségi változóra alkalmazható a magasabb momentumok eltolásinvarianciája, ami csak a várható értékre hat. A különbség az, hogy Z várható értéke nulla, még akkor is, ha az Xi várható értéke nem tűnik el.

κ1(Z)=1Ni=1Nκ1(XiE(Xi))E(Xi)E(Xi)=0κ2(Z)=1Ni=1Nκ2(XiE(Xi))=1Ni=1Nκ2(Xi)=κ2(Y)=1Ni=1Nσi2=σi=σ,i Spezialfall σ2κ3(Z)=1N3i=1Nκ3(XiE(Xi))=1N3i=1Nκ3(Xi)=κ3(Y)N0

Nagy számok tétele

Az

Y=1N(X1+X2++XN)

valószínűségi változóra a homogenitás és additivitás felhasználásával a követklező kumulánsok adódnak:

κn(Y)=1Nni=1Nκn(Xi)𝒪(N1n)

A i=1Nκn kumulánsok nagyságrendjei rendre 𝒪(N) lesznek. Az első kumulánsok nagyságrendjei:

κ1(Y)=𝒪(N0) ,κ2(Y)=𝒪(N1) ,κ3(Y)=𝒪(N2) ,κ4(Y)=𝒪(N3)

n2 esetén az N rend nagy negatív kitevőt kap, így határértékben:

limNκn(Y)=0han2

Csak az első kumuláns, illetve momentum marad. Növekvő N-nel normális eloszlást közelít, aminek várható értéke:

κ1(Y)=1Ni=1Nκ1(Xi)

ahol a szélesség N1 rendű, és N esetén elfajult eloszlást jelent κ1-nél.

Legyen például Xi=X valószínűségi változó μ várható értékkel, σ2 szórásnégyzettel és tetszőleges további momentumokkal.

κ1(Y)=1Ni=1Nm=m ,κ2(Y)=1N2i=1Nσ2=σ2NN0 ,κ3(Y)=1N3i=1Nκ3(X)=κ3(X)N2N0

Ezzel az Y valószínűségi változó várható értéke ugyanaz, mint az X valószínűségi változóé, azaz Y az X várható értékben hű becslése. A növekvő N-re csökkenő szórás értéke σY=σX/N.

Története

A kumulánsokat először Thorvald Nicolai Thiele dán matematikus írta le egy 1889-ben dánul megjelent könyvben.[2] Habár a könyvet a Jahrbuch über die Fortschritte der Mathematik is hivatkozta,[3] az eredményekre nem figyeltek fel. Így Felix Hausdorff 1901-ben újra bevezette őket.[4]

A szabad valószínűségszámításban hasonló szerepet töltenek be, mint a közönséges kumulánsok a közönséges valószínűségszámításban.[5] Például a szabad valószínűségi változók összegének szabad kumulánsai is összegződnek. A normális eloszlás szerepét a Wigner-féle félköreloszlás veszi át, ennek csak a második szabad kumulánsa különbözik nullától.

Jegyzetek

Sablon:Jegyzetek

Források

  • Jörg Bewersdorff: Statistik – wie und warum sie funktioniert. Ein mathematisches Lesebuch. Vieweg+Teubner Verlag 2011, Sablon:ISBN, Sablon:Doi, S. 68–70.
  • Crispin W. Gardiner: Stochastic methods: a handbook for the natural and social sciences. Springer, 2009. Sablon:ISBN, S. 33–35.
  • M. Abramowitz, I. A. Stegun: Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Dover, 1965. Sablon:ISBN

Fordítás

Sablon:Fordítás

  1. Speicher, Roland (1994), "Multiplicative functions on the lattice of non-crossing partitions and free convolution", Mathematische Annalen, 298 (4): 611–628
  2. Thorvald Nicolai Thiele: Forelæsninger over almindelig Iagttagelseslære: Sandsynlighedsregning og mindste Kvadraters Methode, Kopenhagen 1889.
  3. Jahrbuch über die Fortschritte der Mathematik JFM 21.0210.01 Sablon:Wayback.
  4. Felix Hausdorff: Gesammelte Werke, Band V: Astronomie, Optik und Wahrscheinlichkeitstheorie. 2006, Sablon:ISBN, S. 544, 577.
  5. Sablon:Cite journal