Jacobi-módszer

A Jacobi-módszer (vagy Jacobi-féle sajátértékmódszer) néven ismert eljárás olyan iteratív módszer, amely kis méretű (n<10) szimmetrikus valós mátrixok sajátértékeinek és sajátvektorainak a meghatározására használható. Ezen módszer célja a mátrix főátlón kívüli elemeinek iteratív eljárással történő kinullázása. A Jacobi-módszer esetén az iterációs lépéseket addig ismételjük, míg egy általunk meghatározott pontosságig az ismeretleneket meg nem határozzuk. Ez azt fogja jelenteni, hogy akkor állunk meg a lépesekkel, mikor már két egymás utáni lépésben kapott ismeretlen értékek különbsége kisebb egy általunk meghatározott értéknél.

Nevét Carl Gustav Jacob Jacobiról kapta, aki először 1846-ban publikálta,^[1] de csak az 1950-es években vált elterjedtté a számítógépek fejlődése miatt.^[2]

A Jacobi-módszer esetében az iterációs képlet a következő lesz:

$x_{i}^{(k + 1)} = \frac{1}{a_{i i}} (b_{i} - \sum_{j = 1, j \neq i}^{n} a_{i j} x_{j}^{(k)}), i = 1, 2, \dots, n$

Ahhoz, hogy könnyebben megérthessük a módszer elvét, tekintsünk egy példát:

$(\begin{matrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{matrix}) (\binom{x_{1}}{x_{2}}) = (\binom{b_{1}}{b_{2}})$

Hogy jobban áttekinthető legyen, átírhatjuk egyenletek formájába, amely így nézhet ki:

${\begin{matrix} a_{11} x_{1} + a_{12} x_{2} = b_{1} \\ a_{21} x_{1} + a_{22} x_{2} = b_{2} \end{matrix}$

Innen kifejezhető az x₁ és x₂ ismeretlen, így a következő egyenleteket kapjuk:

$x_{1} = - \frac{a_{12}}{a_{11}} x_{2} + \frac{b_{1}}{a_{11}}$ ,

$x_{2} = - \frac{a_{21}}{a_{22}} x_{1} + \frac{b_{2}}{a_{22}}$

Az így kapott egyenletrendszert úgy oldhatjuk meg, hogy kezdetben kiindulunk az $x_{1}^{(0)}$ , illetve az $x_{2}^{(0)}$ legjobb becslésünkből, vagy az egyszerűség kedvéért indulhatunk 0-ból is. Ezután felhasználva az

$x_{1}^{(k)} = - \frac{a_{12}}{a_{11}} x_{2}^{(k - 1)} + \frac{b_{1}}{a_{11}}$ ,

$x_{2}^{(k)} = - \frac{a_{21}}{a_{22}} x_{1}^{(k - 1)} + \frac{b_{2}}{a_{22}}$

lépéseket, eljuthatunk egy jobb közelítő értékig. Ezt addig alkalmazzuk, amíg az ismeretleneket tetszőleges pontossággal meg nem határozzuk.

Leírás

Az olyan transzformációt, ahol egy mátrixszal jobbról és az inverzével balról szorzunk egy mátrixot, hasonlósági transzformációnak nevezzük. A karakterisztikus egyenletet felírva belátható, hogy a hasonlósági transzformáció nem változtatja meg a sajátértékeket. Valós és szimmetrikus mátrixok esetén $𝐑^{- 𝟏} = 𝐑^{𝐓}$ , vagyis a hasonlósági transzformáció ortogonális transzformáció is egyben. Ezen az összefüggésen alapul a következőkben ismertetett módszer is. Vagyis a megfelelően megválasztott transzformációval a mátrixot diagonalizáljuk. Mivel a sajátvektorok maguk is valósak és ortogonálisak, az $𝐀$ szimmetrikus mátrix diagonalizálása megoldható az $𝐑$ ortogonális hasonlósági transzformáció segítségével, azaz

\begin{matrix} 𝐑^{𝐓} \cdot 𝐀 \cdot 𝐑 = 𝜦 . \end{matrix}

Vegyük példaként a $2 \times 2$ típusú mátrix esetét. Ekkor a transzformációhoz használjuk a

𝐑 = (\begin{matrix} \cos φ & - \sin φ \\ \sin φ & \cos φ \end{matrix})

síkforgatást leíró mátrixot, ahol $φ$ a forgatás szöge. Ha felírjuk ezzel az $𝐀^{'} = 𝐑^{𝐓} \cdot 𝐀 \cdot 𝐑$ szimmetria transzformációt, a transzformálás után az $𝐀^{'}$ mátrix elemei

\begin{matrix} a_{11}^{'} & = a_{11} \cos^{2} φ + 2 a_{21} \sin φ \cos φ + a_{22} \sin^{2} φ \\ a_{22}^{'} & = a_{11} \sin^{2} φ - 2 a_{21} \sin φ \cos φ + a_{22} \cos^{2} φ \\ a_{21}^{'} & = a_{21} (\cos^{2} φ - \sin^{2} φ) + (a_{22} - a_{11}) \sin φ \cos φ = a_{12}^{'} \end{matrix}

lesznek. Ha a nem átlós $a_{12}^{'}$ és $a_{21}^{'}$ elemeket 0-vá alakítjuk, az elforgatási szögre a következő egyenletet kapjuk:

\begin{matrix} \cot^{2} φ + \frac{a_{22} - a_{11}}{a_{21}} \cot φ - 1 & = 0, \end{matrix}

melynek alapján

\begin{matrix} \tan φ & = [\frac{a_{11} - a_{22}}{2 a_{12}} \pm \sqrt{(\frac{a_{11} - a_{22}}{2 a_{12}})^{2} + 1}]^{- 1} . \end{matrix}

Innen megkaphatjuk a $\cos φ = (1 + \tan φ)^{- 1 / 2}$ és $\sin φ = \tan φ \cos φ$ függvényeket, melyekkel felépítjük a forgatásmátrixot. Az így kapott $𝐀^{'}$ mátrix diagonális, tehát az átlóban található együtthatók a sajátértékek, míg az $𝐑$ forgatásmátrix két oszlopa a sajátértékeknek megfelelő két sajátvektor:

\begin{matrix} λ_{1} & = a_{11}^{'}, & 𝐱^{(1)} & = [\begin{matrix} \cos φ \\ \sin φ \end{matrix}]; \\ λ_{2} & = a_{22}^{'}, & 𝐱^{(2)} & = [\begin{matrix} - \sin φ \\ \cos φ \end{matrix}] . \end{matrix}

Általános eset

A következőkben nézzük meg, hogy miként működik ez a módszer általános esetben $n \times n$ méretű mátrixok esetén. A sík-forgatás mátrixunk az egységmátrixtól csak az $r_{i i}, r_{i j}, r_{j i}, r_{j j}$ elemekben tér el, vagyis

𝐑_{i j} = (\begin{matrix} 1 & ⋮ & ⋮ & 0 \\ \dots & \cos φ & \dots & - \sin φ & \dots \\ ⋮ & ⋱ & ⋮ \\ \dots & \sin φ & \dots & \cos φ & \dots \\ 0 & ⋮ & ⋮ & 1 \end{matrix})

Ezt felhasználva az

𝐀^{'} = 𝐑_{𝐢 𝐣}^{𝐓} \cdot 𝐀 \cdot 𝐑_{𝐢 𝐣}

ortogonális hasonlósági transzformációval nullákat viszünk be az $a_{i j}^{'}$ és $a_{j i}^{'}$ elemek helyére. A szorzás elvégzése után az

\begin{matrix} a_{i k}^{'} & = a_{k i}^{'} = a_{i k} \cos φ + a_{j k} \sin φ, k = \overline{1, n} \\ a_{j k}^{'} & = a_{k j}^{'} = a_{i k} \sin φ + a_{j k} \cos φ, k \neq i, j \\ a_{i i}^{'} & = a_{i i} \cos^{2} φ + 2 a_{j i} \sin φ \cos φ + a_{j j} \sin^{2} φ \\ a_{j j}^{'} & = a_{i i} \sin^{2} φ - 2 a_{j i} \sin φ \cos φ + a_{j j} \cos^{2} φ \\ a_{j i}^{'} & = a_{j i} (\cos^{2} φ - \sin^{2} φ) + (a_{j j} - a_{i i}) \sin φ \cos φ = a_{i j}^{'} \end{matrix}

mátrixelemeket kapjuk eredményül. Ezek közül megköveteljük, hogy az $a_{i j}^{'}$ , illetve az $a_{j i}^{'}$ elemek 0-ák legyenek. Ekkor a

\cot^{2} φ + \frac{a_{j j} - a_{i i}}{a_{j i}} \cot φ - 1 = 0

egyenlethez jutunk, melyet megoldva a forgatás szöge

\tan φ = [\frac{a_{i i} - a_{j j}}{2 a_{i j}} \pm \sqrt{(\frac{a_{i i} - a_{j j}}{2 a_{j i}})^{2} + 1}]^{- 1}

lesz.

Meg kell jegyeznünk, hogy amikor egy másik elemet nullázunk ki a következő lépésben, akkor az előzőekben kinullázott elem elromlik. Viszont belátható, hogy bizonyos feltételek mellett az átlón kívüli elemek négyzetösszege egy lépésben $2 ∣ a_{i j} ∣^{2}$ -tel csökken, vagyis monoton módon tart 0-hoz.

$A_{l}$ -lel jelölve az $l$ . transzformáció utáni mátrixot, a transzformáció-sorozatot a következőképpen írhatjuk:

𝐀_{𝟎} = 𝐀, 𝐀_{𝟏} = 𝐑_{𝟏}^{𝐓} \cdot 𝐀_{𝟎} \cdot 𝐑_{𝟏}, 𝐀_{𝟐} = 𝐑_{𝟐}^{𝐓} \cdot 𝐀_{𝟏} \cdot 𝐑_{𝟐}, \dots, 𝐀_{𝐥} = 𝐑_{𝐥}^{𝐓} \cdot 𝐀_{𝐥 - 𝟏} \cdot 𝐑_{𝐥}, \dots,

ahol $𝐑_{𝐥}$ -el valamely nem-átlós elemre alkalmazott transzformációt jelöltük. Képezzük a transzformációs mátrixok

\begin{matrix} 𝐗_{𝐥} = 𝐑_{𝟎} \cdot 𝐑_{𝟏} \dots 𝐑_{𝐥}, & l = 0, 1, 2, \dots, \end{matrix}

szorzatát. Ha végtelen sok transzformációt végzünk, akkor

\begin{matrix} \lim_{l \to \infty} 𝐀_{𝐥} = 𝜦, & \lim_{l \to \infty} 𝐗_{𝐥} = 𝐗 \end{matrix}

lesz. Ez azt jelenti, hogy ha ezeket a transzformációkat egymás után alkalmazzuk, akkor a mátrix diagonalizálódik, és az átlóban a sajátértékeket kapjuk. A sajátvektorok pedig a transzformációk szorzatmátrixának oszlopaiban lesznek.

A módszer konvergenciáját a $\tan φ \leq 1$ feltétel tiszteletben tartása biztosítja, ami egy $φ \leq π / 4$ forgatásnak felel meg. Ezt úgy tudjuk biztosítani, hogy a két gyök közül a "+" előjelest választjuk, amennyiben $(a_{i i} - a_{j j}) / a_{j i} > 0$ és a "−" előjelest az ellenkező esetben. Ezt úgy tudjuk legkönnyebben megvalósítani, hogy a szöget a következőképpen számoljuk:

\tan φ = s i g n (\frac{a_{i i} - a_{j j}}{2 a_{j i}}) [| \frac{a_{i i} - a_{j j}}{2 a_{j i}} | + \sqrt{(\frac{a_{i i} - a_{j j}}{2 a_{j i}})^{2} + 1}]^{- 1} .

Algoritmus

A leírt módszer a következő algoritmus segítségével alkalmazható számítógépre:

from __future__ import division
import math
dim=4

def Jacobi(a,imax,epsilon,x,l):
	for i in range(dim):
		for j in range(dim):
			x[i][j]=0
		x[i][i]=1
		l[i]=a[i][i]
	for it in range (imax):
		amax=0
		for j in range(1,dim,1):
			for i in range (j):
				a[i][i]=l[i]
				a[j][j]=l[j]
				a[j][i]=math.fabs(a[j][i])
				if amax<a[j][i]:
					amax=a[j][i]
				if a[j][i]>epsilon:
					tmp=(a[i][i]-a[j][j])/(2*a[j][i])
					t=1/(math.fabs(tmp)+math.sqrt(1+tmp*tmp))
					if tmp<0:
						t=-t
					c=1.0/(math.sqrt(1+t*t))
					s=c*t
					for k in range(i):
						temp=a[i][k]*c+a[j][k]*s
						a[j][k]=a[j][k]*c-a[i][k]*s
						a[i][k]=temp
					for k in range(i+1,j,1):
						temp=a[k][i]*c+a[j][k]*s
						a[j][k]=a[j][k]*c-a[k][i]*s
						a[k][i]=temp
					for k in range(j+1,dim,1):
						temp=a[k][i]*c+a[k][j]*s
						a[k][j]=a[k][j]*c-a[k][i]*s
						a[k][i]=temp
					for k in range (dim):
						temp=x[k][i]*c+x[k][j]*s
						x[k][j]=x[k][j]*c-x[k][i]*s
						x[k][i]=temp
					tmp=2*s*c*a[j][i]
					l[i]=a[i][i]*c*c+a[j][j]*s*s+tmp
					l[j]=a[i][i]*s*s+a[j][j]*c*c-tmp
					a[j][i]=0
		if amax<=epsilon:
			return 0
	return 666

a=[
	[3,0,2,1],
	[0,1,3,4],
	[2,3,2,1],
	[1,4,1,5]
	]
x=[
	[0,0,0,0],
	[0,0,0,0],
	[0,0,0,0],
	[0,0,0,0]
	]
l=[0,0,0,0]
epsilon=1e-16
imax=1e6
print a
b=Jacobi(a,imax,epsilon,x,l)
print b
print x
print l

Példa

Legyen $A = (\begin{matrix} 3 & 0 & 2 & 1 \\ 0 & 1 & 3 & 4 \\ 2 & 3 & 2 & 1 \\ 1 & 4 & 1 & 5 \end{matrix})$

A jacobi a következő sajátértékeket és sajátvektorokat adja:

$λ_{1} = 3.8614176875601696$

$η^{(1)} = [\begin{matrix} 0.20847934594025172 \\ - 0.9248091113211869 \\ - 0.30940655891140356 \\ 0.07437776036050801 \end{matrix}]$

$λ_{2} = 1.0818507981865024$

$η^{(2)} = [\begin{matrix} 0.04702320745376396 \\ 0.334174641833777 \\ - 0.9043336166358197 \\ 0.2613366345126636 \end{matrix}]$

$λ_{3} = - 2.741255286528889$

$η^{(3)} = [\begin{matrix} 0.5641570498877014 \\ 0.09332500337954595 \\ 0.2860200054465712 \\ 0.7689016993677129 \end{matrix}]$

$λ_{4} = 8.797986800782214$

$η^{(4)} = [\begin{matrix} - 0.7975286849631742 \\ - 0.156031599737972 \\ 0.06812376684627766 \\ 0.5787584029064224 \end{matrix}]$

Jegyzetek

Sablon:Jegyzetek

Források

Sablon:Cite book
Digitális tankönyvtár/Természettudományok/Matematika/Numerikus módszerek 1./Jacobi-módszer

További információk

Sablon:Refbegin

Sablon:Refend

[1] Sablon:Cite journal

[2] Sablon:Cite journal

[1]

[2]

Jacobi-módszer

Tartalomjegyzék

Leírás

Általános eset

Algoritmus

Példa

Jegyzetek

Források

További információk

Navigációs menü

Jacobi-módszer

Leírás

Általános eset

Algoritmus

Példa

Jegyzetek

Források

További információk

Navigációs menü

Keresés