8. MARKOVKETTEN 127 u u H 6 HH 6 u - u 6 HH H HH HH j u u @ @ @ @ R @ u u - u u Abbildung 8.1: Reduzible und periodische Markovkette 8. Markovketten 8.1. Homogene Markovketten in diskreter Zeit Ein Prozess {Xn : n ∈ IIN} heisst homogene Markovkette (in diskreter Zeit) mit (abzählbarem) Zustandsraum E, falls Xn ∈ E für alle n ∈ IIN und IIP[Xn+1 = in+1 | X0 = i0 , . . . , Xn = in ] = IIP[X1 = in+1 | X0 = in ] für alle n ∈ IIN und alle ik ∈ E, 0 ≤ k ≤ n + 1. Es genügt den Fall E = IIN (I = ∞) oder E = {0, 1, . . . , I} für ein I ∈ IIN zu betrachten. Wir setzen νi = IIP[X0 = i] und pij = IIP[X1 = j | X0 = i]. Sei ν = (ν0 , . . . , νI ) und P = (pij )i,j∈E falls I < ∞, mit der analogen Definition falls I = ∞. Wir haben dann für die Verteilung von Xn IIP[Xn = i] = IIE[IIP[Xn = i | Xn−1 ]] = I X pji IIP[Xn−1 = j] = [(IIP[Xn−1 = j])j∈E P ]i . j=0 Mittels Induktion ist dies (IIP[Xn = i])i = (νP n )i . Definition 8.1. Wir sagen Zustand j ist erreichbar von i, falls es ein n gibt, so dass IIP[Xn = j | X0 = i] > 0. Wir sagen, die Markovkette ist irreduzibel, falls j erreichbar von i ist für alle i, j ∈ E. Wir sagen eine Markovkette ist aperiodisch, falls für alle i 1 der grösste gemeinsame Teiler von {n ≥ 1 : IIP[Xn = i | X0 = i] > 0} ist. Ist der grösste gemeinsame Teiler d > 1, so nennen wir die Markovkette periodisch mit Periode d. In Abbildung 8.1 ist in der Graphik links eine Kette abgebildet, in der der unterste Zustand nicht von den anderen erreicht werden kann. Die anderen Zustände sind 128 8. MARKOVKETTEN u ? - u - u - u - u - u ? Abbildung 8.2: Markovkette von allen anderen aus erreichbar. Löscht man den untersten Zustand, so wird die Kette aperiodisch und irreduzibel. Die rechte Graphik ist eine irreduzible Kette mit Periode 3. Schreiben wir nun i ↔ j, falls i von j und j von i erreichbar ist. Falls es für ein i kein j gibt, so dass i ↔ j, so wird die Markovkette den Zustand i verlassen und nie mehr zurückkehren oder für immer in i bleiben. Für solche Zustände interessieren wir uns nicht. Falls es keine solchen Zustände gibt, ist ↔ eine Äquivalenzrelation. Wir können also die Zustände in Äquivalenzklassen unterteilen. Ein Markovprozess verlässt dann die Äquivalenzklasse nie, und wir können jede Äquivalenzklassse gesondert betrachten. Daher werden wir nur irreduzible Markovketten betrachten. In einer irreduziblen Markovkette haben alle Zustände die gleichen Perioden. Hat eine Markovkette Periode d, so gibt es d Mengen, so dass die Markovkette deterministisch durch diese d Mengen läuft. In diesem Fall wollen wir nur die Markovkette Xnd studieren, die dann aperiodisch ist. Daher werden wir nur aperiodische Markovketten betrachten. Sei nun I endlich. Ist die Markovkette irreduzibel und aperiodisch, dann gibt es ein n0 (da der grösste gemeinsame Teiler 1 ist), so dass IIP[Xn0 = j | X0 = i] > 0 für alle i, j. Betrachten wir die Eigenwerte von P , und nennen wir sie λ0 , . . . , λI . P Wir ordnen die Eigenwerte so, dass |λi | ≥ |λi+1 |. Da Ij=0 pij = 1, ist P e = e für e = (1, . . . , 1)> , also existiert ein Eigenwert 1. Die Matrix P n0 hat die Eigenwerte λni 0 . Da P n0 e = e, und e echt positive Koordinaten hat, ist nach dem Perron– Fröbenius-Theorem λ0 = 1 und |λi | < λ0 = 1 für i ≥ 1. e ist der einzige (Rechts-) Eigenvektor, der nur positive Koordinaten hat. Weiter gibt es einen (Links-) Eigenvektor π mit πi > 0 für alle i. Wir haben dann, πP = π. Nach dem Perron– Fröbenius-Theorem ist dies der einzige Eigenvektor, der nur positive Einträge hat. P Wir können annehmen, dass Ii=0 πi = 1. Also ist {π} eine stationäre Verteilung. Da π der einzige Eigenvektor mit positiven Einträgen ist, ist π eindeutig. Beispiel 8.2. Sei pi,i+1 = p ∈ (0, 1) für 0 ≤ i < I, pi,i−1 = 1 − p für 1 ≤ i ≤ I, pI,I = p und p0,0 = 1 − p. Dann sind alle anderen Einträge 0. Die Kette ist in Abbildung 8.2 illustriert. Die Markovkette ist dann irreduzibel und aperiodisch. 8. MARKOVKETTEN 129 Wir müssen das Gleichungssystem πi = pπi−1 + (1 − p)πi+1 , 1 ≤ i ≤ I − 1 , π0 = (1 − p)(π0 + π1 ) , πI = p(πI−1 + πI ) lösen. Wir erhalten π1 = pπ0 /(1 − p), πi+1 = (πi − pπi−1 )/(1 − p), also πi = (p/(1 − p))i π0 . Dann ist die letzte Gleichung auch erfüllt. Ist p 6= 21 , so ist die Randbedingung I X p i 1 − p − p(p/(1 − p))I π0 = π0 . 1= 1−p 1 − 2p i=0 Also lässt sich π0 berechnen. Ist p = 21 , dann ist πi = π0 , und damit πi = (I + 1)−1 . Ist I = ∞, so folgern wir analog πi = (p/(1 − p))i π0 . Ist p < 12 , erhalten wir durch Summieren, π0 = (1 − 2p)/(1 − p), und damit πi = (1 − 2p)pi . (1 − p)i+1 Ist p ≥ 12 , dann sind die πi nur summierbar, falls π0 = 0. In diesem Falle existiert keine stationäre Verteilung. Wir werden die Kette mit I = ∞ und p ≥ 21 später analysieren. Proposition 8.3. Sei {Xn } eine irreduzible aperiodische Markovkette auf einem endlichen Zustandsraum. Dann existiert der Grenzwert πi = limn→∞ IIP[Xn = i | X0 = j] und ist unabhängig von j. Weiter gilt {π} ist eine stationäre Verteilung, und πi > 0 für alle i. Beweis. (n) Sei Mj (n) = supi∈E (P n )ij und mj (n+1) mj = inf i∈E X = inf i∈E (P n )ij . Wir haben dann pik (P n )kj ≥ inf k∈E i∈E X (n) pik mj (n) = mj . k∈E (n) (n) Also ist {mj } eine wachsende Folge. Analog folgt, dass {Mj } eine fallende Folge (n) ist. Somit existiert πj = limn Mj . Sei a = inf i,j (P n0 )ij . Dann haben wir (P (n0 +m )ij = X = X (P n0 )ik (P m )kj k∈E k∈E [(P n0 )ik − a(P m )jk ](P m )kj + a X (P m )jk (P m )kj k∈E X = [(P n0 )ik − a(P m )jk ](P m )kj + a(P 2m )jj . k∈E 130 8. MARKOVKETTEN Wir erhalten also (m) (P (n0 +m )ij ≥ mj X (m) [(P n0 )ik − a(P m )jk ] + a(P 2m )jj = mj (1 − a) + a(P 2m )jj k∈E (n +m) (m) (n0 +m) und damit mj 0 ≥ mj (1 − a) + a(P 2m )jj . Analog folgt Mj a) + a(P 2m )jj . Die Differenz wird (n0 +m) Mj (n0 +m) − mj (m) ≤ (1 − a)(Mj (m) ≤ Mj (1 − (m) − mj ) , und damit (kn0 +m) Mj (kn0 +m) − mj (m) ≤ (1 − a)k (Mj (kn +m) (m) − mj ) . (kn +m) gegen Null konvergiert. Somit − mj 0 Lassen wir k → ∞, folgt dass Mj 0 P (n0 ) n ≥ a, ist πj > 0. Aus j (P n )ij = 1, folgt konvergiert (P )ij gegen πj . Da mj P P n n+1 )ij = dass k∈E (P )ik pkj folgt, dass {π} eine stationäre j πj = 1. Aus (P Verteilung ist. Die Situation wird komplizierter, falls I = ∞. Wir sagen, die Markovkette ist transient, falls jeder Zustand nur endlich oft besucht wird, und rekurrent, falls jeder Zustand unendlich oft besucht wird. Wir sagen, die Markovkette ist positiv rekurrent, falls die mittlere Rückkehrzeit endlich ist, und Null-rekurrent, falls die mittlere Rückkehrzeit unendlich ist. (n) Wir bezeichnen nun mit fij = IIP[Xk 6= j, 1 ≤ k < n, Xn = j | X0 = i] die (n) Wahrscheinlichkeit, dass der erste Besuch in j zur Zeit n stattfindet, und fj = P (n) (n) fjj . Wir setzen fij = ∞ n=1 fij , und bemerken, dass fij > 0, da die Markovkette irreduzibel ist. Analog ist fj = fjj . Die mittlere Rückkehrzeit bezeichnen wir mit P (n) µj = n nfj . Seien nun i, j ∈ IIN mit i 6= j und N = inf{n : (P n )ij > 0} und M = inf{n : (P n )ji > 0}. Dann haben wir (P n+N +M )ii ≥ (P N )ij (P n )jj (P M )ji . (8.1) P Falls nun j ein rekurrenter Zustand ist, dann ist n (P n )jj = ∞ (Borel–Cantelli). P Somit schliessen wir, dass auch n (P n )ii = ∞. Wäre nun i ein transienter Zustand, so wäre die Anzahl der Besuche in i geometrisch verteilt, und ∞ ∞ ∞ hX X X (P n )ii = IIE[1IXn =i | X0 = i] = IIE 1IXn =i n=1 n=1 n=1 i X = i <∞ 0 8. MARKOVKETTEN 131 würde folgen. Wir schliessen aus (8.1), dass alle Zustände der Markovkette transient oder alle Zustände rekurrent sind. Sind die Zustände transient, so folgt daraus, dass (P n )ii gegen Null konvergiert. Da (P n+M )ii ≥ (P n )ij (P M )ji folgt, dass auch (P n )ij gegen Null konvergiert. Wir zeigen nun, dass auch positive Rekurrenz eine Eigenschaft ist, die für alle oder keine Zustände der Markovkette gilt. Proposition 8.4. Eine irreduzible und aperiodische Markovkette hat eine der folgenden Eigenschaften: i) Die Zustände sind transient. In diesem Fall gilt limn (P n )ij = 0. P n (P ii) Die Zustände sind Null-rekurrent. In diesem Fall gilt limn (P n )ij = 0. n )ij < ∞, und damit P n (P n )ij = ∞, aber iii) Die Zustände sind positiv rekurrent. In diesem Fall gilt limn (P n )ij = µ−1 j . Beweis. Wir haben die Aussage im transienten Fall schon bewiesen. Sei die Mar(n) kovkette daher rekurrent. Sei uij = IIP[Xn = j | X0 = i] = (P n )ij die Wahrschein(0) lichkeit, dass das Ereignis (Rückkehr) zum Zeitpunkt n eintritt. Wir setzen uii = 1. Dann gilt für n ≥ 1 n X (k) (n−k) (n) . fi uii uii = k=1 P∞ (k) k=n+1 fi (keine Rückkehr bis zum Zeitpunkt n), so ist Setzen wir nun rn = (k) r0 = 1. Wir haben fi = rk−1 − rk . Die obige Gleichung ist dann (n) r0 uii n X (n−k) (rk−1 − rk )uii = . k=1 Also erhalten wir n X (n−k) rk uii k=0 = n X (n−k) rk−1 uii k=1 = n−1 X (n−1−k) rk uii (0) = r0 uii = 1 . k=0 Die zweitletzte Gleichung folgt, da die Summe nicht von n abhängt. Sei nun λi = (n) (n) limn uii . Sei ε > 0. Es gibt ein n0 , so dass für alle n ≥ n0 uii < λi + ε. Es gibt ein P (k) (n) n1 ≥ n0 , so dass ∞ < ε. Es gibt ein n > 2n1 , so dass uii > λi − ε. Also k=n1 fi λi − ε < (n) uii < n1 X k=1 (k) (n−k) fi uii + ε ≤ λi + n1 X k=1 (k) (n−k) fi (uii − λi ) + ε < λi + 2ε . 132 8. MARKOVKETTEN P (n−k) Wir schliessen daraus, dass uii nach λi konvergiert. Ist µi = ∞ k=0 rk < ∞, so Pn (n−k) folgt mit beschränkter Konvergenz aus k=0 rk uii = 1, dass λi µi = 1. Also ist Pm P (n−k) −1 λi = µi . Ist µi = ∞, so konvergiert k=0 rk uii nach λi m k=0 rk . Der Grenzwert ist aber durch 1 beschränkt, also ist λi = 0. Aus (8.1) folgt nun, dass entweder alle (P n )jj gegen Null konvergieren, oder alle einen echt positiven Grenzwert haben. Das heisst, dass entweder alle µi = ∞, oder alle µi < ∞. Somit sind alle Zustände gleichzeitig positiv rekurrent oder Null-rekurrent. Im Falle, wo die Zustände Nullrekurrent sind, ist wegen der Ungleichung (P n+N )ii ≥ (P N )ij (P n )ji die Aussage auch bewiesen. Nehmen wir nun an, dass die Zustände alle positiv rekurrent sind. Sei i 6= j. Dann haben wir n X (n) (k) (n−k) uij = fij ujj . k=1 Die Aussage folgt nun mit beschränkter Konvergenz. Korollar 8.5. Für eine irreduzible und aperiodische Markovkette gibt es genau dann eine stationäre Verteilung, wenn die Kette positiv rekurrent ist. In diesem Falle ist πk = µ−1 k . Beweis. Nehmen wir an, es gibt eine stationäre Verteilung {πk }. Dann gilt wegen der beschränkten Konvergenz X X X −1 πk = πi (P n )ik = lim πi (P n )ik = πi µ−1 k = µk . n i i i Sei die Markovkette nun positiv rekurrent. Wir schliessen dann mit Hilfe des Lemmas P P n von Fatou, dass k µ−1 k ≤ 1, da k (P )ik = 1. Aus X (P n+1 )ij = (P n )ik P kj , k erkennen wir, dass µ−1 j ≥ X j µ−1 j ≥ P k µ−1 k P kj . Also ist XX j k µk−1 P kj = XX k j µ−1 k P kj = X µ−1 k . k P −1 Somit gilt das Gleichheitszeichen und {(µ−1 i / k µk )i } ist eine stationäre Verteilung. Wir haben aber bereits gezeigt, dass πk = µ−1 k . Das folgende Resultat wird oft für Simulationen verwendet. 8. MARKOVKETTEN 133 Korollar 8.6. Für eine irreduzible aperiodische Markovkette {Xn } definieren wir P (n) ai = n−1 nk=1 1IXk =i , die mittlere Anzahl Besuche in i bis zum Zeitpunkt n. Ist die (n) Markovkette positiv rekurrent, dann konvergiert ai nach µ−1 i . Ist die Markovkette (n) transient oder Null-rekurrent, dann konvergiert ai nach 0. Beweis. Die Aussage ist für eine transiente Markovkette klar. Sei die Kette also (0) (n) rekurrent. Nehmen wir an, dass wir in i starten. Sei Ti = 0 und Ti die Zeit des n-ten Besuches in i. Dann haben wir n X (n) (j) ai n = 1IXk =i = sup{j : Ti ≤ n} . k=1 (k) Da die Variablen {Ti konvergiert (k−1) − Ti (n) ai n (n) (j) } unabhängig sind, konvergiert j −1 Ti (n) (n) ai n + 1 (ai n+1) ai n + 1 Ti nach µi . Also (n) ≤ ai ≤ ai n (n) a Ti i n nach µ−1 i . Zum Abschluss betrachten wir im Folgenden Markovketten, die nicht irreduzibel sind. Wir können dann die Kette in irreduzible Teilketten Cj und transiente Zustände T zerlegen. Falls X0 = i ein rekurrenter Zustand ist, dann sind alle erreichbaren Zustände in der gleichen irreduziblen Teilkette. Nehmen wir nun an, dass X0 = i in der Menge T von transienten Zuständen ist. Dann kann die Markovkette irgendwann eine rekurrente Menge Cj erreichen, oder für immer in der Menge T bleiben. Wir wollen nun die Wahrscheinlichkeit xij berechnen, dass die Markovkette in der Menge Cj absorbiert wird. (1) Die Wahrscheinlichkeit im ersten Schritt in die Menge Cj zu gelangen ist xij = k∈Cj Pik . Falls die Kette nicht schon im ersten Schritt in Cj landet, muss sie in T landen, da sonst Cj nicht mehr erreicht werden kann. Daher löst xij das Gleichungssystem X X xij = Pik + Pik xkj . (8.2) P k∈Cj k∈T Falls dieses Gleichungssystem eine eindeutige beschränkte Lösung hat, sind die {xij } bestimmt. Ansonsten definieren wir X (n+1) (n) xij = Pik xkj , k∈T die Wahrscheinlichkeit, in n + 1 Schritten die Menge Cj zu erreichen. Wir haben P (n) dann xij = ∞ n=1 xij . 134 8. MARKOVKETTEN Betrachten wir nun die Wahrscheinlichkeit yi , dass das System für immer in den transienten Zuständen bleibt. Dann muss im ersten Schritt ein transienter Zustand erreicht werden. Das heisst, {yi } löst das Gleichungssystem yi = X Pik yk . k∈T Falls 0 die einzige beschränkte Lösung des obigen Gleichungssystems ist, folgt dass irgend einmal ein rekurrenter Zustand erreicht wird. Falls die Lösung nicht einP (1) deutig ist, setzen wir yi = k∈T Pik , die Wahrscheinlichkeit, dass die transienten P (n+1) (n) Zustände im ersten Schritt nicht verlassen werden, und yi = k∈T Pik yk die Wahrscheinlichkeit, dass in n + 1 Schritten die transienten Zustände nicht verlassen (n) werden. Dann ist yi = limn yi . Sei nun {zk } eine beschränkte Lösung des Gleichungssystems zi = X Pik zk . (8.3) k∈T (1) Wir können annehmen, dass |zi | ≤ 1. Dann erhalten wir |zi | ≤ yi , und rekursiv, (n) |zi | ≤ yi . Also ist |zi | ≤ yi . Wir schliessen somit, dass das System für immer in den transienten Zuständen bleiben kann, falls es eine beschränkte Lösung des Gleichungssystems (8.3) mit zi 6= 0 gibt. In diesem Falle ist {yi } die maximale Lösung, die durch 1 begrenzt ist. Ist 0 die einzige Lösung, dann sind die Wahrscheinlichkeiten {xij } durch die eindeutige Lösung des Systems (8.2) gegeben. Die Differenz zweier Lösungen von (8.2) löst (8.3). Wir sehen nun auch, dass (8.2) genau dann eine eindeutige beschränkte Lösung besitzt, falls das System fast sicher einen rekurrenten Zustand erreicht. Ansonsten müssen wir die Kette unter der Bedingung betrachten, dass das System irgendwann einen rekurrenten Zustand erreicht. Das heisst, wir setzen für i ∈ T P̃ik = (1 − yk )Pik /(1 − yi ) , k∈T , P̃ik = Pik /(1 − yi ) , k∈ /T . Dann hat das Gleichungssystem x̃ij = X k∈Cj P̃ik + X P̃ik x̃kj k∈T eine eindeutige beschränkte Lösung. Die gesuchte Lösung ist dann xij = x̃ij (1 − yi ). 8. MARKOVKETTEN 135 Beispiel 8.7. Die Matrix P ist gegeben durch P00 = 1 und Pn(n+1) = 1 − Pn0 = pn > 0, n ≥ 1. Dann ist 0 ein rekurrenter Zustand, die andern Zustände sind transient. Wir müssen dann also das System yn = pn yn+1 lösen. Dies hat nur dann eine Qn −1 nicht-triviale Lösung, falls y1 6= 0. Wir erhalten nun yn+1 = p−1 n yn = y1 k=1 pk . Es Q∞ gibt somit genau dann eine beschränkte Lösung, falls p = k=1 pk > 0. Da yn ≤ 1, Q folgt y1 ≤ n−1 k=1 pk , also y1 ≤ p. Da wir die maximale Lösung suchen, ist y1 = p, Q Q∞ und damit yn = p/ n−1 k=1 pk = k=n pk . Q Setzen wir zum Beispiel pn = n/(n+1), so ist nk=1 pk = 1/(n+1) und konvergiert nach Null. Die Markovkette wird also fast sicher den Zustand 0 erreichen. Setzen Q n n+2 , so ist nk=1 pk = (n + 2)/(2(n + 1)). Dies wir pn = ((n + 1)2 − 1)/(n + 1)2 = n+1 n+1 konvergiert nach p = 21 . Somit ist es möglich, dass die Kette immer in den transienten Zuständen verbleibt. Die gesuchte Wahrscheinlichkeit ist dann also yn = n/(n + 1). Wir können nun auch ein Kriterium formulieren, wann eine irreduzible Markovkette transient oder rekurrent ist. Korollar 8.8. Eine irreduzible Markovkette ist genau dann transient, falls das Gleichungssystem ∞ X yi = Pij yj j=1 eine nicht triviale beschränkte Lösung besitzt. Beweis. Für eine irreduzible Markovkette müssen alle Zustände transient oder alle rekurrent sein. Die Kette ist genau dann transient, wenn es einen Zustand gibt, von dem aus 0 mit echt positiver Wahrscheinlichkeit nicht erreicht wird. Ändern wir die Markovkette, so dass 0 absorbierend wird, dann ist die Kette genau dann transient, wenn die Kette die transienten Zustände der veränderten Kette mit positiver Wahrscheinlichkeit nie verlässt. Dies ist genau dann der Fall, wenn die obige Gleichung eine nicht triviale beschränkte Lösung besitzt. Beispiel 8.2 (Fortsetzung). Im betrachteten Beispiel müssen wir die Gleichungen y1 = py2 , yk = pyk+1 + (1 − p)yk−1 , k ≥ 2 lösen. Ist y1 = 0, so erhalten wir durch Induktion yk = 0 für alle k. Somit muss y1 6= 0 gelten, falls eine nichtriviale Lösung existiert. Wir können y1 = 1 wählen. Dann ist y2 = p−1 . Im Falle p = 21 ist dies y2 = 2. Aus yk+1 = 2yk − yk−1 erhalten wir mittels Induktion yk = k. Somit ist diese 136 8. MARKOVKETTEN Lösung nicht beschränkt, und die Kette ist rekurrent. Ist p 6= 21 , dann ist die Lösung yk = p 1 − p k −1 . 1 − 2p p Diese Lösung ist genau dann beschränkt, falls p > 12 . Somit ist die Markovkette transient im Falle p > 12 , und rekurrent im Falle p ≤ 12 . Wir haben bereits gesehen, dass nur im Falle p < 12 eine stationäre Verteilung existiert. Also ist die Markovkette positiv rekurrent, falls p < 12 , und Null-rekurrent, falls p = 12 . Nehmen wir an, wir wissen, dass Xn = i. Sei m < n. Dann ist P m n−m )ji k (P )kj (P k νP qij (n, m) = IIP[Xm = j | Xn = i] = . n k νk (P )ki Insbesondere für m = n − 1 erhalten wir P νk (P n−1 )kj P ji kP qij (n, n − 1) = . n k νk (P )ki Wenn das System im stationären Zustand startet, dann ist νk = πk = µ−1 k . Dies macht nur Sinn, falls der Prozess positiv rekurrent ist. In diesem Falle erhalten wir qij = qij (n, n − 1) = πj P ji . πi Die bedingten Wahrscheinlichkeiten qij definieren die Übergangswahrscheinlichkeiten einer Markovkette. Wir erhalten damit den Prozess, wenn die Zeit umgekehrt wird. Falls wir die gleiche Markovkette erhalten, das heisst, qij = Pij , so nennen wir die Markovkette reversibel. 8.2. Homogene Markovketten in stetiger Zeit Generell definieren wir einen Markovprozess in stetiger Zeit als einen Prozess mit der Eigenschaft IIP[Xt+s ∈ B | Ft ] = IIP[Xt+s ∈ B | Xt ]. Der Prozess heisst homogen, falls IIP[Xt+s ∈ B | Xt = x] = IIP[Xs ∈ B | X0 = x]. Falls der Prozess nur Werte in IIN annimmt, dann darf die Zeit T1 , bis der Prozess den Zustand X0 = i verlässt, kein Gedächtnis haben. Das heisst sie muss exponentialverteilt sein. Nennen wir den Parameter −Qii . Die Folge der Zustände, die der Prozess besucht, müssen dann eine Markovkette bilden. Nennen wir die Übergangsmatrix P . Es gilt dann Pii = 0, da die Kette den Zustand i verlässt. Wir definieren nun Qij = −Pij Qii für i 6= j. Die 8. MARKOVKETTEN 137 Matrix Q = (Qij ) heisst Intensitätsmatrix der Markovkette X. Die Matrix Q hat dann die Eigenschaft, dass die Zeilen sich zu Null addieren, die Diagonalen negativ sind, und die Einträge ausserhalb der Diagonalen positiv sind. Wir nehmen an, dass in endlicher Zeit nur endlich viele Sprünge stattfinden können. Wir haben nun die Wahrscheinlichkeiten IIP[T1 ≤ h, XT1 = j | X0 = i] = Pij (1 − eQii h ) = Pij (−Qii h + o(h)) = Qij h + o(h) . Also ist Qij die Intensität eines Sprunges von i nach j. Wir wollen nun die Verteilung von Xt bestimmen. Sei pi (t) = IIP[Xt = i]. Wir haben dann pi (t + h) = pi (t)(1 + Qii h) + X pj (t)Qji h + o(h) = pi (t) + X pj (t)Qji h + o(h) . j j6=i Somit sind die Funktionen pi (t) rechtsstetig. Wir haben nun pi (t + h) − pi (t) X = pj (t)Qji + o(1) , h j P also p0i (t) = j pj (t)Qji . Ersetzen wir t durch t − h, erhalten wir die gleiche Differentialgleichung für die Ableitung von links. Die Lösung mit der Anfangsbedingung pi (0) = νi ist (IIP[Xt = i])i = νeQt . Ist der Zustand j vom Zustand i aus erreichbar, dann ist IIP[Xt = j | X0 = i] > 0 für alle t, da die Sprungzeiten absolutstetig mit Träger [0, ∞] sind. Also sind i und j in derselben irreduziblen Menge, falls beide (eQ )ij > 0 und (eQ )ji > 0. Da die Zeiten zwischen Sprüngen exponentialverteilt sind, ist jede irreduzible Markovkette in stetiger Zeit aperiodisch. Wir haben also folgende möglichen irreduziblen Markovketten. Proposition 8.9. Eine irreduzible Markovkette in stetiger Zeit hat eine der folgenden Eigenschaften: i) Die Zustände sind transient. In diesem Fall gilt und limt→∞ etQ = 0. nhQ )ij n (e P ii) Die Zustände sind Null-rekurrent. In diesem Fall gilt h > 0, aber limt→∞ etQ = 0. < ∞ für alle h > 0, nhQ )ij n (e P = ∞ für jedes 138 8. MARKOVKETTEN iii) Die Zustände sind positiv rekurrent. In diesem Fall gilt limt→∞ (etQ )ij = µ−1 j , wobei µj = IIE[inf{t : Xt = j, Xt− 6= j} | X0 = j] die mittlere Rückkehrzeit nach j ist. Beweis. Die Aussagen im transienten und Null-rekurenten Fall sind klar. Wir wissen, dass (enQ )ij gegen eine stationäre Verteilung der Kette {Xn } konvergiert. Dies ist also ein Eigenvektor der Matrix eQ zum Eigenwert 1. Nach dem Perron– Fröbenius-Theorem ist dieser Eigenwert einfach. Da 0 = log 1 ein Eigenwert von Q ist, ist dieser Eigenwert auch einfach, und πQ = 0. Somit konvergiert enhQ gegen den gleichen Grenzwert für alle h. Aus IIP[Xnh+s = j | X0 = i] ≥ IIP[Xnh = j | X0 = i](1 − eQjj s ) für alle s ∈ [0, h), schliessen wir, dass limt (etQ )ij ≥ πj . Aus IIP[Xnh = j | X0 = i] ≥ IIP[Xnh−s = j | X0 = i](1 − eQjj s ) schliessen wir, dass auch limt (etQ )ij ≤ πj . Die Interpretation als Rückkehrzeit folgt analog. Wir sehen nun also, dass die stationäre Verteilung die normierte Lösung der Gleichung πQ = 0 ist. Die folgende Aussage folgt wie im Fall der diskreten Zeit. Korollar 8.10. Für eine positiv rekurrente Markovkette konvergiert Z t (t) −1 aj = t 1IXs =j ds 0 nach πj = µ−1 j . Für eine Null-rekurrente oder transiente Markovkette konvergiert (t) aj nach 0.
© Copyright 2024 ExpyDoc