Z Skrypty dla studentów Ekonofizyki UPGOW
(→Stochastyczne równania różniczkowe) |
(→STOCHASTYCZNE RÓWNANIA RÓŻNICZKOWE) |
||
(Nie pokazano 44 wersji pomiędzy niniejszymi.) | |||
Linia 1: | Linia 1: | ||
- | == | + | [[Plik:kl.png|200px|left]][[Plik:Ue.png|200px|right]] |
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ==STOCHASTYCZNE RÓWNANIA RÓŻNICZKOWE== | ||
Linia 6: | Linia 13: | ||
Pamiętamy, że proces Wienera otrzymaliśmy jako graniczny proces błądzenia przypadkowego cząstki poruszającej się ruchem jednowymiarowym. Uogólnienie na przypadek dwóch lub trzech wymiarów nie stanowi problemu. Proces Wienera | Pamiętamy, że proces Wienera otrzymaliśmy jako graniczny proces błądzenia przypadkowego cząstki poruszającej się ruchem jednowymiarowym. Uogólnienie na przypadek dwóch lub trzech wymiarów nie stanowi problemu. Proces Wienera | ||
<math>W(t)</math> opisuje w tym przypadku położenie cząstki. Pochodna procesu Wienera jest białym szumem gaussowskim | <math>W(t)</math> opisuje w tym przypadku położenie cząstki. Pochodna procesu Wienera jest białym szumem gaussowskim | ||
- | <math>\Gamma(t)</math>. Jeżeli oznaczymy położenie | + | <math>\Gamma(t)</math>. Jeżeli oznaczymy położenie cząstki przez <math>X(t)</math>, to możemy napisać następującą relację |
:<math>\frac{dX(t)}{dt} =\Gamma(t)</math> | :<math>\frac{dX(t)}{dt} =\Gamma(t)</math> | ||
Linia 20: | Linia 27: | ||
gdzie funkcje <math>F(x, t)</math> oraz <math>G(x, t)</math> są funkcjami deterministycznymi (nielosowymi). | gdzie funkcje <math>F(x, t)</math> oraz <math>G(x, t)</math> są funkcjami deterministycznymi (nielosowymi). | ||
- | |||
- | Fizycy nazywają <xr id="eqn:10.1-equation">Równanie (%i</xr>) równaniem Langevina. Matematycy nie lubią takiej postaci tego równania. Dlaczego? Ponieważ, jak pamiętamy, biały szum gaussowski nie jest "poprawnie" zdefiniowany. Nawet w sensie średnikwadratowym! Matematycy preferują inną postać <xr id="eqn:10.1-equation">równania (%i</xr>) którą można otrzymać w następujący sposób: | + | [[Plik:Langevin.jpg|thumb|right|Paul Langevin (1872–1946) [http://en.wikipedia.org/wiki/Paul_Langevin]]] |
+ | |||
+ | Okazuje się, że interpretacja takich równań stochastycznych z białymi szumami (poissonowskim, gaussowskim lub najogólniej Levy'ego) nie jest jednoznaczna w odróżnieniu od równań różniczkowych deterministycznych, to znaczy takich, które nie zawierają żadnych wielkości losowych. Gdzie tkwi przyczyna niejednoznaczności? Moźna odpowiedzieć, że źródłem tych niejednoznaczności jest własność procesu Wienera, Poissona lub w ogólności Levy'ego. Pamiętamy, że są to procesy o niezależnych przyrostach na nieprzekrywających się przedziałach. To jest istota zagadnienia. | ||
+ | |||
+ | Fizycy nazywają <xr id="eqn:10.1-equation">Równanie (%i</xr>) '''równaniem Langevina'''. Matematycy nie lubią takiej postaci tego równania. Dlaczego? Ponieważ, jak pamiętamy, biały szum gaussowski nie jest "poprawnie" zdefiniowany. Nawet w sensie średnikwadratowym! Matematycy preferują inną postać <xr id="eqn:10.1-equation">równania (%i</xr>) którą można otrzymać w następujący sposób: | ||
ponieważ | ponieważ | ||
+ | |||
<equation id="eqn:10.2-equation"> | <equation id="eqn:10.2-equation"> | ||
<math>\frac{dW(t)}{dt} = \Gamma(t)</math> | <math>\frac{dW(t)}{dt} = \Gamma(t)</math> | ||
</equation> | </equation> | ||
+ | |||
więc pomnożymy obustronnie <xr id="eqn:10.1-equation">równanie (%i</xr>) przez <math>dt</math> i otrzymamy | więc pomnożymy obustronnie <xr id="eqn:10.1-equation">równanie (%i</xr>) przez <math>dt</math> i otrzymamy | ||
Linia 39: | Linia 51: | ||
Ta postać równania nazywa się równaniem Ito. W tym równaniu wszystkie wielkości są poprawnie zdefiniowane. Wielkość | Ta postać równania nazywa się równaniem Ito. W tym równaniu wszystkie wielkości są poprawnie zdefiniowane. Wielkość | ||
<math>dW(t)</math> jest różniczką czyli przyrostem procesu Wienera: | <math>dW(t)</math> jest różniczką czyli przyrostem procesu Wienera: | ||
+ | |||
<equation id="eqn:10.4-equation"> | <equation id="eqn:10.4-equation"> | ||
<math>dW(t) = W(t+dt) - W(t)\,</math> | <math>dW(t) = W(t+dt) - W(t)\,</math> | ||
</equation> | </equation> | ||
+ | |||
Wiemy, że | Wiemy, że | ||
+ | |||
<equation id="eqn:10.5-equation"> | <equation id="eqn:10.5-equation"> | ||
<math>\langle dW(t) \rangle = 0, \; \; \; \; \; \langle [dW(t)]^2 \rangle = 2D dt</math> | <math>\langle dW(t) \rangle = 0, \; \; \; \; \; \langle [dW(t)]^2 \rangle = 2D dt</math> | ||
</equation> | </equation> | ||
+ | |||
Stąd, w sensie średniokwadratowym | Stąd, w sensie średniokwadratowym | ||
+ | |||
<equation id="eqn:10.6-equation"> | <equation id="eqn:10.6-equation"> | ||
Linia 56: | Linia 73: | ||
</equation> | </equation> | ||
+ | |||
Przy takim spojrzeniu, w <xr id="eqn:10.3-equation">równaniu (%i</xr>), pierwszy wyraz po prawej stronie jest rzędu | Przy takim spojrzeniu, w <xr id="eqn:10.3-equation">równaniu (%i</xr>), pierwszy wyraz po prawej stronie jest rzędu | ||
<math>dt</math>, natomiast drugi wyraz jest rzędu <math>\sqrt{dt}</math>. | <math>dt</math>, natomiast drugi wyraz jest rzędu <math>\sqrt{dt}</math>. | ||
Linia 61: | Linia 79: | ||
Możemy powyższe równanie Ito uogolnić na | Możemy powyższe równanie Ito uogolnić na | ||
wielowymiarowy przypadek dla wektora procesów stochastycznych | wielowymiarowy przypadek dla wektora procesów stochastycznych | ||
+ | |||
:<math>\vec{X}(t)= \{X_1(t), X_2(t), \dots, X_n(t)\}</math> | :<math>\vec{X}(t)= \{X_1(t), X_2(t), \dots, X_n(t)\}</math> | ||
Linia 75: | Linia 94: | ||
gdzie funkcje <math>F_i({\vec X}, t)</math> oraz <math>G_{ij}({\vec X}, t)</math> są funkcjami deterministycznymi (nielosowymi) oraz | gdzie funkcje <math>F_i({\vec X}, t)</math> oraz <math>G_{ij}({\vec X}, t)</math> są funkcjami deterministycznymi (nielosowymi) oraz | ||
+ | |||
:<math>\vec{W}(t)= \{W_1(t), W_2(t), \dots, W_n(t)\}</math> | :<math>\vec{W}(t)= \{W_1(t), W_2(t), \dots, W_n(t)\}</math> | ||
Linia 85: | Linia 105: | ||
<math>\langle dW_i(t) \rangle = 0, \; \; \; \; \; \langle dW_i(t) dW_j(t) \rangle = 2D_i \delta_{ij} dt</math> | <math>\langle dW_i(t) \rangle = 0, \; \; \; \; \; \langle dW_i(t) dW_j(t) \rangle = 2D_i \delta_{ij} dt</math> | ||
</equation> | </equation> | ||
+ | |||
gdzie <math>\delta_{ij}</math> jest deltą Kroneckera (patrz Dodatek matematyczny). | gdzie <math>\delta_{ij}</math> jest deltą Kroneckera (patrz Dodatek matematyczny). | ||
Linia 107: | Linia 128: | ||
<math>I_1= \int_{t_0}^t F(X(s), s) ds</math> | <math>I_1= \int_{t_0}^t F(X(s), s) ds</math> | ||
</equation> | </equation> | ||
+ | |||
oraz całka, w której występuje proces Wienera | oraz całka, w której występuje proces Wienera | ||
+ | |||
<equation id="eqn:10.9-equation"> | <equation id="eqn:10.9-equation"> | ||
Linia 120: | Linia 143: | ||
<math>I_1= \int_{t_0}^t F(X(s), s) ds = \lim_{n \to \infty} \sum_{i=0}^{n-1} F(X({\tilde s}_i), {\tilde s}_i) [s_{i+1} -s_i]</math> | <math>I_1= \int_{t_0}^t F(X(s), s) ds = \lim_{n \to \infty} \sum_{i=0}^{n-1} F(X({\tilde s}_i), {\tilde s}_i) [s_{i+1} -s_i]</math> | ||
</equation> | </equation> | ||
+ | |||
gdzie granicę należy rozumieć w sensie średniokwadratowym oraz <math>{\tilde s}_i \in [s_i, s_{i+1}]</math> jest dowolną wartością z danego przedziału <math>[s_i, s_{i+1}]</math>. | gdzie granicę należy rozumieć w sensie średniokwadratowym oraz <math>{\tilde s}_i \in [s_i, s_{i+1}]</math> jest dowolną wartością z danego przedziału <math>[s_i, s_{i+1}]</math>. | ||
Linia 129: | Linia 153: | ||
<math>I_3= \int_{t_0}^t H(W(s), s) dW(s) = \lim_{n \to \infty} \sum_{i=0}^{n-1} H(W(s_i), {\tilde s}_i) [W(s_{i+1}) -W(s_i)]</math> | <math>I_3= \int_{t_0}^t H(W(s), s) dW(s) = \lim_{n \to \infty} \sum_{i=0}^{n-1} H(W(s_i), {\tilde s}_i) [W(s_{i+1}) -W(s_i)]</math> | ||
</equation> | </equation> | ||
+ | |||
Tak określona całka nazywa się całką Ito i ma "przyjazne" własności z tego powodu, że wartości średnie typu | Tak określona całka nazywa się całką Ito i ma "przyjazne" własności z tego powodu, że wartości średnie typu | ||
Linia 147: | Linia 172: | ||
- | Całki, w definicji których wartości procesu <math>X(t)</math> lub <math>W(t)</math> należy brać z lewej strony przedziałów <math>[s_i, s_{i+1}]</math>, nazywamy '''całkami Ito''' lub całkami w interpretacji Ito. Ponieważ jak na razie z czysto matematycznego punktu widzenia wybór punktu z lewej strony przedziału jest arbitralny, każdy inny punkt jest równo uprawniony. Ale należy bezwględnie pamiętać, że zmiana położenia punktu <math>{\tilde s}_i</math> w przedziale <math>[s_i, s_{i+1}] </math> oznacza zmianę wartości całki. To odróżnia całki stochastyczne od "tradycyjnych" całek Riemanna. | + | |
+ | [[Plik:Ito.jpg|thumb|right|Kiyoshi Itō (1915–2008) | ||
+ | [http://en.wikipedia.org/wiki/Kiyoshi_It%C5%8D]]] | ||
+ | |||
+ | Całki, w definicji których wartości procesu <math>X(t)</math> lub <math>W(t)</math> należy brać z lewej strony przedziałów <math>[s_i, s_{i+1}]</math>, nazywamy '''całkami Ito''' lub całkami w interpretacji Ito. Ponieważ jak na razie z czysto matematycznego punktu widzenia wybór punktu z lewej strony przedziału jest arbitralny, każdy inny punkt jest równo uprawniony. Ale należy bezwględnie pamiętać, że zmiana położenia punktu <math>{\tilde s}_i</math> w przedziale <math>[s_i, s_{i+1}] </math> dla <math>X(\tilde s_i)</math> czy dla <math>W(\tilde s_i)</math> oznacza zmianę wartości całki. To odróżnia całki stochastyczne od "tradycyjnych" całek Riemanna. W związku z tym pojawia się poważny problem, gdy chcemy stosować równania stochastyczne do modelowania realnych zjawisk i procesów. Czy istnieją jakieś racjonalne kryteria na wybór punktu pośredniego | ||
+ | <math>\tilde s_i</math>? Dylemat ten przez pewien okres czasu był przedmiotem dyskusji i polemik. | ||
+ | Do tego problemu powrócimy w dalszej części wykładów. | ||
+ | |||
Istnieją także inne definicje całek stochastycznych. Druga, konkurencyjna definicja jest następująca: | Istnieją także inne definicje całek stochastycznych. Druga, konkurencyjna definicja jest następująca: | ||
Linia 158: | Linia 190: | ||
- | gdzie | + | gdzie oznaczenie <math>\circ</math> w całce ma informować o tym, że wartość funkcji <math>G(X(t), t)</math> na przedziale |
<math>[s_i, s_{i+1}] </math> jest brana dla średniej arytmetycznej <math>[X(s_{i+1}) + X(s_i)]/2</math>. Tak określona całka nazywa się '''całką Stratonowicza''' lub całka w sensie | <math>[s_i, s_{i+1}] </math> jest brana dla średniej arytmetycznej <math>[X(s_{i+1}) + X(s_i)]/2</math>. Tak określona całka nazywa się '''całką Stratonowicza''' lub całka w sensie | ||
- | Stratonowicza. | + | Stratonowicza [http://en.wikipedia.org/wiki/Ruslan_L._Stratonovich]. |
Czytelnik łatwo zauważy, że obie całki są szczególnymi przypadkami takiej oto całki: | Czytelnik łatwo zauważy, że obie całki są szczególnymi przypadkami takiej oto całki: | ||
Linia 177: | Linia 209: | ||
gdzie <math>\lambda \in [0, 1]</math>. Jeżeli <math>\lambda =0</math>, otrzymujemy definicję Ito. Dla <math>\lambda =1/2</math> otrzymujemy definicję Stratonowicza. | gdzie <math>\lambda \in [0, 1]</math>. Jeżeli <math>\lambda =0</math>, otrzymujemy definicję Ito. Dla <math>\lambda =1/2</math> otrzymujemy definicję Stratonowicza. | ||
- | |||
- | |||
===Rachunek różniczkowy Ito=== | ===Rachunek różniczkowy Ito=== | ||
Linia 184: | Linia 214: | ||
W '''Dodatku matematycznym''' przedstawiliśmy rozwinięcie funkcji jednej zmiennej <math>f(x)</math> i funkcji dwóch zmiennych <math>F(x, y) </math> w szereg Taylora. Rozpatrzmy teraz funkcję dwóch zmiennych <math>g(x, t)</math>, która jest różniczkowalna dostateczną ilość razy. W szczególności zakładamy, że istnieją pochodne | W '''Dodatku matematycznym''' przedstawiliśmy rozwinięcie funkcji jednej zmiennej <math>f(x)</math> i funkcji dwóch zmiennych <math>F(x, y) </math> w szereg Taylora. Rozpatrzmy teraz funkcję dwóch zmiennych <math>g(x, t)</math>, która jest różniczkowalna dostateczną ilość razy. W szczególności zakładamy, że istnieją pochodne | ||
+ | |||
<math>g'(x, t)= g' =\partial g(x, t)/\partial x, \; \; \dot g(x, t) = \dot g = \partial g(x, t)/\partial t, \; \; g''(x, t) = g'' =\partial^2 g/\partial x^2, \; \;</math> | <math>g'(x, t)= g' =\partial g(x, t)/\partial x, \; \; \dot g(x, t) = \dot g = \partial g(x, t)/\partial t, \; \; g''(x, t) = g'' =\partial^2 g/\partial x^2, \; \;</math> | ||
Linia 191: | Linia 222: | ||
Rozpatrzmy teraz funkcję <math>g(X, t)</math>, gdzie teraz pierwszym argumentem jest proces stochastyczny <math>X(t)</math> okreslony przez równanie stochastyczne Ito: | Rozpatrzmy teraz funkcję <math>g(X, t)</math>, gdzie teraz pierwszym argumentem jest proces stochastyczny <math>X(t)</math> okreslony przez równanie stochastyczne Ito: | ||
+ | |||
<equation id="eqn:10.51-equation"> | <equation id="eqn:10.51-equation"> | ||
<math>dX(t)= F(X(t), t)dt + G(X(t), t) dW(t)\;</math> | <math>dX(t)= F(X(t), t)dt + G(X(t), t) dW(t)\;</math> | ||
</equation> | </equation> | ||
+ | |||
gdzie <math>dW(t)</math> jest różniczką procesu Wienera: | gdzie <math>dW(t)</math> jest różniczką procesu Wienera: | ||
+ | |||
<equation id="eqn:10.52-equation"> | <equation id="eqn:10.52-equation"> | ||
<math>dW(t) = W(t+dt) - W(t)\,</math> | <math>dW(t) = W(t+dt) - W(t)\,</math> | ||
</equation> | </equation> | ||
+ | |||
Wiemy, że | Wiemy, że | ||
+ | |||
<equation id="eqn:10.53-equation"> | <equation id="eqn:10.53-equation"> | ||
<math>\langle dW(t) \rangle = 0, \; \; \; \; \; \langle [dW(t)]^2 \rangle = 2D dt</math> | <math>\langle dW(t) \rangle = 0, \; \; \; \; \; \langle [dW(t)]^2 \rangle = 2D dt</math> | ||
</equation> | </equation> | ||
+ | |||
Stąd, w sensie średniokwadratowym | Stąd, w sensie średniokwadratowym | ||
+ | |||
<equation id="eqn:10.54-equation"> | <equation id="eqn:10.54-equation"> | ||
Linia 222: | Linia 260: | ||
+ | Wstawimy teraz wyrażenie na <math>dX </math> z równania Ito | ||
+ | <xr id="eqn:10.51-equation"> (%i</xr>) | ||
+ | |||
+ | |||
+ | <math>dg(X, t) = g'(X, t)\left[F(X, t) dt + G(X, t) dW\right] + \dot g(X, t) dt </math>: | ||
+ | |||
+ | |||
+ | <math> | ||
+ | + \frac{1}{2} g''(X, t) \left[F(X, t) dt + G(X, t) dW\right] \left[F(X, t) dt + G(X, t) dW\right] | ||
+ | </math> | ||
+ | |||
+ | <math> | ||
+ | + \dot g \,'(X, t) dt \left[F(X, t) dt + G(X, t) dW\right] + | ||
+ | \frac{1}{2} \ddot g(X, t) dt dt + \dots </math> | ||
+ | |||
+ | |||
+ | W wyrażeniu tym pozostawimy wyrazy rzędu co najwyżej dt pamietając że <math>dW(t)</math> jest rzędu <math>\sqrt{t}</math>: | ||
+ | |||
+ | |||
+ | <math>dg(X, t) = g'(X, t)\left[F(X, t) dt + G(X, t) dW\right] + \dot g(X, t) dt </math>: | ||
+ | |||
+ | |||
+ | <math> | ||
+ | + \frac{1}{2} g''(X, t) G^2(X, t) dW dW | ||
+ | </math> | ||
+ | |||
+ | |||
+ | Z <xr id="eqn:10.53-equation"> Równania (%i</xr>) zastąpimy <math>dW^2(t)</math> przez <math>2D dt</math> otrzymując '''formułę Ito''' | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.55-equation"> </equation> | ||
+ | <math>dg(X, t) = [\dot g(X, t) + g'(X, t) F(X, t) + D g''(X, t) G^2(X, t)] dt + g'(X, t) G(X, t) | ||
+ | dW </math>: | ||
+ | |||
+ | |||
+ | Zobaczmy, jakie nietypowe wnioski można wyciągnąć z tej formuły. W tym celu rozważmy szczególny przypadek i przyjmijmy następujące wyrażenia: | ||
+ | |||
+ | |||
+ | <math>dX = dW, \; \; \;\mbox{tzn.}\; \; \; F(X, t)=0, \; \; \; \; G(X, t) =1, \; \; \; D=\frac{1}{2} </math> | ||
+ | |||
+ | |||
+ | Niech | ||
+ | |||
+ | |||
+ | <math> g(X, t) = X^2, \; \; \; X(0)=0, \; \; \; D=\frac{1}{2} </math> | ||
+ | |||
+ | |||
+ | Wówczas z formuły Ito otrzymamy: | ||
+ | |||
+ | |||
+ | <math>d(X^2) = 2X dX + dt\, </math> | ||
+ | |||
+ | |||
+ | Stąd wynika, że | ||
+ | |||
+ | |||
+ | <math>X dX = \frac{1}{2} d(X^2) - \frac{1}{2} dt\, </math> | ||
+ | |||
+ | |||
+ | Ponieważ w tym przykładzie <math>dX=dW</math>, czyli <math>X=W</math>, to możemy równie dobrze napisać | ||
+ | |||
+ | |||
+ | <math>W dW = \frac{1}{2} d(W^2) - \frac{1}{2} dt\, </math> | ||
+ | |||
+ | |||
+ | Obustronnie całkowanie daje taki oto wynik | ||
+ | |||
+ | |||
+ | <math>\int_0^t W dW = \frac{1}{2} \int_0^t d(W^2) - \frac{1}{2} \int_0^t dt = \frac{1}{2} W^2 - \frac{1}{2} t </math> | ||
+ | |||
+ | |||
+ | Widać, że w porównaniu z tradycyjnym rachunkiem różniczkowym i całkowym, tutaj pojawia sie dodatkowy składnik <math>(1/2) t</math>. Przykład ten pokazuje, że metody rachunkowe, których nauczyliśmy się na kursie analizy matematycznej, w teorii procesów stochastycznych nie muszą obowiązywać. Różniczkowanie i całkowanie wielkości, w których bezpośrednio lub pośrednio pojawiają się procesy Wienera, Poissona, czy ogólniej Levy'ego należy wykonywać biorąc pod uwagę równania stochastyczne typu Ito. Tutaj reguły są nierozerwalnie związane z równaniami stochastycznymi definiującymi proces stochastyczny. Czytelnik powinien zauważyć, że wszelkie odstępstwa od tradycyjnego rachunku różniczkowego i całkowego pojawiaja się dlatego, że podstawowe procesy takie jak procesy Wienera, Poissona, czy ogólniej Levy'ego są to procesy o przyrostach niezależnych. | ||
+ | To z kolei pociąga za sobą własność narastania w czasie fluktuacji tych procesów. Fluktuacje te rosną jak <math>\sqrt t</math>. | ||
+ | Oto przyczyna wszelkich odstępstw. A pomyśleć, że wszystko to wzięło swój początek z rzucania monetą i rozmów telefonicznych. Abstrahując totalnie, zauważmy jaką dziś rolę odgrywają monety (czytaj pieniądze) i rozmowy telefoniczne (czytaj telefonia komórkowa z wbudowanym komputerem i internetem, która napędza rozwój ekonomiczny świata). | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===Równanie Stratonowicza vs równanie Ito=== | ||
+ | |||
+ | |||
+ | Rozważmy równanie stochastyczne w sensie Ito: | ||
+ | |||
+ | <equation id="eqn:10.51a-equation"> | ||
+ | <math>dX(t)= F(X(t), t)dt + G(X(t), t) dW(t)\;</math> | ||
+ | </equation> | ||
+ | |||
+ | oraz równanie stochastyczne w sensie Stratonowicza | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.51b-equation"> | ||
+ | <math>dX(t)= F(X(t), t)dt + G(X(t), t)\circ dW(t)\;</math> | ||
+ | </equation> | ||
+ | |||
+ | |||
+ | Pytamy, jaki jest związek między tymi równaniami. Rozpatrzmy ostatni wyraz w równaniu Stratonowicza | ||
+ | |||
+ | |||
+ | <math>G(X(t), t)\circ dW(t) = G\left(\frac{1}{2}[X(t+dt)+X(t)], t \right)\,dW(t) </math> | ||
+ | |||
+ | <math>= | ||
+ | G\left( X(t) + \frac{1}{2}[X(t+dt)- X(t)], t\right) dW(t) | ||
+ | = G\left(X(t) + \frac{1}{2} dX(t), t\right) dW(t) | ||
+ | </math> | ||
+ | |||
+ | |||
+ | <math>= | ||
+ | \left[G( X(t), t) + \frac{1}{2} G'(X(t), t) dX(t) + \dots\right] dW(t) | ||
+ | </math> | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = G(X(t), t) dW(t) + \frac{1}{2} G'(X(t), t) dX(t)) dW(t) + \dots | ||
+ | </math> | ||
+ | |||
+ | <math> | ||
+ | = G(X(t), t) dW(t) + \frac{1}{2} G'(X(t), t)\left[F(X(t), t)dt + G(X(t), t) dW(t)\right] dW(t) +\dots | ||
+ | </math> | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = G(X(t), t) dW(t) + \frac{1}{2} G'(X(t), t) G(X(t), t) dW(t) dW(t) +\dots | ||
+ | </math> | ||
+ | |||
+ | |||
+ | |||
+ | <math> | ||
+ | = G(X(t), t) dW(t) + \frac{1}{2} G'(X(t), t) G(X(t), t) 2D dt +\dots | ||
+ | </math> | ||
+ | |||
+ | |||
+ | gdzie rozwijaliśmy w szereg Taylora funkcję <math>G(x+h, t)</math>, zatrzymaliśmy wyrazy co najwyżej rzędu <math>dt</math> oraz skorzystaliśmy z tego, że w sensie średniokwadratowym <math>dW(t) dW(t) = 2D dt</math>. Jeżeli teraz wstawimy to wyrażenie do <xr id="eqn:10.51b-equation">Równania (%i</xr>) | ||
+ | to otrzymamy równanie w sensie Ito w postaci | ||
+ | |||
+ | |||
+ | |||
+ | <equation id="eqn:10.51cb-equation"> | ||
+ | <math>dX(t)= \left[F(X(t), t) + D G'(X(t), t) G(X(t), t)\right]dt + G(X(t), t) dW(t)\;</math> | ||
+ | </equation> | ||
+ | |||
+ | |||
+ | Równanie to ustala związek między równaniem Stratonowicza <xr id="eqn:10.51b-equation">(%i</xr>) a równaniem w sensie Ito. Przy transformacji równania Stratonowicza do równania Ito pojawia się wyraz | ||
+ | |||
+ | |||
+ | <math>\frac{1}{2} G'(X(t), t) G(X(t), t) \langle [dW(t)]^2\rangle </math> | ||
+ | |||
+ | |||
+ | |||
+ | w dryfie (w części deterministycznej równania stochastycznego). Zauwazmy, że w przypadku gdy funkcja <math>G(X(t), t)=G(t)</math> nie zależy od procesu <math>X(t)</math> to pochodna <math>G'(X(t), t) =0</math> i oba równania stają się równoważne. | ||
Linia 228: | Linia 415: | ||
===Równania Ito i procesy dyfuzji=== | ===Równania Ito i procesy dyfuzji=== | ||
+ | |||
+ | |||
+ | W części dotyczącej procesów Markowa pokazaliśmy, że gęstość warunkowa dla procesu Markowa <math>\xi(t)\,</math> spełnia rownanie Kramersa-Moyala: | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.61-equation"> | ||
+ | <math> \frac{\partial p(x, t|y, s)}{\partial t} = \sum_{k=1}^{\infty} \frac{(-1)^k}{k!} \; | ||
+ | \frac{\partial^k}{\partial x^k} \; {\mathbb B}_k(x, t) p(x, t|y, s) | ||
+ | </math> | ||
+ | </equation> | ||
+ | |||
+ | gdzie funkcje | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.62-equation"> | ||
+ | <math> {\mathbb B}_k(x, t) = \lim_{h \to 0} \frac{1}{h} {\mathbb M}_k(x, t; h) = \lim_{h \to 0} | ||
+ | \frac{1}{h} \; \langle [\xi(t+h)-\xi(t)]^k|\xi(t) = x \rangle | ||
+ | </math> | ||
+ | </equation> | ||
+ | |||
+ | są warunkowymi wartościami średnimi na jednostkę czasu k-tej potęgi przyrostu procesu stochastycznego. | ||
+ | |||
+ | |||
+ | |||
+ | Niech proces stochastyczny <math>\xi(t) = X(t)</math> będzie określony przez równanie Ito: | ||
+ | |||
+ | <equation id="eqn:10.63-equation"> | ||
+ | <math>dX(t)= F(X(t), t)dt + G(X(t), t) dW(t)\;</math> | ||
+ | </equation> | ||
+ | |||
+ | Napiszemy to równanie w postaci przyrostów | ||
+ | |||
+ | <equation id="eqn:10.64-equation"> | ||
+ | <math>\Delta X(t) = X(t+\Delta t) - X(t) = F(X(t), t)\Delta t + G(X(t), t) \Delta W(t)\;</math> | ||
+ | </equation> | ||
+ | |||
+ | gdzie | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.65-equation"> | ||
+ | <math>\Delta W(t) = W(t+\Delta t) - W(t)\,</math> | ||
+ | </equation> | ||
+ | |||
+ | Wiemy, że | ||
+ | |||
+ | <equation id="eqn:10.66-equation"> | ||
+ | <math>\langle \Delta W(t) \rangle = 0, \; \; \; \; \; \langle [\Delta W(t)]^2 \rangle = 2D \Delta t</math> | ||
+ | </equation> | ||
+ | |||
+ | Stąd, w sensie średniokwadratowym | ||
+ | |||
+ | <equation id="eqn:10.67-equation"> | ||
+ | <math> \Delta W(t) = \sqrt{2D \Delta t}</math> | ||
+ | </equation> | ||
+ | |||
+ | |||
+ | <xr id="eqn:10.62-equation">Równanie (%i</xr>) | ||
+ | przepiszemy w nowych oznaczeniach w postaci | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.68-equation"> | ||
+ | <math> {\mathbb B}_k(x, t) = \lim_{\Delta t \to 0} \frac{1}{\Delta t} {\mathbb M}_k(x, t; \Delta t) = \lim_{\Delta t \to 0} | ||
+ | \frac{1}{\Delta t} \; \langle [\Delta X(t)]^k|X(t) = x \rangle | ||
+ | </math> | ||
+ | </equation> | ||
+ | |||
+ | |||
+ | Obliczymy obecnie wszystkie powyższe funkcje pamiętając, że warunek <math>X(t)=x</math> oznacza, że proces stochastyczny <math>X(t)</math> przyjmuje określoną, deterministyczną wartość, liczbę <math>x</math>. Ponadto musimy pamiętać, że z równania Ito wynika, że proces <math>X(t)</math> w chwili <math>t= s > 0</math> zależy funkcjonalnie od procesu Wienera <math>W(u)</math> dla wszystkich wartości <math>u \in [0, s)</math>. Innymi słowy, <math>X(s)</math> zależy od przyrostów | ||
+ | |||
+ | |||
+ | <math>W(s) - W(s-\epsilon), \; \; \; W(s-\epsilon) - W(s-2 \epsilon), \; \; \; W(s-2 \epsilon) - W(s-3 \epsilon), \dots</math>. | ||
+ | |||
+ | |||
+ | Na przykład oznacza to, że | ||
+ | |||
+ | |||
+ | <math> | ||
+ | \langle A(X(t))|X(t) = x \rangle = \langle A(x)|X(t) = x \rangle = A(x) \langle 1|X(t) = x \rangle | ||
+ | = A(x) | ||
+ | </math> | ||
+ | |||
+ | |||
+ | ponieważ wartość średnia (warunkowa i bezwarunkowa) z liczby 1 jest 1. | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | '''Warunkowy moment statystyczny pierwszego rzędu''' ma postać: | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.69-equation"> | ||
+ | <math> {\mathbb B}_1(x, t) = \lim_{\Delta t \to 0} \frac{1}{\Delta t} {\mathbb M}_1(x, t;\Delta t) = \lim_{\Delta t \to 0} | ||
+ | \frac{1}{\Delta t} \; \langle \Delta X(t)|X(t) = x \rangle | ||
+ | </math> </equation> | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle F(X(t), t) \Delta t + G(X(t), t) \Delta W(t)|X(t) = x \rangle | ||
+ | </math> | ||
+ | |||
+ | |||
+ | |||
+ | Wartość średnia z sumy równa się sumie wartości średnich. Więc powyższe wyrażenie składa się z dwóch średnich: | ||
+ | |||
+ | Pierwszy składnik: | ||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle F(X(t), t) \Delta t|X(t) = x \rangle = | ||
+ | F(x, t) | ||
+ | </math> | ||
+ | |||
+ | |||
+ | Drugi składnik: | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle G(X(t), t) \Delta W(t)|X(t) = x \rangle = | ||
+ | \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle G(x, t) \Delta W(t)|X(t) = x \rangle | ||
+ | </math> | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = | ||
+ | \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G(x, t) \langle \Delta W(t)|X(t) = x \rangle = | ||
+ | \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G(x, t) \langle \Delta W(t)\rangle = 0 | ||
+ | </math> | ||
+ | |||
+ | Wyrażenie to zeruje się, ponieważ dla dowolnie małego <math>\Delta t</math> wartość średnia <math>\langle \Delta W(t)\rangle = 0 </math>. Więc otrzymujemy ciąg <math>0/\Delta t =0</math>. A granicą takiego ciągu jest <math>0</math>. | ||
+ | |||
+ | Ostatecznie otrzymamy pierwszą funkcję w rozwinięciu Kramersa-Moyala: | ||
+ | |||
+ | |||
+ | |||
+ | <equation id="eqn:10.70-equation"> | ||
+ | <math> {\mathbb B}_1(x, t) = F(x, t) | ||
+ | </math> </equation> | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | '''Warunkowy moment statystyczny drugiego rzędu''' ma postać: | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.71-equation"> | ||
+ | <math> {\mathbb B}_2(x, t) = \lim_{\Delta t \to 0} \frac{1}{\Delta t} {\mathbb M}_2(x, t;\Delta t) = \lim_{\Delta t \to 0} | ||
+ | \frac{1}{\Delta t} \; \langle [\Delta X(t)]^2|X(t) = x \rangle | ||
+ | </math> </equation> | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle \left[F(X(t), t) \Delta t + G(X(t), t) \Delta W(t)\right]^2|X(t) = x \rangle = | ||
+ | </math> | ||
+ | |||
+ | |||
+ | Jeżeli podniesiemy do kwadratu wyrażenie w nawiasie, pojawiają sie trzy składniki: | ||
+ | |||
+ | |||
+ | Pierwszy składnik: | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle F^2(X(t), t) (\Delta t)^2 |X(t) = x \rangle = \lim_{\Delta t \to 0} \Delta t \, F^2(x, t) \; \langle 1 |X(t) = x \rangle = 0 | ||
+ | </math> | ||
+ | |||
+ | |||
+ | Składnik ten jest zero ponieważ <math>\lim_{\Delta t \to 0} \Delta t =0</math>. | ||
+ | |||
+ | Drugi składnik: | ||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle 2 F(X(t), t) G(X(t), t) \Delta t \Delta W(t) |X(t) = x \rangle | ||
+ | </math> | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \; 2 F(x, t) G(x, t) \langle \Delta W(t)|X(t) = x \rangle = 0 | ||
+ | </math> | ||
+ | |||
+ | |||
+ | Składnik ten jest zero ponieważ <math>\langle \Delta W(t)|X(t) = x \rangle = \langle \Delta W(t) \rangle = 0</math>. | ||
+ | |||
+ | |||
+ | Trzeci składnik: | ||
+ | |||
+ | |||
+ | <math> | ||
+ | \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle G^2(X(t), t) [\Delta W(t)]^2|X(t) = x \rangle = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G^2(x, t)\langle [\Delta W(t)]^2|X(t) = x \rangle | ||
+ | </math> | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G^2(x, t) \langle [\Delta W(t)]^2 \rangle | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G^2(x, t) \,2D \Delta t = 2D G^2(x, t) | ||
+ | </math> | ||
+ | |||
+ | |||
+ | Ostatecznie druga funkcja w rozwinięciu Kramersa-Moyala ma postać: | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.72-equation"> | ||
+ | <math> {\mathbb B}_2(x, t) = 2D G^2(x, t) | ||
+ | </math> </equation> | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | '''Warunkowy moment statystyczny trzeciego rzędu''' ma postać: | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.73-equation"> | ||
+ | <math> {\mathbb B}_3(x, t) = \lim_{\Delta t \to 0} \frac{1}{\Delta t} {\mathbb M}_3(x, t;\Delta t) = \lim_{\Delta t \to 0} | ||
+ | \frac{1}{\Delta t} \; \langle [\Delta X(t)]^3|X(t) = x \rangle | ||
+ | </math> </equation> | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle \left[F(X(t), t) \Delta t + G(X(t), t) \Delta W(t)\right]^3|X(t) = x \rangle = | ||
+ | </math> | ||
+ | |||
+ | |||
+ | Jeżeli podniesiemy do sześcianu wyrażenie w nawiasie, pojawiają sie cztery składniki: | ||
+ | |||
+ | |||
+ | Pierwszy składnik: | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle F^3(X(t), t) (\Delta t)^3 |X(t) = x \rangle = \lim_{\Delta t \to 0} (\Delta t)^2 \, F^3(x, t) \; \langle 1 |X(t) = x \rangle = 0 | ||
+ | </math> | ||
+ | |||
+ | |||
+ | Składnik ten jest zero ponieważ <math>\lim_{\Delta t \to 0} (\Delta t)^2 =0</math>. | ||
+ | |||
+ | Drugi składnik: | ||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle 3 F^2(X(t), t) G(X(t), t) (\Delta t)^2 \Delta W(t) |X(t) = x \rangle = 0 | ||
+ | </math> | ||
+ | |||
+ | |||
+ | <math> | ||
+ | = \lim_{\Delta t \to 0} \; 3 \Delta t F^2(x, t) G(x, t) \langle \Delta W(t)|X(t) = x \rangle = 0 | ||
+ | </math> | ||
+ | |||
+ | |||
+ | Trzeci składnik: | ||
+ | |||
+ | |||
+ | <math> | ||
+ | \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; 3 \Delta t F(x, t) G^2(x, t)\langle [\Delta W(t)]^2|X(t) = x \rangle = \lim_{\Delta t \to 0} 3F(x, t) G^2(x, t) 2D \Delta t = 0 | ||
+ | </math> | ||
+ | |||
+ | |||
+ | |||
+ | Czwarty składnik: | ||
+ | |||
+ | |||
+ | <math> | ||
+ | \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G^2(x, t)\langle [\Delta W(t)]^3|X(t) = x \rangle = 0 | ||
+ | </math> | ||
+ | |||
+ | |||
+ | ponieważ | ||
+ | |||
+ | <math> | ||
+ | \langle [\Delta W(t)]^3 \rangle = 0 | ||
+ | </math> | ||
+ | |||
+ | |||
+ | Pamiętajmy, że proces Wienera jest procesem o rozkładzie normalnym (Gaussa) i o wartości średniej 0. | ||
+ | Stąd wynika, że wszystkie momenty statystyczne nieparzystego rzędu zerują się. | ||
+ | |||
+ | |||
+ | Ostatecznie trzecia funkcja w rozwinięciu Kramersa-Moyala zeruje się, | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.74-equation"> | ||
+ | <math> {\mathbb B}_3(x, t) = 0 | ||
+ | </math> </equation> | ||
+ | |||
+ | Stosując powyższą metodę, można pokazać bezpośrednim rachunkiem, że | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.75-equation"> | ||
+ | <math> {\mathbb B}_4(x, t) = 0 | ||
+ | </math> </equation> | ||
+ | |||
+ | |||
+ | Korzystając z twierdzenia Pawuli, wnioskujemy, że | ||
+ | |||
+ | <equation id="eqn:10.76-equation"> | ||
+ | <math> {\mathbb B}_k(x, t) = 0 \; \; \; \mbox{dla} \; \; \; k \ge 3 | ||
+ | </math> </equation> | ||
+ | |||
+ | |||
+ | W konsekwencji, równanie Kramersa-Moyala redukuje się do równania Fokkera-Plancka. | ||
+ | Możemy powyższe wyniki podsumować. | ||
+ | |||
+ | |||
+ | |||
+ | '''Podsumowanie''' | ||
+ | |||
+ | |||
+ | Jeżeli proces stochastyczny <math> X(t)</math> jest określony przez równanie Ito: | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.77-equation"> | ||
+ | <math>dX(t)= F(X(t), t)dt + G(X(t), t) dW(t)\;</math> | ||
+ | </equation> | ||
+ | |||
+ | |||
+ | gdzie proces Wienera <math>W(t)</math> ma własności | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.78-equation"> | ||
+ | <math>\langle d W(t) \rangle = 0, \; \; \; \; \; \langle [dW(t)]^2 \rangle = 2D dt</math> | ||
+ | </equation> | ||
+ | |||
+ | |||
+ | to <math>X(t)</math> jest procesem Markowa i procesem dyfuzji. Warunkowa gęstość rozkładu prawdopodobieństwa <math>p(x, t|y, s)</math> spełnia równanie Fokkera-Plancka (proste równanie Kołmogorowa) | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.79-equation"> | ||
+ | <math> \frac{\partial p(x, t|y, s)}{\partial t} = -\frac{\partial}{\partial x} \; F(x, t) p(x, t|y, s) + | ||
+ | D \frac{\partial^2}{\partial x^2} \; G^2(x, t) p(x, t|y, s) | ||
+ | </math> | ||
+ | </equation> | ||
+ | |||
+ | |||
+ | Dryf <math>F(x, t)</math> w tym równaniu jest ta samą funkcją <math>F(x, t)</math>, która określa | ||
+ | część deterministyczną w równaniu Ito. Funkcja dyfuzji | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.80-equation"> | ||
+ | <math>D(x, t) = 2D \, G^2(x, t)\,</math> | ||
+ | </equation> | ||
+ | |||
+ | |||
+ | jest związana z losową częścią w równaniu Ito. | ||
+ | |||
+ | |||
+ | |||
+ | '''Przypadek wielowymiarowy''' | ||
+ | |||
+ | |||
+ | Niech dany jest układ wielu procesów stochastycznych (wektor procesów stochastycznych) | ||
+ | |||
+ | :<math>\vec{X}(t)= \{X_1(t), X_2(t), \dots, X_n(t)\}</math> | ||
+ | |||
+ | |||
+ | określony przez układ równań stochastycznych Ito w postaci | ||
+ | |||
+ | |||
+ | |||
+ | <equation id="eqn:10.Ito-equation"> | ||
+ | <math>dX_i(t)= F_i({\vec X}(t), t)dt + \sum_{j=1}^n G_{ij}({\vec X}(t), t) dW_j(t), \; \;\; \; i=1, 2, \dots, n </math> | ||
+ | </equation> | ||
+ | |||
+ | |||
+ | gdzie funkcje <math>F_i({\vec X}, t)</math> oraz <math>G_{ij}({\vec X}, t)</math> są funkcjami deterministycznymi (nielosowymi) oraz | ||
+ | |||
+ | :<math>\vec{W}(t)= \{W_1(t), W_2(t), \dots, W_n(t)\}</math> | ||
+ | |||
+ | |||
+ | są niezależnymi procesami Wienera o statystyce | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.81-equation"> | ||
+ | <math>\langle dW_i(t) \rangle = 0, \; \; \; \; \; \langle dW_i(t) dW_j(t) \rangle = 2D_i \delta_{ij} dt</math> | ||
+ | </equation> | ||
+ | |||
+ | gdzie <math>\delta_{ij}</math> jest deltą Kroneckera (patrz Dodatek matematyczny). | ||
+ | |||
+ | Wówczas wektor <math>\vec X(t)</math> jest procesem Markowa i procesem dyfuzji. Warunkowa gęstość rozkładu prawdopodobieństwa <math>p(\vec x, t|\vec y, s)</math> spełnia równanie Fokkera-Plancka (proste równanie Kołmogorowa) | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.82-equation"> | ||
+ | </equation> | ||
+ | :<math> \frac{\partial p(\vec{x}, t|\vec{y}, s)}{\partial t} = -\sum_{i=1}^n \frac{\partial}{\partial x_i} \; F_i(\vec{x}, t) p(\vec{x}, t|\vec{y}, s) + | ||
+ | \sum_{i,j=1}^n | ||
+ | \frac{\partial^2}{\partial x_i \partial x_j} \; D_{ij}(\vec{x}, t) | ||
+ | p(\vec{x}, t|\vec{y}, s) | ||
+ | </math> | ||
+ | |||
+ | |||
+ | gdzie | ||
+ | |||
+ | |||
+ | :<math>p(\vec{x}, t|\vec{y}, s) = p(x_1, x_2, \dots, x_n, t|y_1, y_2, \dots, y_n, s)</math> | ||
+ | |||
+ | |||
+ | jest n-wymiarową warunkową gęstością prawdopodobieństwa oraz | ||
+ | |||
+ | |||
+ | :<math>\vec{x} = [x_1, x_2, \dots, x_n], \; \; \; \; \vec{y} = [y_1, y_2, \dots, y_n]</math> | ||
+ | |||
+ | |||
+ | Składowe dryfu <math>F_i(\vec x, t)</math> sa deterministyczną częścią równania Ito. Bardziej skomplikowany jest związek macierzy dyfuzji <math>D_{ij}(\vec x, t)</math> z funkcjami <math>G_{ij}(\vec x, t)</math>: | ||
+ | |||
+ | |||
+ | <equation id="eqn:10.83-equation"> | ||
+ | <math>D_{ij}(\vec x, t) = \sum_k D_k \,G_{ik}(\vec x, t) G_{jk}(\vec x, t)</math> | ||
+ | </equation> | ||
+ | |||
+ | |||
+ | Jak widać, istnieje ścisły związek równań Ito z równaniami Fokkera-Plancka: każdmu równaniu Ito odpowiada proces dyfuzji opisywany przez proste równanie Kołmogorowa-Fokkera-Plancka. Współczesną fizykę statystyczną procesów w stanach równowagi termodynamicznej i procesów w stanach dalekich od równowagi termodynamicznej można sformułować w języku równań stochastycznych Ito. Szereg procesów dynamicznych w ekonomii, socjologii, dynamice populacyjnej, w których istnieją zaburzenia losowe można modelować za pomocą równań stochastycznych typu rownan Ito. Dlatego jest to tak potężne narzędzie analizy realnych zjawisk w przyrodzie. | ||
+ | |||
+ | ===Dylemat Stratonowicza-Ito=== | ||
+ | |||
+ | |||
+ | Jeżeli modelujemy procesy przy pomocy równań stochastycznych typu równań Ito, to pojawia się naturalne pytanie: | ||
+ | |||
+ | W jakim sensie należy interpretować równania stochastyczne? | ||
+ | |||
+ | W sensie Ito czy w sensie Stratonowicza? A może jeszcze w innym sensie? Powróćmy do | ||
+ | <xr id="eqn:10.1-equation">Równania (%i</xr>) | ||
+ | |||
+ | |||
+ | <equation id="eqn:101.1-equation"> | ||
+ | <math>\frac{dX(t)}{dt} = F(X(t), t) + G(X(t), t)\Gamma(t)</math> | ||
+ | </equation> | ||
+ | |||
+ | gdzie <math>\Gamma(t)</math> jest białym szumem gaussowskim, to znaczy delta-skorelowanym. Pamiętajmy, że delta-skorelowanie oznacza, że dla różnych chwil czasu, szum nie jest skorelowany, to znaczy jest maksymalnie losowy. Nawet dla nieskończenie bliskich chwil czasu nie ma korelacji. To jest idealizacja. W rzeczywistym świecie, szumy sa skorelowane. Może być taka sytuacja, że czas korelacji szumu jest bardzo mały, ale niezerowy. Jeżeli w układzie mamy kilka czasów charakterystycznych (znalezienie takich czasów charakterystycznych bywa czasami niełatwym zadaniem) i czas korelacji szumu jest najkrótszym ze wszystkich czasów charakterystycznych, to przybliżenie szumu przez biały szum jest dobrym przybliżeniem. Okazuje się (można to udowodnić), że jeżeli rzeczywiste zaburzenie losowe (szum, fluktuacje) jest skorelowane i dokonujemy idealizacji przez biały szum, to równania stochastyczne należy interpretować w sensie Stratonowicza. Z drugiej strony, jeżeli równanie stochastyczne jest ciągłą wersją równania z czasem dyskretnym i w wersji dyskretnej szum jest reprezentowany przez ciąg zmienny losowych nieskorelowanych, to równanie należy interpretowac w sensie Ito. Czytelnik powinien bardzo uważnie rozstrzygać dylemat Stratonowicza-Ito. Metoda modelowania jest zawsze metodą przybliżoną, ułomną, obarczoną wieloma brakami. Dlatego każdy konkretny przypadek musi być oddzielnie analizowany. |
Aktualna wersja na dzień 07:14, 13 maj 2015
Spis treści |
STOCHASTYCZNE RÓWNANIA RÓŻNICZKOWE
Pamiętamy, że proces Wienera otrzymaliśmy jako graniczny proces błądzenia przypadkowego cząstki poruszającej się ruchem jednowymiarowym. Uogólnienie na przypadek dwóch lub trzech wymiarów nie stanowi problemu. Proces Wienera \(W(t)\) opisuje w tym przypadku położenie cząstki. Pochodna procesu Wienera jest białym szumem gaussowskim \(\Gamma(t)\). Jeżeli oznaczymy położenie cząstki przez \(X(t)\), to możemy napisać następującą relację
\[\frac{dX(t)}{dt} =\Gamma(t)\]
gdzie lewa strona jest prędkością cząstki Browna. Możemy spojrzeć na tę relację jak na stochastyczne równanie różniczkowe z losowym wyrazem \(\Gamma(t)\), który jest białym szumem gaussowskim. Biały szum gaussowski można zastąpić innymi procesami losowymi. Możemy tego typu równanie uogólniać do różnych postaci. Dla przykładu
gdzie funkcje \(F(x, t)\) oraz \(G(x, t)\) są funkcjami deterministycznymi (nielosowymi).
Okazuje się, że interpretacja takich równań stochastycznych z białymi szumami (poissonowskim, gaussowskim lub najogólniej Levy'ego) nie jest jednoznaczna w odróżnieniu od równań różniczkowych deterministycznych, to znaczy takich, które nie zawierają żadnych wielkości losowych. Gdzie tkwi przyczyna niejednoznaczności? Moźna odpowiedzieć, że źródłem tych niejednoznaczności jest własność procesu Wienera, Poissona lub w ogólności Levy'ego. Pamiętamy, że są to procesy o niezależnych przyrostach na nieprzekrywających się przedziałach. To jest istota zagadnienia.
Fizycy nazywają Równanie (1) równaniem Langevina. Matematycy nie lubią takiej postaci tego równania. Dlaczego? Ponieważ, jak pamiętamy, biały szum gaussowski nie jest "poprawnie" zdefiniowany. Nawet w sensie średnikwadratowym! Matematycy preferują inną postać równania (1) którą można otrzymać w następujący sposób: ponieważ
więc pomnożymy obustronnie równanie (1) przez \(dt\) i otrzymamy
Ta postać równania nazywa się równaniem Ito. W tym równaniu wszystkie wielkości są poprawnie zdefiniowane. Wielkość \(dW(t)\) jest różniczką czyli przyrostem procesu Wienera:
Wiemy, że
Stąd, w sensie średniokwadratowym
Przy takim spojrzeniu, w równaniu (3), pierwszy wyraz po prawej stronie jest rzędu \(dt\), natomiast drugi wyraz jest rzędu \(\sqrt{dt}\).
Możemy powyższe równanie Ito uogolnić na wielowymiarowy przypadek dla wektora procesów stochastycznych
\[\vec{X}(t)= \{X_1(t), X_2(t), \dots, X_n(t)\}\]
Otrzymujemy układ równań Ito w postaci
gdzie funkcje \(F_i({\vec X}, t)\) oraz \(G_{ij}({\vec X}, t)\) są funkcjami deterministycznymi (nielosowymi) oraz
\[\vec{W}(t)= \{W_1(t), W_2(t), \dots, W_n(t)\}\]
są niezależnymi procesami Wienera o statystyce
gdzie \(\delta_{ij}\) jest deltą Kroneckera (patrz Dodatek matematyczny).
Całki stochastyczne Ito i Stratonowicza
Równanie (3) ciągle jest "niedodefiniowane". Co to znaczy? Aby wyjaśnić to, przedstawimy je w jeszcze innej postaci. Scałkujmy obustronnie to równanie ze względu na czas w granicach od \(t_0\) do \(t\):
Otrzymujemy równanie całkowe na proces stochastyczny \(X(t)\). W równaniu tym pojawiają sie dwa typy całek: "tradycyjna" całka Riemanna-Stieltjesa
oraz całka, w której występuje proces Wienera
Powinniśmy zawsze pamiętać o tym, że całka jest graniczną wartością odpowiedniej sumy. I tak pierwsza całka
gdzie granicę należy rozumieć w sensie średniokwadratowym oraz \({\tilde s}_i \in [s_i, s_{i+1}]\) jest dowolną wartością z danego przedziału \([s_i, s_{i+1}]\). W kursie analizy matematycznej wykazuje się, że graniczna wartość sumy (czyli wartość całki) nie zależy od tego gdzie leżą punkty \({\tilde s}_i\) w przedziale \([s_i, s_{i+1}]\). Mogą one leżeć w lewym końcu przedziału, w prawym końcu przedziału, w środku lub każdym innym punkcie tego przedziału. Okazuje się, że tej własności nie ma drugi typ całki!! W takim razie w jakim punkcie przedziału należy wybrać wartość \({\tilde s}_i\) w całce, w której pojawia sie proces Wienera? Najlepiej jest wybrać z lewej strony przedziału z czysto praktycznej przyczyny (ułatwia to rachunki). Aby wyjaśnic dlaczego, rozpatrzmy nieco inną całkę z procesem Wienera, a mianowicie
Tak określona całka nazywa się całką Ito i ma "przyjazne" własności z tego powodu, że wartości średnie typu
\( \langle H(W(s_i), {\tilde s}_i) [W(s_{i+1}) -W(s_i)]^k\rangle = \langle H(W(s_i), {\tilde s}_i)\rangle \cdot \langle [W(s_{i+1}) -W(s_i)]^k\rangle\)
rozbijają się na iloczyny wartości średnich ponieważ proces Wienera jest procesem o niezależnych przyrostach na nieprzekrywających sie przedziałach (porównaj obliczenie funkcji korelacyjnej procesu Wienera), a wartość średnia iloczynu niezależnych zmiennych losowych jest równa iloczynowi wartości średnich tych zmiennych. Jest to główna przyczyna takiej definicji całek Ito. Należy podkreślić, że dla rzeczywistych procesów losowych taki wybór nie zawsze jest poprawny. O tym powiemy później.
Teraz możemy zdefiniować całkę (11):
Całki, w definicji których wartości procesu \(X(t)\) lub \(W(t)\) należy brać z lewej strony przedziałów \([s_i, s_{i+1}]\), nazywamy całkami Ito lub całkami w interpretacji Ito. Ponieważ jak na razie z czysto matematycznego punktu widzenia wybór punktu z lewej strony przedziału jest arbitralny, każdy inny punkt jest równo uprawniony. Ale należy bezwględnie pamiętać, że zmiana położenia punktu \({\tilde s}_i\) w przedziale \([s_i, s_{i+1}] \) dla \(X(\tilde s_i)\) czy dla \(W(\tilde s_i)\) oznacza zmianę wartości całki. To odróżnia całki stochastyczne od "tradycyjnych" całek Riemanna. W związku z tym pojawia się poważny problem, gdy chcemy stosować równania stochastyczne do modelowania realnych zjawisk i procesów. Czy istnieją jakieś racjonalne kryteria na wybór punktu pośredniego \(\tilde s_i\)? Dylemat ten przez pewien okres czasu był przedmiotem dyskusji i polemik. Do tego problemu powrócimy w dalszej części wykładów.
Istnieją także inne definicje całek stochastycznych. Druga, konkurencyjna definicja jest następująca:
\(I_{\circ}= \int_{t_0}^t G(X(s), s) \circ \,dW(s) = \lim_{n \to \infty} \sum_{i=0}^{n-1} G\left(\frac{X(s_{i+1}) + X(s_i)}{2}, {\tilde s}_i\right) [W(s_{i+1}) -W(s_i)]\)
gdzie oznaczenie \(\circ\) w całce ma informować o tym, że wartość funkcji \(G(X(t), t)\) na przedziale \([s_i, s_{i+1}] \) jest brana dla średniej arytmetycznej \([X(s_{i+1}) + X(s_i)]/2\). Tak określona całka nazywa się całką Stratonowicza lub całka w sensie Stratonowicza [3].
Czytelnik łatwo zauważy, że obie całki są szczególnymi przypadkami takiej oto całki:
\[ = \lim_{n \to \infty} \sum_{i=0}^{n-1} G\left(\lambda X(s_{i+1}) + (1-\lambda) X(s_i), {\tilde s}_i\right) [W(s_{i+1}) -W(s_i)]\]
gdzie \(\lambda \in [0, 1]\). Jeżeli \(\lambda =0\), otrzymujemy definicję Ito. Dla \(\lambda =1/2\) otrzymujemy definicję Stratonowicza.
Rachunek różniczkowy Ito
W Dodatku matematycznym przedstawiliśmy rozwinięcie funkcji jednej zmiennej \(f(x)\) i funkcji dwóch zmiennych \(F(x, y) \) w szereg Taylora. Rozpatrzmy teraz funkcję dwóch zmiennych \(g(x, t)\), która jest różniczkowalna dostateczną ilość razy. W szczególności zakładamy, że istnieją pochodne
\(g'(x, t)= g' =\partial g(x, t)/\partial x, \; \; \dot g(x, t) = \dot g = \partial g(x, t)/\partial t, \; \; g''(x, t) = g'' =\partial^2 g/\partial x^2, \; \;\)
Przyjmiemy taką konwencję, że różniczkowanie względem pierwszego argumentu oznaczymy apostrofem ' ; różniczkowanie względem drugiego argumentu oznaczymy kropką \(\cdot \).
Rozpatrzmy teraz funkcję \(g(X, t)\), gdzie teraz pierwszym argumentem jest proces stochastyczny \(X(t)\) okreslony przez równanie stochastyczne Ito:
gdzie \(dW(t)\) jest różniczką procesu Wienera:
Wiemy, że
Stąd, w sensie średniokwadratowym
Obliczmy różniczkę funkcji \(g(X, t)\):
\(dg(X, t) = \frac{\partial g}{\partial X} dX + \frac{\partial g}{\partial t} dt + \frac{1}{2} \frac{\partial^2 g}{\partial X^2} dX dX + \frac{\partial^2 g}{\partial X \partial dt} dX dt + \frac{1}{2} \frac{\partial^2 g}{\partial t^2} dt dt + \dots \)
Wstawimy teraz wyrażenie na \(dX \) z równania Ito (17)
\(dg(X, t) = g'(X, t)\left[F(X, t) dt + G(X, t) dW\right] + \dot g(X, t) dt \):
\( + \frac{1}{2} g''(X, t) \left[F(X, t) dt + G(X, t) dW\right] \left[F(X, t) dt + G(X, t) dW\right] \)
\( + \dot g \,'(X, t) dt \left[F(X, t) dt + G(X, t) dW\right] + \frac{1}{2} \ddot g(X, t) dt dt + \dots \)
W wyrażeniu tym pozostawimy wyrazy rzędu co najwyżej dt pamietając że \(dW(t)\) jest rzędu \(\sqrt{t}\):
\(dg(X, t) = g'(X, t)\left[F(X, t) dt + G(X, t) dW\right] + \dot g(X, t) dt \):
\( + \frac{1}{2} g''(X, t) G^2(X, t) dW dW \)
Z Równania (19) zastąpimy \(dW^2(t)\) przez \(2D dt\) otrzymując formułę Ito
\(dg(X, t) = [\dot g(X, t) + g'(X, t) F(X, t) + D g''(X, t) G^2(X, t)] dt + g'(X, t) G(X, t) dW \):
Zobaczmy, jakie nietypowe wnioski można wyciągnąć z tej formuły. W tym celu rozważmy szczególny przypadek i przyjmijmy następujące wyrażenia:
\(dX = dW, \; \; \;\mbox{tzn.}\; \; \; F(X, t)=0, \; \; \; \; G(X, t) =1, \; \; \; D=\frac{1}{2} \)
Niech
\( g(X, t) = X^2, \; \; \; X(0)=0, \; \; \; D=\frac{1}{2} \)
Wówczas z formuły Ito otrzymamy:
\(d(X^2) = 2X dX + dt\, \)
Stąd wynika, że
\(X dX = \frac{1}{2} d(X^2) - \frac{1}{2} dt\, \)
Ponieważ w tym przykładzie \(dX=dW\), czyli \(X=W\), to możemy równie dobrze napisać
\(W dW = \frac{1}{2} d(W^2) - \frac{1}{2} dt\, \)
Obustronnie całkowanie daje taki oto wynik
\(\int_0^t W dW = \frac{1}{2} \int_0^t d(W^2) - \frac{1}{2} \int_0^t dt = \frac{1}{2} W^2 - \frac{1}{2} t \)
Widać, że w porównaniu z tradycyjnym rachunkiem różniczkowym i całkowym, tutaj pojawia sie dodatkowy składnik \((1/2) t\). Przykład ten pokazuje, że metody rachunkowe, których nauczyliśmy się na kursie analizy matematycznej, w teorii procesów stochastycznych nie muszą obowiązywać. Różniczkowanie i całkowanie wielkości, w których bezpośrednio lub pośrednio pojawiają się procesy Wienera, Poissona, czy ogólniej Levy'ego należy wykonywać biorąc pod uwagę równania stochastyczne typu Ito. Tutaj reguły są nierozerwalnie związane z równaniami stochastycznymi definiującymi proces stochastyczny. Czytelnik powinien zauważyć, że wszelkie odstępstwa od tradycyjnego rachunku różniczkowego i całkowego pojawiaja się dlatego, że podstawowe procesy takie jak procesy Wienera, Poissona, czy ogólniej Levy'ego są to procesy o przyrostach niezależnych. To z kolei pociąga za sobą własność narastania w czasie fluktuacji tych procesów. Fluktuacje te rosną jak \(\sqrt t\). Oto przyczyna wszelkich odstępstw. A pomyśleć, że wszystko to wzięło swój początek z rzucania monetą i rozmów telefonicznych. Abstrahując totalnie, zauważmy jaką dziś rolę odgrywają monety (czytaj pieniądze) i rozmowy telefoniczne (czytaj telefonia komórkowa z wbudowanym komputerem i internetem, która napędza rozwój ekonomiczny świata).
Równanie Stratonowicza vs równanie Ito
Rozważmy równanie stochastyczne w sensie Ito:
oraz równanie stochastyczne w sensie Stratonowicza
Pytamy, jaki jest związek między tymi równaniami. Rozpatrzmy ostatni wyraz w równaniu Stratonowicza
\(G(X(t), t)\circ dW(t) = G\left(\frac{1}{2}[X(t+dt)+X(t)], t \right)\,dW(t) \)
\(= G\left( X(t) + \frac{1}{2}[X(t+dt)- X(t)], t\right) dW(t) = G\left(X(t) + \frac{1}{2} dX(t), t\right) dW(t) \)
\(= \left[G( X(t), t) + \frac{1}{2} G'(X(t), t) dX(t) + \dots\right] dW(t) \)
\( = G(X(t), t) dW(t) + \frac{1}{2} G'(X(t), t) dX(t)) dW(t) + \dots \)
\( = G(X(t), t) dW(t) + \frac{1}{2} G'(X(t), t)\left[F(X(t), t)dt + G(X(t), t) dW(t)\right] dW(t) +\dots \)
\( = G(X(t), t) dW(t) + \frac{1}{2} G'(X(t), t) G(X(t), t) dW(t) dW(t) +\dots \)
\( = G(X(t), t) dW(t) + \frac{1}{2} G'(X(t), t) G(X(t), t) 2D dt +\dots \)
gdzie rozwijaliśmy w szereg Taylora funkcję \(G(x+h, t)\), zatrzymaliśmy wyrazy co najwyżej rzędu \(dt\) oraz skorzystaliśmy z tego, że w sensie średniokwadratowym \(dW(t) dW(t) = 2D dt\). Jeżeli teraz wstawimy to wyrażenie do Równania (23) to otrzymamy równanie w sensie Ito w postaci
Równanie to ustala związek między równaniem Stratonowicza (23) a równaniem w sensie Ito. Przy transformacji równania Stratonowicza do równania Ito pojawia się wyraz
\(\frac{1}{2} G'(X(t), t) G(X(t), t) \langle [dW(t)]^2\rangle \)
w dryfie (w części deterministycznej równania stochastycznego). Zauwazmy, że w przypadku gdy funkcja \(G(X(t), t)=G(t)\) nie zależy od procesu \(X(t)\) to pochodna \(G'(X(t), t) =0\) i oba równania stają się równoważne.
Równania Ito i procesy dyfuzji
W części dotyczącej procesów Markowa pokazaliśmy, że gęstość warunkowa dla procesu Markowa \(\xi(t)\,\) spełnia rownanie Kramersa-Moyala:
gdzie funkcje
są warunkowymi wartościami średnimi na jednostkę czasu k-tej potęgi przyrostu procesu stochastycznego.
Niech proces stochastyczny \(\xi(t) = X(t)\) będzie określony przez równanie Ito:
Napiszemy to równanie w postaci przyrostów
gdzie
Wiemy, że
Stąd, w sensie średniokwadratowym
Równanie (26) przepiszemy w nowych oznaczeniach w postaci
Obliczymy obecnie wszystkie powyższe funkcje pamiętając, że warunek \(X(t)=x\) oznacza, że proces stochastyczny \(X(t)\) przyjmuje określoną, deterministyczną wartość, liczbę \(x\). Ponadto musimy pamiętać, że z równania Ito wynika, że proces \(X(t)\) w chwili \(t= s > 0\) zależy funkcjonalnie od procesu Wienera \(W(u)\) dla wszystkich wartości \(u \in [0, s)\). Innymi słowy, \(X(s)\) zależy od przyrostów
\(W(s) - W(s-\epsilon), \; \; \; W(s-\epsilon) - W(s-2 \epsilon), \; \; \; W(s-2 \epsilon) - W(s-3 \epsilon), \dots\).
Na przykład oznacza to, że
\( \langle A(X(t))|X(t) = x \rangle = \langle A(x)|X(t) = x \rangle = A(x) \langle 1|X(t) = x \rangle = A(x) \)
ponieważ wartość średnia (warunkowa i bezwarunkowa) z liczby 1 jest 1.
Warunkowy moment statystyczny pierwszego rzędu ma postać:
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle F(X(t), t) \Delta t + G(X(t), t) \Delta W(t)|X(t) = x \rangle \)
Wartość średnia z sumy równa się sumie wartości średnich. Więc powyższe wyrażenie składa się z dwóch średnich:
Pierwszy składnik:
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle F(X(t), t) \Delta t|X(t) = x \rangle = F(x, t) \)
Drugi składnik:
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle G(X(t), t) \Delta W(t)|X(t) = x \rangle = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle G(x, t) \Delta W(t)|X(t) = x \rangle \)
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G(x, t) \langle \Delta W(t)|X(t) = x \rangle = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G(x, t) \langle \Delta W(t)\rangle = 0 \)
Wyrażenie to zeruje się, ponieważ dla dowolnie małego \(\Delta t\) wartość średnia \(\langle \Delta W(t)\rangle = 0 \). Więc otrzymujemy ciąg \(0/\Delta t =0\). A granicą takiego ciągu jest \(0\).
Ostatecznie otrzymamy pierwszą funkcję w rozwinięciu Kramersa-Moyala:
Warunkowy moment statystyczny drugiego rzędu ma postać:
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle \left[F(X(t), t) \Delta t + G(X(t), t) \Delta W(t)\right]^2|X(t) = x \rangle = \)
Jeżeli podniesiemy do kwadratu wyrażenie w nawiasie, pojawiają sie trzy składniki:
Pierwszy składnik:
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle F^2(X(t), t) (\Delta t)^2 |X(t) = x \rangle = \lim_{\Delta t \to 0} \Delta t \, F^2(x, t) \; \langle 1 |X(t) = x \rangle = 0 \)
Składnik ten jest zero ponieważ \(\lim_{\Delta t \to 0} \Delta t =0\).
Drugi składnik:
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle 2 F(X(t), t) G(X(t), t) \Delta t \Delta W(t) |X(t) = x \rangle \)
\( = \lim_{\Delta t \to 0} \; 2 F(x, t) G(x, t) \langle \Delta W(t)|X(t) = x \rangle = 0 \)
Składnik ten jest zero ponieważ \(\langle \Delta W(t)|X(t) = x \rangle = \langle \Delta W(t) \rangle = 0\).
Trzeci składnik:
\( \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle G^2(X(t), t) [\Delta W(t)]^2|X(t) = x \rangle = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G^2(x, t)\langle [\Delta W(t)]^2|X(t) = x \rangle \)
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G^2(x, t) \langle [\Delta W(t)]^2 \rangle = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G^2(x, t) \,2D \Delta t = 2D G^2(x, t) \)
Ostatecznie druga funkcja w rozwinięciu Kramersa-Moyala ma postać:
Warunkowy moment statystyczny trzeciego rzędu ma postać:
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle \left[F(X(t), t) \Delta t + G(X(t), t) \Delta W(t)\right]^3|X(t) = x \rangle = \)
Jeżeli podniesiemy do sześcianu wyrażenie w nawiasie, pojawiają sie cztery składniki:
Pierwszy składnik:
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle F^3(X(t), t) (\Delta t)^3 |X(t) = x \rangle = \lim_{\Delta t \to 0} (\Delta t)^2 \, F^3(x, t) \; \langle 1 |X(t) = x \rangle = 0 \)
Składnik ten jest zero ponieważ \(\lim_{\Delta t \to 0} (\Delta t)^2 =0\).
Drugi składnik:
\( = \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; \langle 3 F^2(X(t), t) G(X(t), t) (\Delta t)^2 \Delta W(t) |X(t) = x \rangle = 0 \)
\( = \lim_{\Delta t \to 0} \; 3 \Delta t F^2(x, t) G(x, t) \langle \Delta W(t)|X(t) = x \rangle = 0 \)
Trzeci składnik:
\( \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; 3 \Delta t F(x, t) G^2(x, t)\langle [\Delta W(t)]^2|X(t) = x \rangle = \lim_{\Delta t \to 0} 3F(x, t) G^2(x, t) 2D \Delta t = 0 \)
Czwarty składnik:
\( \lim_{\Delta t \to 0} \frac{1}{\Delta t} \; G^2(x, t)\langle [\Delta W(t)]^3|X(t) = x \rangle = 0 \)
ponieważ
\( \langle [\Delta W(t)]^3 \rangle = 0 \)
Pamiętajmy, że proces Wienera jest procesem o rozkładzie normalnym (Gaussa) i o wartości średniej 0. Stąd wynika, że wszystkie momenty statystyczne nieparzystego rzędu zerują się.
Ostatecznie trzecia funkcja w rozwinięciu Kramersa-Moyala zeruje się,
Stosując powyższą metodę, można pokazać bezpośrednim rachunkiem, że
Korzystając z twierdzenia Pawuli, wnioskujemy, że
W konsekwencji, równanie Kramersa-Moyala redukuje się do równania Fokkera-Plancka. Możemy powyższe wyniki podsumować.
Podsumowanie
Jeżeli proces stochastyczny \( X(t)\) jest określony przez równanie Ito:
gdzie proces Wienera \(W(t)\) ma własności
to \(X(t)\) jest procesem Markowa i procesem dyfuzji. Warunkowa gęstość rozkładu prawdopodobieństwa \(p(x, t|y, s)\) spełnia równanie Fokkera-Plancka (proste równanie Kołmogorowa)
Dryf \(F(x, t)\) w tym równaniu jest ta samą funkcją \(F(x, t)\), która określa część deterministyczną w równaniu Ito. Funkcja dyfuzji
jest związana z losową częścią w równaniu Ito.
Przypadek wielowymiarowy
Niech dany jest układ wielu procesów stochastycznych (wektor procesów stochastycznych)
\[\vec{X}(t)= \{X_1(t), X_2(t), \dots, X_n(t)\}\]
określony przez układ równań stochastycznych Ito w postaci
gdzie funkcje \(F_i({\vec X}, t)\) oraz \(G_{ij}({\vec X}, t)\) są funkcjami deterministycznymi (nielosowymi) oraz
\[\vec{W}(t)= \{W_1(t), W_2(t), \dots, W_n(t)\}\]
są niezależnymi procesami Wienera o statystyce
gdzie \(\delta_{ij}\) jest deltą Kroneckera (patrz Dodatek matematyczny).
Wówczas wektor \(\vec X(t)\) jest procesem Markowa i procesem dyfuzji. Warunkowa gęstość rozkładu prawdopodobieństwa \(p(\vec x, t|\vec y, s)\) spełnia równanie Fokkera-Plancka (proste równanie Kołmogorowa)
\[ \frac{\partial p(\vec{x}, t|\vec{y}, s)}{\partial t} = -\sum_{i=1}^n \frac{\partial}{\partial x_i} \; F_i(\vec{x}, t) p(\vec{x}, t|\vec{y}, s) + \sum_{i,j=1}^n \frac{\partial^2}{\partial x_i \partial x_j} \; D_{ij}(\vec{x}, t) p(\vec{x}, t|\vec{y}, s) \]
gdzie
\[p(\vec{x}, t|\vec{y}, s) = p(x_1, x_2, \dots, x_n, t|y_1, y_2, \dots, y_n, s)\]
jest n-wymiarową warunkową gęstością prawdopodobieństwa oraz
\[\vec{x} = [x_1, x_2, \dots, x_n], \; \; \; \; \vec{y} = [y_1, y_2, \dots, y_n]\]
Składowe dryfu \(F_i(\vec x, t)\) sa deterministyczną częścią równania Ito. Bardziej skomplikowany jest związek macierzy dyfuzji \(D_{ij}(\vec x, t)\) z funkcjami \(G_{ij}(\vec x, t)\):
Jak widać, istnieje ścisły związek równań Ito z równaniami Fokkera-Plancka: każdmu równaniu Ito odpowiada proces dyfuzji opisywany przez proste równanie Kołmogorowa-Fokkera-Plancka. Współczesną fizykę statystyczną procesów w stanach równowagi termodynamicznej i procesów w stanach dalekich od równowagi termodynamicznej można sformułować w języku równań stochastycznych Ito. Szereg procesów dynamicznych w ekonomii, socjologii, dynamice populacyjnej, w których istnieją zaburzenia losowe można modelować za pomocą równań stochastycznych typu rownan Ito. Dlatego jest to tak potężne narzędzie analizy realnych zjawisk w przyrodzie.
Dylemat Stratonowicza-Ito
Jeżeli modelujemy procesy przy pomocy równań stochastycznych typu równań Ito, to pojawia się naturalne pytanie:
W jakim sensie należy interpretować równania stochastyczne?
W sensie Ito czy w sensie Stratonowicza? A może jeszcze w innym sensie? Powróćmy do Równania (1)
gdzie \(\Gamma(t)\) jest białym szumem gaussowskim, to znaczy delta-skorelowanym. Pamiętajmy, że delta-skorelowanie oznacza, że dla różnych chwil czasu, szum nie jest skorelowany, to znaczy jest maksymalnie losowy. Nawet dla nieskończenie bliskich chwil czasu nie ma korelacji. To jest idealizacja. W rzeczywistym świecie, szumy sa skorelowane. Może być taka sytuacja, że czas korelacji szumu jest bardzo mały, ale niezerowy. Jeżeli w układzie mamy kilka czasów charakterystycznych (znalezienie takich czasów charakterystycznych bywa czasami niełatwym zadaniem) i czas korelacji szumu jest najkrótszym ze wszystkich czasów charakterystycznych, to przybliżenie szumu przez biały szum jest dobrym przybliżeniem. Okazuje się (można to udowodnić), że jeżeli rzeczywiste zaburzenie losowe (szum, fluktuacje) jest skorelowane i dokonujemy idealizacji przez biały szum, to równania stochastyczne należy interpretować w sensie Stratonowicza. Z drugiej strony, jeżeli równanie stochastyczne jest ciągłą wersją równania z czasem dyskretnym i w wersji dyskretnej szum jest reprezentowany przez ciąg zmienny losowych nieskorelowanych, to równanie należy interpretowac w sensie Ito. Czytelnik powinien bardzo uważnie rozstrzygać dylemat Stratonowicza-Ito. Metoda modelowania jest zawsze metodą przybliżoną, ułomną, obarczoną wieloma brakami. Dlatego każdy konkretny przypadek musi być oddzielnie analizowany.