Macierze, wyznaczniki, układy równań liniowych

Z Skrypty dla studentów Ekonofizyki UPGOW

Wersja SewerynKowalski (dyskusja | edycje) z dnia 20:01, 6 mar 2014

(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)

W jednym z poprzednich wykładów zajmowaliśmy się układami dwóch i trzech równań liniowych. Teraz uogólnimy nasze rozważania na przypadek układu \(n\) równań linowych, przy czym ograniczymy się do przypadku w którym liczba niewiadomych \(n\) jest równa liczbie równań. Aby takie uogólnienie było możliwe musimy wprowadzić pojęcie wektora, macierzy i wyznacznika. Rozdział ten zakończymy równaniem charakterystycznym macierzy i dyskusją problemu własnego macierzy. Układy równań liniowych znajdują szerokie zastosowanie w naukach przyrodniczych, technicznych i w ekonomii, co wynika m.in z tego, że zależności liniowe pomimo tego, że najprostsze opisują wiele zjawisk.

Spis treści

1 Macierze
2 Wyznacznik macierzy
3 Układ \(n\) równań liniowych z \(n\) niewiadomymi
4 Równanie charakterystyczne (wiekowe) macierzy
5 Zadania

Macierze

W wielu przypadkach wygodnie jest użycie tablic liczb, w których poszczególne pozycje w tablicy są określone przez dwa wskaźniki (indeksy), które jednoznacznie definiują położenie danego elementu w tablicy. Takie tablice nazywamy macierzami. Poniższa macierz \(\mathbf{A}\) ma \(n\) wierszy i \(m\) kolumn

\[\mathbf{A} = \left( \begin{array}{cccccc} a_{11} & a_{12} & \ldots & a_{1j} & \ldots & a_{1m} \\ a_{21} & a_{22} & \ldots & a_{2j} & \ldots & a_{2m} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ij} & \ldots & a_{im} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nm} \end{array} \right)\]

Macierz \(\mathbf{A}\) ma \(n \times m\) elementów, a każdy z nich \(a_{ij}\) jest opisywany przez dwa wskaźniki, z których pierwszy podaje numer wiersza, a drugi numer kolumny. Co oznacza, że element \(a_{ij}\) leży na przecięciu \(i-tego\) wiersza i \(j-tej\) kolumny. Jeżeli \(n = m\) to wtedy macierz \(\mathbf{A}\) jest macierzą kwadratową (równa liczba wierszy o kolumn), a jeżeli \(n \neq m\) to jest macierzą prostokątną.

Wektor jest szczególnym przypadkiem macierzy jednokolumnowej lub jednowierszowej. Wektor jednokolumnowy \(\mathbf{X}\)

\[\mathbf{x} = \left( \begin{array}{c} x_{1} \\ x_{2} \\ \vdots \\ x_{i} \\ \vdots \\ x_{n} \end{array} \right)\]

ma \(n\) składowych.

Inną ważną macierzą jest macierz jednostkowa \(\mathbf{I}\), która jest macierzą kwadratową zawierającą na głównej przekątnej \(jedynki\), a poza główną przekątną \(zera\)

\[\mathbf{I} = \left( \begin{array}{cccccc} 1 & 0 & \ldots & 0 & \ldots & 0 \\ 0 & 1 & \ldots & 0 & \ldots & 0 \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ 0 & 0 & \ldots & 1 & \ldots & 0 \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ 0 & 0 & \ldots & 0 & \ldots & 1 \end{array} \right)\]

Macierz jednostkowa może być także zapisana przy pomocy delty Kroneckera \(\delta_{ij}\), która jest definiowana w następujący sposób

\[\delta_{ij}= \begin{cases} 1 & \quad dla \quad \textrm{i}=\textrm{j} \\ 0 & \quad dla \quad \textrm{i} \neq \textrm{j} \end{cases}\]

Niektóre działania algebraiczne mogą być wykonywane na macierzach, a ponadto definiuje się działania na macierzach, które nie mają odpowiedników w działaniach na liczbach. Omówimy je teraz pokrótce.

Dodawanie/odejmowanie macierzy

Aby można wykonać dodawanie/odejmowanie dwóch macierzy \(\mathbf{A}\) i \(\mathbf{B}\) muszą one mieć takie same wymiary \(n \times m\), a elementy macierzy \(\mathbf{C} = \mathbf{A} \pm \mathbf{B}\) są równe

\[\begin{aligned} c_{ij} = a_{ij} \pm b_{ij}, \qquad i = 1,\ldots,n, \quad j = 1,\ldots,m. \nonumber\end{aligned}\]

Mnożenie macierzy przez liczbę \(k\)

Polega na mnożeniu każdego elementu macierzy \(\mathbf{A}\) przez liczbę \(k\). I dlatego element \(ij\) macierzy \(k\mathbf{A}\) jest równy

\[\begin{aligned} k a_{ij}, \qquad i = 1,\ldots,n, \quad j = 1,\ldots,m. \nonumber\end{aligned}\]

Mnożenie macierzy

Ta operacja dla macierzy różni się od mnożenia liczb. Po pierwsze nie każde dwie macierze można pomnożyć. Mnożenie macierzy \(\mathbf{A} \cdot \mathbf{B}\) można wykonać jedynie wtedy gdy liczba kolumn macierzy \(\mathbf{A}\) jest równa liczbie wierszy macierzy \(\mathbf{B}\). A po drugie elementy macierzy \(\mathbf{C} = \mathbf{A} \cdot \mathbf{B}\) nie są prostym iloczynem elementów mnożonych macierzy. I tak w wyniku mnożenia macierzy \(\mathbf{A}\) o wymiarach \(n \times m\) przez macierz \(\mathbf{B}\) o wymiarach \(m \times l\) otrzymujemy macierz \(\mathbf{C}\) o wymiarze \(n \times l\), której element \(c_{ik}\) wyraża się przez następującą sumę

\[\begin{aligned} c_{ik} = \sum_{j=1}^{m} a_{ij} b_{jk}. \nonumber\end{aligned}\]

Widzimy, że element \(c_{ik}\) powstaje przez pomnożenie wiersza \(i\) macierzy \(\mathbf{A}\) przez kolumnę \(k\) macierzy \(\mathbf{B}\), przy czym \(pomnożenie\) oznacza sumowanie iloczynów odpowiednich elementów.

Transpozycja macierzy

Operacja ta, nie mająca odpowiednika w działanaich na liczbach, polega na zamianie miejscami wierszy i kolumn macierzy. I tak macierz transponowana \(\mathbf{A^T}\) do macierzy \(\mathbf{A}\), która ma \(n\) wierszy i \(m\) kolumn, będzie miała \(n\) kolumn i \(m\) wierszy, przy czym

\[\begin{aligned} a_{ij}^T = a_{ji}. \nonumber\end{aligned}\]

Wyznacznik macierzy

Wyznacznik macierzy kwadratowej jest to liczba przyporządkowana tej macierzy. Wyznaczniki oblicza się jedynie dla macierzy kwadratowych. Stosuje się następujące oznaczenia wyznacznika macierzy \(\mathbf{A}\):

\[\begin{aligned} det\mathbf{A} = \mid \mathbf{A} \mid. \nonumber\end{aligned}\]

Metodą rozwinięcia Laplace’a (rozwinięcia względem wiersza lub kolumny) można obliczyć wyznacznik macierzy o dowolnym wymiarze. Metoda ta zostanie omówiona później. Teraz zajmiemy się obliczaniem wyznaczników macierzy kwadratowych o liczbie wierszy/kolumn \(n \leq 3\). I tak dla \(n = 1\) (macierz ma wtedy tylko jeden element \(a_{11}\))

\[\left| \mathbf{A} \right| = a_{11}\]

Dla \(n = 2\)

\[\left| \begin{array}{cc} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{array} \right| = a_{11}a_{22} - a_{12}a_{21}\]

A dla \(n = 3\)

\[\left| \begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{array} \right| = a_{11}a_{22}a_{33} + a_{21}a_{32}a_{13} + a_{31}a_{12}a_{23}- a_{13}a_{22}a_{31} - a_{23}a_{32}a_{11} - a_{33}a_{12}a_{21}\]

Aby wprowadzić metodę rozwinięcia Laplace’a obliczania wyznacznika macierzy \(\mathbf{A}\) o wymiarze \(n \times n\) musimy wprowadzić dwa pojęcia: minor \(M_{ij}\), czyli podwyznacznik oraz dopełnienie algebraiczne macierzy \(A_{ij}\). Minorem \(M_{ij}\) nazywamy wyznacznik macierzy, która powstaje z macierzy \(\mathbf{A}\) po wykreśleniu \(i-tego\) wiersza i \(j-tej\) kolumny (oczywiście otrzymamy wtedy macierz o wymiarach \(n-1 \times n-1\)):

\[M_{ij} = \left| \begin{array}{cccccc} a_{11} & \ldots & a_{1j-1} & a_{1j+1} & \ldots & a_{1n} \\ a_{21} & \ldots & a_{2j-1} & a_{2j+1} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i-11} & \ldots & a_{i-1j-1} & a_{i-1j+1} & \ldots & a_{i-1n} \\ a_{i+11} & \ldots & a_{i+1j-1} & a_{i+1j+1} & \ldots & a_{i+1n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & \ldots & a_{nj-1} & a_{nj+1} & \ldots & a_{nn} \\ \end{array} \right|\]

Natomiast dopełnienie algebraiczne \(A_{ij}\) to minor \(M_{ij}\) pomnożony przez czynnik \((-1)^{i+j}\), czyli

\[\begin{aligned} A_{ij} = (-1)^{i+j} M_{ij} \nonumber\end{aligned}\]

I podobnie jak minor dopełnienie algebraiczne jest liczbą. Mając dopełnienie algebraiczne możemy obliczyć wyznacznik macierzy \(\mathbf{A}\):

\(\begin{aligned} |\mathbf{A}| = \sum_{j=1}^{n} a_{ij} A_{ij} = \sum_{i=1}^{n} a_{ij} A_{ij}. \nonumber\end{aligned}\)

Można pokazać, że wartość takiego wyrażenia (czyli wartość wyznacznika) nie zależy od tego względem którego wiersza/kolumny dokonamy rozwinięcia. Jak widać wyznacznik otrzymujemy sumując iloczyny elementów macierzy \(a_{ij}\) i dopełnień algebraicznych \(A_{ij}\). Jako przykład podamy obliczanie wyznacznika macierzy \(4 \times 4\) przez rozwinięcie względem pierwszego wiersza

\[\left| \begin{array}{cccc} a_{11} & a_{12} & a_{13} & a_{14}\\ a_{21} & a_{22} & a_{23} & a_{24}\\ a_{31} & a_{32} & a_{33} & a_{34}\\ a_{41} & a_{42} & a_{43} & a_{44},\\ \end{array} \right| = a_{11}A_{11} + a_{12}A_{12} + a_{13}A_{13} + a_{14}A_{14}\]

gdzie np. dopełnienie algebraiczne \(A_{11}\), którego minor \(M_{11}\) powstał z wykreślenia pierwszego wiersza i pierwszej kolumny macierzy \(\mathbf{A}\)

\[A_{11} = \left| \begin{array}{ccc} a_{22} & a_{23} & a_{24}\\ a_{32} & a_{33} & a_{34}\\ a_{42} & a_{43} & a_{44}\\ \end{array} \right| (-1)^{1+1}\]

można obliczyć stosując wzór przedstawiony powyżej.

Wyznaczniki mają wiele pożytecznych własności, z których najważniejsze to:

wartość wyznacznika się nie zmienia gdy elementy dowolnego wiersza/kolumny dodamy bądź odejmiemy od elementów innego wiersza/kolumny,
wartość wyznacznika jest równa zero gdy jego dwa wiersze, bądź dwie kolumny są identyczne,
wartość wyznacznika jest równa zero jeżeli jeden jego wiersz (lub jedna kolumna) zawiera same zera,
przestawienie dwóch wierszy/kolumn wyznacznika powoduje pomnożenie jego wartości przez -1.

Wykorzystamy teraz wyznaczniki do rozwiązywania układów równań liniowych, przy czym będziemy rozważali układy w których liczba równań jest równa liczbie niewiadomych.

Układ \(n\) równań liniowych z \(n\) niewiadomymi

Jest to układ równań w którym \(n\) niewiadomych tworzących wektor niewiadomych \(\mathbf{X}\)

\[\mathbf{X} = \left( \begin{array}{c} x_{1} \\ x_{2} \\ \vdots \\ x_{i} \\ \vdots \\ x_{n} \end{array} \right)\]

pomnożony przez macierz \(\mathbf{A}\) znanych współczynników

\[\mathbf{A} = \left( \begin{array}{cccccc} a_{11} & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ij} & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} \end{array} \right)\]

jest równy znanemu wektorowi \(\mathbf{b}\) tzw. wyrazów wolnych

\[\mathbf{b} = \left( \begin{array}{c} b_{1} \\ b_{2} \\ \vdots \\ b_{i} \\ \vdots \\ b_{n} \end{array} \right)\]

W zapisie skróconym otrzymujemy

\[\begin{aligned} \mathbf{A} \mathbf{X} = \mathbf{b} \nonumber\end{aligned}\]

a w zapisie nieskróconym

\[\left( \begin{array}{cccccc} a_{11} & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ij} & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} \end{array} \right) \left( \begin{array}{c} x_{1} \\ x_{2} \\ \vdots \\ x_{i} \\ \vdots \\ x_{n} \end{array} \right) = \left( \begin{array}{c} b_{1} \\ b_{2} \\ \vdots \\ b_{i} \\ \vdots \\ b_{n} \end{array} \right)\]

Powyższe mnożenie macierzy (pamiętamy, że wektor jest szczególnym przypadkiem macierzy) i przyrównanie do siebie wektorów odpowiada następującemu układowi równań liniowych

\[\begin{array}{ccccccccc} a_{11}x_1 & + & a_{12}x_2 & + & \ldots & + & a_{1n}x_n & = & b_1 \\ a_{21}x_1 & + & a_{22}x_2 & + & \ldots & + & a_{2n}x_n & = & b_2 \\ \vdots & + & \vdots & + & \vdots & + & \vdots & = & \vdots \\ a_{n1}x_1 & + & a_{n2}x_2 & + & \ldots & + & a_{nn}x_n & = & b_n \\ \end{array}\]

Aby rozwiązać powyższy układ \(n\) równań liniowych należy obliczyć wyznacznik główny \(W\), który zawiera współczynniki układu równań

\[W = \left| \begin{array}{cccccc} a_{11} & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ij} & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} \end{array} \right|\]

a także \(n\) wyznaczników \(W_i, i = 1,2,...,n\), w których wektor wyrazów wolnych \(\mathbf{b}\) zastępuje \(i-tą\) kolumnę w wyznaczniku \(W\)

\[W_i = \left| \begin{array}{cccccccc} a_{11} & a_{12} & \ldots & a_{1i-1} & b_1 & a_{1i+1} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2i-1} & b_2 & a_{2i+2} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots\\ a_{n1} & a_{n2} & \ldots & a_{ni-1} & b_n & a_{ni+1} & \ldots & a_{nn} \end{array} \right|\]

W zależności od wartości wyznacznika głównego \(W\) i wyznaczników \(W_i\) rozważany układ równań liniowych posiada bądź nie posiada rozwiązania. Możliwe są trzy przypadki:

\(W \neq 0\). Wtedy układ równań liniowych jest układem oznaczonym i posiada dokładnie jedno rozwiązanie dane przez wzory Cramera:

\(\begin{aligned} x_1 = \frac{W_1}{W}, \quad x_2 = \frac{W_2}{W}, \quad \ldots, \quad x_n = \frac{W_n}{W}. \nonumber\end{aligned}\)
\(W = 0\) i przynajmniej jeden z wyznaczników \(W_i \neq 0\). Wtedy układ równań jest układem sprzecznym i nie posiada rozwiązania.
\(W = W_1 = W_2 = \ldots = W_n = 0\). Wtedy przynajmniej jedno z równań wynika z pozostałych, czyli jest mniej równań niż niewiadomych, a układ równań liniowych jest układem nieoznaczonym lub sprzecznym.

Równanie charakterystyczne (wiekowe) macierzy

Jeżeli od elementów diagonalnych macierzy kwadratowej \(\mathbf{A}\)

\[\mathbf{A} = \left( \begin{array}{cccccc} a_{11} & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ij} & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} \end{array} \right)\]

odejmiemy tę samą zmienną \(\lambda\) to otrzymamy nastepującą macierz kwadratową

\[\left( \begin{array}{cccccc} a_{11} - \lambda & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} - \lambda & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ii} - \lambda & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} - \lambda \end{array} \right)\]

Przyrównując do zera wyznacznik tej macierzy

\[\left| \begin{array}{cccccc} a_{11} - \lambda & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} - \lambda & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ii} - \lambda & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} - \lambda \end{array} \right| = 0\]

otrzymamy równanie stopnia \(n\) ze względu na \(\lambda\). Jest to równanie charakterystyczne, albo wiekowe macierzy \(\mathbf{A}\). Równanie to można rozwiązać, a jego pierwiastki czyli wartości \(\lambda_i, i=1,2,\ldots,n\) nazywamy wartościami własnymi macierzy \(\mathbf{A}\). Mając wartości własne \(\lambda_i\) można znaleźć odpowiadające im wektory własne \(|\psi_i>\) spełniające następujące równania

\[\begin{aligned} (\mathbf{A} - \lambda_i\mathbf{I})|\psi_i> = 0, \nonumber\end{aligned}\]

gdzie \(\mathbf{I}\) jest macierzą jednostkową o wymiarze takim jak wymiar macierzy \(\mathbf{A}\). Wektory własne zapisaliśmy jako \(|\psi_i>\), ponieważ takie oznaczenie będzie używane w mechanice kwantowej. Znajdowanie wartości własnych i wektorów własnych jest centralnym zagadnieniem mechaniki kwantowej, która z powodzeniem opisuje mikroświat - atomy, cząsteczki, ...

Zadania

Wykonać mnożenie macierzy:
1. \(\begin{pmatrix}1&2\end{pmatrix}\begin{pmatrix}1\\2\end{pmatrix}\)
2. \(\begin{pmatrix}1\\2\end{pmatrix}\begin{pmatrix}1&2\end{pmatrix}\)
3. \(\begin{pmatrix}\frac{1}{8}&9\end{pmatrix}\begin{pmatrix}16\\2\end{pmatrix}\)
4. \(\begin{pmatrix}a&b\end{pmatrix}\begin{pmatrix}d\\e\end{pmatrix}\)
5. \(\begin{pmatrix}6 + 6b&3 - b\end{pmatrix}\begin{pmatrix}0\\0\end{pmatrix}\)
6. \(\begin{pmatrix}0&abc\end{pmatrix}\begin{pmatrix}a\\0\end{pmatrix}\)
Wyznaczyć "wymiar" macierzy C
1. C = A_n×pB_p×m
2. \(C = \begin{pmatrix} 10^{10}&20\\ 5000&0 \end{pmatrix} \begin{pmatrix} 1&2&3&4\\ 2&5&6&6 \end{pmatrix} \)
Obliczyć, pamiętając że (AB)C = A(BC)
1. \( \begin{pmatrix} 1&1\\ 0&1\\ \end{pmatrix} \begin{pmatrix} 1&1\\ 0&1\\ \end{pmatrix} \begin{pmatrix} 1&1\\ 0&1\\ \end{pmatrix} \begin{pmatrix} 1\\ 1\\ \end{pmatrix}\)
2. \( \begin{pmatrix} 3&1\\ 2&8\\ \end{pmatrix} \begin{pmatrix} 1&1\\ 0&2\\ \end{pmatrix} \begin{pmatrix} 1&1\\ 0&1\\ \end{pmatrix} \begin{pmatrix} 1\\ 1\\ \end{pmatrix}\)
Obliczyć
1. \( C = \begin{pmatrix} 1&2\\ 4&5 \end{pmatrix} \begin{pmatrix} 1&0\\ 0&1\\ \end{pmatrix}\)
2. \( D = \begin{pmatrix} 1&0\\ 0&1 \end{pmatrix} \begin{pmatrix} 1&2\\ 4&5\\ \end{pmatrix} \)
Wykorzystując wyznacznik macierzy, zdecyduj czy następujący układ równań ma jedno rozwiązanie
1. \( \begin{matrix} \frac{2}{5}x + \frac{2}{3}y = 0\\ \frac{3}{2}x + \frac{5}{2}y = 0 \end{matrix}\)