Macierze, wyznaczniki, układy równań liniowych

Z Skrypty dla studentów Ekonofizyki UPGOW

W jednym z poprzednich wykładów zajmowaliśmy się układami dwóch i trzech równań liniowych. Teraz uogólnimy nasze rozważania na przypadek układu \(n\) równań linowych, przy czym ograniczymy się do przypadku w którym liczba niewiadomych \(n\) jest równa liczbie równań. Aby takie uogólnienie było możliwe musimy wprowadzić pojęcie wektora, macierzy i wyznacznika. Rozdział ten zakończymy równaniem charakterystycznym macierzy i dyskusją problemu własnego macierzy. Układy równań liniowych znajdują szerokie zastosowanie w naukach przyrodniczych, technicznych i w ekonomii, co wynika m.in z tego, że zależności liniowe pomimo tego, że najprostsze opisują wiele zjawisk.

Spis treści

Macierze

W wielu przypadkach wygodnie jest użycie tablic liczb, w których poszczególne pozycje w tablicy są określone przez dwa wskaźniki (indeksy), które jednoznacznie definiują położenie danego elementu w tablicy. Takie tablice nazywamy macierzami. Poniższa macierz \(\mathbf{A}\) ma \(n\) wierszy i \(m\) kolumn

\[\mathbf{A} = \left( \begin{array}{cccccc} a_{11} & a_{12} & \ldots & a_{1j} & \ldots & a_{1m} \\ a_{21} & a_{22} & \ldots & a_{2j} & \ldots & a_{2m} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ij} & \ldots & a_{im} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nm} \end{array} \right)\]

Macierz \(\mathbf{A}\) ma \(n \times m\) elementów, a każdy z nich \(a_{ij}\) jest opisywany przez dwa wskaźniki, z których pierwszy podaje numer wiersza, a drugi numer kolumny. Co oznacza, że element \(a_{ij}\) leży na przecięciu \(i-tego\) wiersza i \(j-tej\) kolumny. Jeżeli \(n = m\) to wtedy macierz \(\mathbf{A}\) jest macierzą kwadratową (równa liczba wierszy o kolumn), a jeżeli \(n \neq m\) to jest macierzą prostokątną.


Wektor jest szczególnym przypadkiem macierzy jednokolumnowej lub jednowierszowej. Wektor jednokolumnowy \(\mathbf{X}\)

\[\mathbf{x} = \left( \begin{array}{c} x_{1} \\ x_{2} \\ \vdots \\ x_{i} \\ \vdots \\ x_{n} \end{array} \right)\]

ma \(n\) składowych.


Inną ważną macierzą jest macierz jednostkowa \(\mathbf{I}\), która jest macierzą kwadratową zawierającą na głównej przekątnej \(jedynki\), a poza główną przekątną \(zera\)

\[\mathbf{I} = \left( \begin{array}{cccccc} 1 & 0 & \ldots & 0 & \ldots & 0 \\ 0 & 1 & \ldots & 0 & \ldots & 0 \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ 0 & 0 & \ldots & 1 & \ldots & 0 \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ 0 & 0 & \ldots & 0 & \ldots & 1 \end{array} \right)\]

Macierz jednostkowa może być także zapisana przy pomocy delty Kroneckera \(\delta_{ij}\), która jest definiowana w następujący sposób

\[\delta_{ij}= \begin{cases} 1 & \quad dla \quad \textrm{i}=\textrm{j} \\ 0 & \quad dla \quad \textrm{i} \neq \textrm{j} \end{cases}\]

Niektóre działania algebraiczne mogą być wykonywane na macierzach, a ponadto definiuje się działania na macierzach, które nie mają odpowiedników w działaniach na liczbach. Omówimy je teraz pokrótce.

Dodawanie/odejmowanie macierzy

Aby można wykonać dodawanie/odejmowanie dwóch macierzy \(\mathbf{A}\) i \(\mathbf{B}\) muszą one mieć takie same wymiary \(n \times m\), a elementy macierzy \(\mathbf{C} = \mathbf{A} \pm \mathbf{B}\) są równe

\[\begin{aligned} c_{ij} = a_{ij} \pm b_{ij}, \qquad i = 1,\ldots,n, \quad j = 1,\ldots,m. \nonumber\end{aligned}\]

Mnożenie macierzy przez liczbę \(k\)

Polega na mnożeniu każdego elementu macierzy \(\mathbf{A}\) przez liczbę \(k\). I dlatego element \(ij\) macierzy \(k\mathbf{A}\) jest równy

\[\begin{aligned} k a_{ij}, \qquad i = 1,\ldots,n, \quad j = 1,\ldots,m. \nonumber\end{aligned}\]

Mnożenie macierzy

Ta operacja dla macierzy różni się od mnożenia liczb. Po pierwsze nie każde dwie macierze można pomnożyć. Mnożenie macierzy \(\mathbf{A} \cdot \mathbf{B}\) można wykonać jedynie wtedy gdy liczba kolumn macierzy \(\mathbf{A}\) jest równa liczbie wierszy macierzy \(\mathbf{B}\). A po drugie elementy macierzy \(\mathbf{C} = \mathbf{A} \cdot \mathbf{B}\) nie są prostym iloczynem elementów mnożonych macierzy. I tak w wyniku mnożenia macierzy \(\mathbf{A}\) o wymiarach \(n \times m\) przez macierz \(\mathbf{B}\) o wymiarach \(m \times l\) otrzymujemy macierz \(\mathbf{C}\) o wymiarze \(n \times l\), której element \(c_{ik}\) wyraża się przez następującą sumę

\[\begin{aligned} c_{ik} = \sum_{j=1}^{m} a_{ij} b_{jk}. \nonumber\end{aligned}\]

Widzimy, że element \(c_{ik}\) powstaje przez pomnożenie wiersza \(i\) macierzy \(\mathbf{A}\) przez kolumnę \(k\) macierzy \(\mathbf{B}\), przy czym \(pomnożenie\) oznacza sumowanie iloczynów odpowiednich elementów.

Transpozycja macierzy

Operacja ta, nie mająca odpowiednika w działanaich na liczbach, polega na zamianie miejscami wierszy i kolumn macierzy. I tak macierz transponowana \(\mathbf{A^T}\) do macierzy \(\mathbf{A}\), która ma \(n\) wierszy i \(m\) kolumn, będzie miała \(n\) kolumn i \(m\) wierszy, przy czym

\[\begin{aligned} a_{ij}^T = a_{ji}. \nonumber\end{aligned}\]

Wyznacznik macierzy

Wyznacznik macierzy kwadratowej jest to liczba przyporządkowana tej macierzy. Wyznaczniki oblicza się jedynie dla macierzy kwadratowych. Stosuje się następujące oznaczenia wyznacznika macierzy \(\mathbf{A}\):

\[\begin{aligned} det\mathbf{A} = \mid \mathbf{A} \mid. \nonumber\end{aligned}\]

Metodą rozwinięcia Laplace’a (rozwinięcia względem wiersza lub kolumny) można obliczyć wyznacznik macierzy o dowolnym wymiarze. Metoda ta zostanie omówiona później. Teraz zajmiemy się obliczaniem wyznaczników macierzy kwadratowych o liczbie wierszy/kolumn \(n \leq 3\). I tak dla \(n = 1\) (macierz ma wtedy tylko jeden element \(a_{11}\))

\[\left| \mathbf{A} \right| = a_{11}\]

Dla \(n = 2\)

\[\left| \begin{array}{cc} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{array} \right| = a_{11}a_{22} - a_{12}a_{21}\]

A dla \(n = 3\)

\[\left| \begin{array}{ccc} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{array} \right| = a_{11}a_{22}a_{33} + a_{21}a_{32}a_{13} + a_{31}a_{12}a_{23}- a_{13}a_{22}a_{31} - a_{23}a_{32}a_{11} - a_{33}a_{12}a_{21}\]

Aby wprowadzić metodę rozwinięcia Laplace’a obliczania wyznacznika macierzy \(\mathbf{A}\) o wymiarze \(n \times n\) musimy wprowadzić dwa pojęcia: minor \(M_{ij}\), czyli podwyznacznik oraz dopełnienie algebraiczne macierzy \(A_{ij}\). Minorem \(M_{ij}\) nazywamy wyznacznik macierzy, która powstaje z macierzy \(\mathbf{A}\) po wykreśleniu \(i-tego\) wiersza i \(j-tej\) kolumny (oczywiście otrzymamy wtedy macierz o wymiarach \(n-1 \times n-1\)):

\[M_{ij} = \left| \begin{array}{cccccc} a_{11} & \ldots & a_{1j-1} & a_{1j+1} & \ldots & a_{1n} \\ a_{21} & \ldots & a_{2j-1} & a_{2j+1} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i-11} & \ldots & a_{i-1j-1} & a_{i-1j+1} & \ldots & a_{i-1n} \\ a_{i+11} & \ldots & a_{i+1j-1} & a_{i+1j+1} & \ldots & a_{i+1n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & \ldots & a_{nj-1} & a_{nj+1} & \ldots & a_{nn} \\ \end{array} \right|\]

Natomiast dopełnienie algebraiczne \(A_{ij}\) to minor \(M_{ij}\) pomnożony przez czynnik \((-1)^{i+j}\), czyli

\[\begin{aligned} A_{ij} = (-1)^{i+j} M_{ij} \nonumber\end{aligned}\]

I podobnie jak minor dopełnienie algebraiczne jest liczbą. Mając dopełnienie algebraiczne możemy obliczyć wyznacznik macierzy \(\mathbf{A}\):

\(\begin{aligned} |\mathbf{A}| = \sum_{j=1}^{n} a_{ij} A_{ij} = \sum_{i=1}^{n} a_{ij} A_{ij}. \nonumber\end{aligned}\)

Można pokazać, że wartość takiego wyrażenia (czyli wartość wyznacznika) nie zależy od tego względem którego wiersza/kolumny dokonamy rozwinięcia. Jak widać wyznacznik otrzymujemy sumując iloczyny elementów macierzy \(a_{ij}\) i dopełnień algebraicznych \(A_{ij}\). Jako przykład podamy obliczanie wyznacznika macierzy \(4 \times 4\) przez rozwinięcie względem pierwszego wiersza

\[\left| \begin{array}{cccc} a_{11} & a_{12} & a_{13} & a_{14}\\ a_{21} & a_{22} & a_{23} & a_{24}\\ a_{31} & a_{32} & a_{33} & a_{34}\\ a_{41} & a_{42} & a_{43} & a_{44},\\ \end{array} \right| = a_{11}A_{11} + a_{12}A_{12} + a_{13}A_{13} + a_{14}A_{14}\]

gdzie np. dopełnienie algebraiczne \(A_{11}\), którego minor \(M_{11}\) powstał z wykreślenia pierwszego wiersza i pierwszej kolumny macierzy \(\mathbf{A}\)

\[A_{11} = \left| \begin{array}{ccc} a_{22} & a_{23} & a_{24}\\ a_{32} & a_{33} & a_{34}\\ a_{42} & a_{43} & a_{44}\\ \end{array} \right| (-1)^{1+1}\]

można obliczyć stosując wzór przedstawiony powyżej.

Wyznaczniki mają wiele pożytecznych własności, z których najważniejsze to:

  • wartość wyznacznika się nie zmienia gdy elementy dowolnego wiersza/kolumny dodamy bądź odejmiemy od elementów innego wiersza/kolumny,
  • wartość wyznacznika jest równa zero gdy jego dwa wiersze, bądź dwie kolumny są identyczne,
  • wartość wyznacznika jest równa zero jeżeli jeden jego wiersz (lub jedna kolumna) zawiera same zera,
  • przestawienie dwóch wierszy/kolumn wyznacznika powoduje pomnożenie jego wartości przez -1.

Wykorzystamy teraz wyznaczniki do rozwiązywania układów równań liniowych, przy czym będziemy rozważali układy w których liczba równań jest równa liczbie niewiadomych.

Układ \(n\) równań liniowych z \(n\) niewiadomymi

Jest to układ równań w którym \(n\) niewiadomych tworzących wektor niewiadomych \(\mathbf{X}\)

\[\mathbf{X} = \left( \begin{array}{c} x_{1} \\ x_{2} \\ \vdots \\ x_{i} \\ \vdots \\ x_{n} \end{array} \right)\]

pomnożony przez macierz \(\mathbf{A}\) znanych współczynników

\[\mathbf{A} = \left( \begin{array}{cccccc} a_{11} & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ij} & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} \end{array} \right)\]

jest równy znanemu wektorowi \(\mathbf{b}\) tzw. wyrazów wolnych

\[\mathbf{b} = \left( \begin{array}{c} b_{1} \\ b_{2} \\ \vdots \\ b_{i} \\ \vdots \\ b_{n} \end{array} \right)\]

W zapisie skróconym otrzymujemy

\[\begin{aligned} \mathbf{A} \mathbf{X} = \mathbf{b} \nonumber\end{aligned}\]

a w zapisie nieskróconym

\[\left( \begin{array}{cccccc} a_{11} & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ij} & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} \end{array} \right) \left( \begin{array}{c} x_{1} \\ x_{2} \\ \vdots \\ x_{i} \\ \vdots \\ x_{n} \end{array} \right) = \left( \begin{array}{c} b_{1} \\ b_{2} \\ \vdots \\ b_{i} \\ \vdots \\ b_{n} \end{array} \right)\]

Powyższe mnożenie macierzy (pamiętamy, że wektor jest szczególnym przypadkiem macierzy) i przyrównanie do siebie wektorów odpowiada następującemu układowi równań liniowych

\[\begin{array}{ccccccccc} a_{11}x_1 & + & a_{12}x_2 & + & \ldots & + & a_{1n}x_n & = & b_1 \\ a_{21}x_1 & + & a_{22}x_2 & + & \ldots & + & a_{2n}x_n & = & b_2 \\ \vdots & + & \vdots & + & \vdots & + & \vdots & = & \vdots \\ a_{n1}x_1 & + & a_{n2}x_2 & + & \ldots & + & a_{nn}x_n & = & b_n \\ \end{array}\]

Aby rozwiązać powyższy układ \(n\) równań liniowych należy obliczyć wyznacznik główny \(W\), który zawiera współczynniki układu równań

\[W = \left| \begin{array}{cccccc} a_{11} & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ij} & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} \end{array} \right|\]

a także \(n\) wyznaczników \(W_i, i = 1,2,...,n\), w których wektor wyrazów wolnych \(\mathbf{b}\) zastępuje \(i-tą\) kolumnę w wyznaczniku \(W\)

\[W_i = \left| \begin{array}{cccccccc} a_{11} & a_{12} & \ldots & a_{1i-1} & b_1 & a_{1i+1} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2i-1} & b_2 & a_{2i+2} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots\\ a_{n1} & a_{n2} & \ldots & a_{ni-1} & b_n & a_{ni+1} & \ldots & a_{nn} \end{array} \right|\]

W zależności od wartości wyznacznika głównego \(W\) i wyznaczników \(W_i\) rozważany układ równań liniowych posiada bądź nie posiada rozwiązania. Możliwe są trzy przypadki:

  1. \(W \neq 0\). Wtedy układ równań liniowych jest układem oznaczonym i posiada dokładnie jedno rozwiązanie dane przez wzory Cramera:

    \(\begin{aligned} x_1 = \frac{W_1}{W}, \quad x_2 = \frac{W_2}{W}, \quad \ldots, \quad x_n = \frac{W_n}{W}. \nonumber\end{aligned}\)

  2. \(W = 0\) i przynajmniej jeden z wyznaczników \(W_i \neq 0\). Wtedy układ równań jest układem sprzecznym i nie posiada rozwiązania.

  3. \(W = W_1 = W_2 = \ldots = W_n = 0\). Wtedy przynajmniej jedno z równań wynika z pozostałych, czyli jest mniej równań niż niewiadomych, a układ równań liniowych jest układem nieoznaczonym lub sprzecznym.

Równanie charakterystyczne (wiekowe) macierzy

Jeżeli od elementów diagonalnych macierzy kwadratowej \(\mathbf{A}\)

\[\mathbf{A} = \left( \begin{array}{cccccc} a_{11} & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ij} & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} \end{array} \right)\]

odejmiemy tę samą zmienną \(\lambda\) to otrzymamy nastepującą macierz kwadratową

\[\left( \begin{array}{cccccc} a_{11} - \lambda & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} - \lambda & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ii} - \lambda & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} - \lambda \end{array} \right)\]

Przyrównując do zera wyznacznik tej macierzy

\[\left| \begin{array}{cccccc} a_{11} - \lambda & a_{12} & \ldots & a_{1j} & \ldots & a_{1n} \\ a_{21} & a_{22} - \lambda & \ldots & a_{2j} & \ldots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{i1} & a_{i2} & \ldots & a_{ii} - \lambda & \ldots & a_{in} \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \ldots & a_{nj} & \ldots & a_{nn} - \lambda \end{array} \right| = 0\]

otrzymamy równanie stopnia \(n\) ze względu na \(\lambda\). Jest to równanie charakterystyczne, albo wiekowe macierzy \(\mathbf{A}\). Równanie to można rozwiązać, a jego pierwiastki czyli wartości \(\lambda_i, i=1,2,\ldots,n\) nazywamy wartościami własnymi macierzy \(\mathbf{A}\). Mając wartości własne \(\lambda_i\) można znaleźć odpowiadające im wektory własne \(|\psi_i>\) spełniające następujące równania

\[\begin{aligned} (\mathbf{A} - \lambda_i\mathbf{I})|\psi_i> = 0, \nonumber\end{aligned}\]

gdzie \(\mathbf{I}\) jest macierzą jednostkową o wymiarze takim jak wymiar macierzy \(\mathbf{A}\). Wektory własne zapisaliśmy jako \(|\psi_i>\), ponieważ takie oznaczenie będzie używane w mechanice kwantowej. Znajdowanie wartości własnych i wektorów własnych jest centralnym zagadnieniem mechaniki kwantowej, która z powodzeniem opisuje mikroświat - atomy, cząsteczki, ...

Zadania

  1. Wykonać mnożenie macierzy:
    1. \(\begin{pmatrix}1&2\end{pmatrix}\begin{pmatrix}1\\2\end{pmatrix}\)
    2. \(\begin{pmatrix}1\\2\end{pmatrix}\begin{pmatrix}1&2\end{pmatrix}\)
    3. \(\begin{pmatrix}\frac{1}{8}&9\end{pmatrix}\begin{pmatrix}16\\2\end{pmatrix}\)
    4. \(\begin{pmatrix}a&b\end{pmatrix}\begin{pmatrix}d\\e\end{pmatrix}\)
    5. \(\begin{pmatrix}6 + 6b&3 - b\end{pmatrix}\begin{pmatrix}0\\0\end{pmatrix}\)
    6. \(\begin{pmatrix}0&abc\end{pmatrix}\begin{pmatrix}a\\0\end{pmatrix}\)
  2. Wyznaczyć "wymiar" macierzy C
    1. C = An×pBp×m
    2. \(C = \begin{pmatrix} 10^{10}&20\\ 5000&0 \end{pmatrix} \begin{pmatrix} 1&2&3&4\\ 2&5&6&6 \end{pmatrix} \)
  3. Obliczyć, pamiętając że (AB)C = A(BC)
    1. \( \begin{pmatrix} 1&1\\ 0&1\\ \end{pmatrix} \begin{pmatrix} 1&1\\ 0&1\\ \end{pmatrix} \begin{pmatrix} 1&1\\ 0&1\\ \end{pmatrix} \begin{pmatrix} 1\\ 1\\ \end{pmatrix}\)
    2. \( \begin{pmatrix} 3&1\\ 2&8\\ \end{pmatrix} \begin{pmatrix} 1&1\\ 0&2\\ \end{pmatrix} \begin{pmatrix} 1&1\\ 0&1\\ \end{pmatrix} \begin{pmatrix} 1\\ 1\\ \end{pmatrix}\)
  4. Obliczyć
    1. \( C = \begin{pmatrix} 1&2\\ 4&5 \end{pmatrix} \begin{pmatrix} 1&0\\ 0&1\\ \end{pmatrix}\)
    2. \( D = \begin{pmatrix} 1&0\\ 0&1 \end{pmatrix} \begin{pmatrix} 1&2\\ 4&5\\ \end{pmatrix} \)
  5. Wykorzystując wyznacznik macierzy, zdecyduj czy następujący układ równań ma jedno rozwiązanie
    1. \( \begin{matrix} \frac{2}{5}x + \frac{2}{3}y = 0\\ \frac{3}{2}x + \frac{5}{2}y = 0 \end{matrix}\)