Zmena súradníc - cez matice

Martin Sleziak · Post by **Martin Sleziak** » Fri Apr 10, 2020 4:01 pm

S prechodom medzi dvoma súradnicovými sústavami ste sa už stretli pri afinných podpriestoroch.
Viac sa budeme zaoberať niečím takýmto vo vektorových priestoroch - dôležité bude napríklad to, ako sa dajú vyjadriť matice toho istého zobrazenia vzhľadom na dve rôzne bázy, čo vedie k pojmu podobnosti matíc.

Tieto veci sú detailne vysvetlené v zelenej knižke (Korbaš-Gyurki) a budú aj na prednáške.

Skúsim aj tak napísať nejaké stručné poznámky, ktorý by mohli možno tiež dať užitočný vhľad do toho ako to funguje. (Resp. možno trochu iný pohľad na odvodenie niektorých vecí.)

Budem najprv pracovať iba v $F^n$, čiže menej všeobecne než na prednáške. Potom neskôr skúsim napísať niečo aj k tomu, či by sme nejako z tohoto špeciálneho prípadu vedeli dostať aj všeobecné tvrdenia o ľubovoľných vektorových priestoroch.

Martin Sleziak · Post by **Martin Sleziak** » Fri Apr 10, 2020 4:02 pm

Prechod v $F^n$ cez matice$\newcommand{\inv}[1]{{#1}^{-1}}
\newcommand{\vek}[1]{\vec{#1}}
\newcommand{\Vdots}[3]{\vek{#1}_{#2},\dots,\vek{#1}_{#3}}
\newcommand{\Vddots}[4]{\vek{#1}_{#2},\vek{#1}_{#3},\dots,\vek{#1}_{#4}}
\newcommand{\LKdots}[4]{#1_{#3} \vek{#2}_{#3} +\dots+#1_{#4}\vek{#2}_{#4}}
\newcommand{\LKddots}[5]{#1_{#3} \vek{#2}_{#3} + #1_{#4}\vek{#2}_{#4} + \dots+#1_{#5}\vek{#2}_{#5}}$

Budeme pracovať v priestore $V=F^n$.
Treba si dať pozor aby sme rozlišovali medzi vektorom a usporiadanou $n$-ticou ktorá predstavuje súradnice vektora vzhľadom na danú bázu. (Oboje sú v tomto prípade prvky z $F^n$.)
Keďže takéto označenie je aj v zelenej knihe, azda je rozumné keď sa budem držať toho, že $\vec x=(x_1,\dots,x_n)$ budem označovať vektor, ale symbol $X=(x_1,\dots,x_n)$ použijem ak pôjde o súradnice. (V knihe je použité $\mathbf X$, ale nechce sa mi zakaždým pridávať že to má byť boldom.)
Hlavne som chcel ale zdôrazniť, že usporiadané $n$-tice sa tu budú vyskytovať v dvoch rôznych významoch.

Zoberme si nejakú bázu $(\Vddots a12n)$ a vytvorme maticu $A$, v ktorej budú tieto vektory ako riadky:
$$A=
\begin{pmatrix}
\vec a_1 \\ \vec a_2 \\ \vdots \\ \vec a_n \\
\end{pmatrix}.
$$
Fakt, že ide o bázu, môžeme ekvivalentne pomocou matíc povedať tak, že $A$ je regulárna.

Súradnice vektora.

To, že nejaký vektor má vzhľadom na túto bázu súradnice $X=(x_1,x_2,\dots,x_n)$ podľa definície znamená, že
$$\vec x=\LKddots xa12n.$$
Môžeme ľahko skontrolovať, že toto je to isté ako maticová rovnosť
$$\vec x=XA.$$

Spoiler:

Matica prechodu.

Máme teraz nejakú ďalšiu bázu $\Vddots b12n$ a opäť si vektory z tejto bázy poukladáme do riadkov matice $P$.
Keď porovnáte čo vznikne násobením matíc a ako bola definovaná matice prechodu od $\Vddots a12n$ k $\Vddots b12n$, tak by sa malo dať vidieť že ekvivalentne to môžeme povedať tak, že platí rovnosť
$$B=PA.$$

Spoiler:

To že matica $P$ je jednoznačne určená vieme z vlastností báz.
Ale aj ak sa pozrieme na uvedenú maticovú rovnosť, tak vidíme, že máme jedinú možnosť ako môže vyzerať matica $P$.
$$P=BA^{-1}.$$
Súčasne vidíme aj to, že matica $P$ je regulárna, keďže sa rovná súčinu dvoch regulárnych matíc.

Tiež si môžeme všimnúť, že ak $P$ je matica prechodu jedným smerom, tak máme
$$B=PA \Rightarrow A=\inv PB,$$
čo nám hovorí, že $\inv P$ je matica prechodu opačným smerom (t.j. od $\Vdots b1n$ k $\Vdots a1n$).

Alebo napríklad ak $P$ je matica prechodu od $\Vdots a1n$ k $\Vdots b1n$, $P'$ je matica prechodu od $\Vdots b1n$ k $\Vdots c1n$, tak máme $C=P'B$ a $B=PA$, z čoho vidíme
$$C=P'PA.$$
Teda matica prechodu od $\Vdots a1n$ k $\Vdots c1n$ je súčin $P'P$.

Alebo si tiež môžeme všimnúť, že ak $P$ a $A$ sú regulárne matice, tak aj $B=PA$ je regulárna matica. Toto nám hovorí, že pre zadanú bázu $\Vdots a1n$ a regulárnu maticu $P$ vieme takýmto spôsobom dostať novú bázu $\Vdots b1n$ takú, že $P$ je príslušná matica prechodu.

Zmena súradníc vektora.
Pozrime sa teraz na to, čo vieme povedať o súradniciach vektora ak sa pozeráme na dve rôzne bázy.
Majme maticu prechodu $P$ od bázy $\Vdots a1n$ k $\Vdots b1n$. T.j. $B=PA$.
Označme si $X_n$ súradnice vzhľadom na bázu $\Vdots b1n$ a $X_s$ súradnice vzhľadom na bázu $\Vdots a1n$. (Indexy som dal na označenie "nové súradnice" a "staré súradnice", ak sa na maticu prechodu pozeráme tak, že je to matica prechodu od starých súradníc k novým.)
Čo by sme vedeli povedať o vzťahu medzi $X_s$ a $X_n$?
To, že ide o súradnice vektora vzhľadom na nejakú bázu mi hovorí to, že
\begin{align*}
\vec x&=X_sA\\
\vec x&=X_nB
\end{align*}
Ak dosadíme $B=PA$ do druhej z týchto rovností, tak máme $\vec x=X_nPA$, teda dostaneme:
\begin{gather*}
X_sA=X_nPA\\
X_s=X_nP
\end{gather*}
(Keďže $A$ je regulárna, tak sme mohli rovnosť $X_sA=X_nPA$ vynásobiť $\inv A$.)

Medzi týmito súradnicami teda máme vzťahy $X_s=X_nP$ alebo $X_n=X_s\inv P$.

Martin Sleziak · Post by **Martin Sleziak** » Fri Apr 10, 2020 4:03 pm

Platí to aj všeobecne?

Zatiaľ sme všetko robili iba pre prípad $V=F^n$.
Dá sa nejako tento postup použiť aj pre iné konečnorozmerné priestory, alebo tam budeme musieť vymyslieť niečo iné?

Neformálny pohľad

Vieme, že ak $V$ je konečnorozmerný a $\dim(V)=n$, tak $V\cong F^n$.
Každý konečnorozmerný vektorový priestor je teda izomorfný s $F^n$ pre nejaké $n$. Izomorfné vektorové priestory sú "v podstate rovnaké", vlastnosti ktoré vieme vyjadriť v reči vektorových priestorov musia teda platiť v jednom z nich práve vtedy, keď v druhom.

Formálnejšie zdôvodnenie

Keď by sme chceli trochu formálnejšie zapísať vlastnosti potrebné na to, aby sme z dôkazu uvedených tvrdení o maticiach prechodu pre $F^n$ dostali zodpovedajúce tvrdenia v každom konečnorozmernom vektorovom priestore, tak by sme asi potrebovali zdôvodniť nejaké takéto veci:

Nech $f\colon V\to W$ je izomorfizmus vektorových priestorov. Potom platí:

Vektory $\vec a_1,\dots,\vec a_n$ tvoria bázu vo $V$ p.v.k. $f(\vec a_1),\dots,f(\vec a_n)$ je báza vo $W$.
Ak vektor $\vec x$ má súradnice $X$ vzhľadom na bázu $\vec a_1,\dots,\vec a_n$, tak $X$ sú aj súradnice vektora $f(\vec x)$ vzhľadom na bázu $f(\vec a_1),\dots,f(\vec a_n)$.
Ak $P$ je matica prechodu od bázy $\vec a_1,\dots,\vec a_n$ k báze $\vec b_1,\dots,\vec b_n$ (v priestore $V$), tak $P$ je aj matica prechodu od bázy $f(\vec a_1),\dots,f(\vec a_n)$ k báze $f(\vec b_1),\dots,f(\vec b_n)$.

Každopádne aj keď vieme takto nejaké veci z $F^n$ preniesť na ľubovoľný konečnorozmerný priestor, nie je na škodu rozmyslieť si, či ich vieme zdôvodniť bez počítania so súradnicami. (T.j. zdôvodniť ich bez použitia $F^n$.)

Martin Sleziak · Post by **Martin Sleziak** » Fri Apr 10, 2020 4:03 pm

Zmena súradníc a matica zobrazenia.$\newcommand{\inv}[1]{{#1}^{-1}}
\newcommand{\vek}[1]{\vec{#1}}
\newcommand{\Vdots}[3]{\vek{#1}_{#2},\dots,\vek{#1}_{#3}}
\newcommand{\Vddots}[4]{\vek{#1}_{#2},\vek{#1}_{#3},\dots,\vek{#1}_{#4}}
\newcommand{\LKdots}[4]{#1_{#3} \vek{#2}_{#3} +\dots+#1_{#4}\vek{#2}_{#4}}
\newcommand{\LKddots}[5]{#1_{#3} \vek{#2}_{#3} + #1_{#4}\vek{#2}_{#4} + \dots+#1_{#5}\vek{#2}_{#5}}$

Tu je nám to, že sme veci zapisovali pomocou matíc a robili iba v $F^n$ nedá nič nové - všeobecné odvodenie je rovnaké ako tento špeciálny prípad.. Ale pre úplnosť sa skúsme pozrieť aj na toto.

Pripomeňme, že matica zobrazenia $f\colon F^n\to F^n$ vzhľadom na bázu $\Vdots a1n$ je matica, ktorej $i$-ty riadok obsahuje súradnice vektora $f(\vec a_i)$ v báze $\Vdots a1n$.

Fakt: Ak $M$ je matica zobrazenia pri báze $\Vdots a1n$ a vektor $\vec x$ má v tejto báze súradnice $X=(x_1,\dots,x_n)$, tak súradnice vektora $f(\vec x)$ sa dajú vyjadriť ako $XM$.

Ak máme aj bázu $\Vdots b1n$ a matica prechodu od $\Vdots a1n$ k $\Vdots b1n$, tak sa môžeme pozrieť na vektory $\vec x$ a $f(\vec x)$ v oboch bázach.

Označme si $X_s$, $X_n$ súradnice vektora $\vec x$ vzhľadom na $\Vdots a1n$ a na $\Vdots b1n$. Takisto si označme $M_s$ a $M_n$ matice zobrazenia pri jednej aj druhej báze. Ak použijeme vyššie uvedený fakt, ktorý nám hovorí ako sa menia súradnice zobrazením $f$, tak máme
\begin{gather*}
\vec x = X_sA=X_nB,\\
f(\vec x)=X_sM_sA=X_nM_nB.
\end{gather*}
(Použili sme to, že súradnice vektora $f(\vec x)$ sú $XM$.)

Ak v poslednej rovnosti ešte použijeme $B=PA$ a $X_s=X_nP$, tak máme
\begin{align*}
X_sM_sA&=X_nM_nB\\
X_nPM_sA&=X_nM_nPA\\
X_nPM_s&=X_nM_nP
\end{align*}
To že táto rovnosť platí pre ľubovoľnú usporiadanú $n$-ticu $X_n$ nám dá takúto rovnosť matíc:
\begin{align*}
PM_s&=M_nP\\
M_s&=\inv PM_nP
\end{align*}

Martin Sleziak · Post by **Martin Sleziak** » Wed May 05, 2021 6:11 pm

Martin Sleziak wrote: ↑Fri Apr 10, 2020 4:03 pm Platí to aj všeobecne?

Zatiaľ sme všetko robili iba pre prípad $V=F^n$.
Dá sa nejako tento postup použiť aj pre iné konečnorozmerné priestory, alebo tam budeme musieť vymyslieť niečo iné?

Vyššie som napísal ako sa dá takéto niečo vyriešiť prenosom cez izomorfizmus.
Iná možnosť je skúsiť definovať "akoby matice" - čo bude jednoducho zápis pre $m$-ticu vektorov.
$$\mathbf{B}=\begin{pmatrix}\vec v_1\\\vec v_2\\\vdots\\\vec v_m\end{pmatrix}.$$
Aby sme ich odllíšili, označujeme takéto "akoby matice" boldom.

Takúto maticu má stále zmysel vynásobiť zľava maticou, ktorej prvky sú z $F$. Konkrétne to vlastne znamená, že matica $A\cdot \mathbf{B}$ má ako $i$-ty riadok lineárnu kombináciu $\sum_{j=1}^m a_{ij}\vec v_j$.

Mohli by sme si rozmyslieť, že platia podobné veci ako pre matice - t.j. funguje asociatívnosť a distributívnosť pre súčiny, ktoré majú zmysel.
\begin{gather*}
A(B\mathbf{C})=A(B\mathbf{C})\\
(A+B)\mathbf{C}\\
A(\mathbf{C}+\mathbf{D})
\end{gather*}
Nemáme síce k dispozícii inverznú "akoby maticu". Ale ak riadky sú lineárne nezávislé, tak môžeme krátiť. Vtedy platí
\begin{gather*}
A\mathbf{B}=\mathbf{0} \Longrightarrow A=0\\
A_1\mathbf{B}=A_2\mathbf{B} \Longrightarrow A_1=A_2
\end{gather*}

Ak by sme si takéto veci premysleli, tak veci ktoré sme napísali vyššie už budeme vedieť zdôvodniť aj pre matice, kde riadky sú vektory (a nie nutne usporiadané $k$-tice).

Niečo takéto môžete nájsť napríklad v knihe P. Zlatoš: Lineárna algebra a geometria - Cesta z troch rozmerov s presahmi do príbuzných odborov.
http://thales.doa.fmph.uniba.sk/zlatos/la/LAG_A4.pdf
Konkrétne ide o Paragraf 2.3 - Matice nad vektorovým priestorom.
Tam je to urobené o čosi všeobecnejšie ako to, čo potrebujeme tu - je to urobené spôsobom, ktorý zahŕňa prípady, keď vektory ukladáme do riadkov, do stĺpcov a súčasne aj blokové matice.

Martin Sleziak · Post by **Martin Sleziak** » Sat May 08, 2021 11:09 am

Môžeme sa pozrieť aj na to, ako takéto niečo môžeme použiť pre ortonormálne bázy.

Pripomeňme, že ortogonálne matice sú také štvorcové matice, pre ktoré platí $AA^T=I$.
Nasledujúce dva fakty sme už kedysi dokázali - keď sme overovali, že $O(n)$ je grupa. Aj tak si ich však môžeme pripomenúť.

Ak $A$, $B$ sú ortogonálne matice, tak aj ich súčin $AB$ je ortogonálna matica.

Spoiler:

Ak $A$ je ortogonálna matica, tak aj $A^{-1}$ je ortogonálna matica.

Spoiler:

Tiež si uvedomme, že nejaké vektory tvoria ortonormálnu bázu v $\mathbb R^n$ práve vtedy, keď matica, ktorá obsahuje tieto vektory ako riadky, je ortogonálna.

Ak teda máme nejaké dve ortonormálne bázy a poukladáme ich ako riadky do matíc $A$, $B$, tak pre maticu prechodu máme $B=PA$ a
$$P=B^{-1}A.$$
Vidíme teda, že $P$ je súčin dvoch ortogonálnych matíc, a teda je to ortogonálna matica.

Obrátene, ak máme ortogonálnu bázu a zostavíme z nej maticu $A$, tak rovnosti $B=PA$ dostaneme, že aj $B$ je ortogonálna matica. Čiže nová báza, ktorú vytvoríme takýmto spôsobom, je tiež ortonormálna. (A to isté by sme ľahko dokázali aj pri prechode opačným smerom.)

Teda sme takto vlastne ukázali trochu iný zápis dôkazu vety 16.2 z Korbaš-Gyurki. (Na prednáške bola táto veta tiež pod číslom 16.2.)

msleziak.com

Zmena súradníc - cez matice

Zmena súradníc - cez matice

Re: Zmena súradníc - cez matice

Re: Zmena súradníc - cez matice

Re: Zmena súradníc - cez matice

Re: Zmena súradníc - cez matice

Re: Zmena súradníc - cez matice