S prechodom medzi dvoma súradnicovými sústavami ste sa už stretli pri afinných podpriestoroch.
Viac sa budeme zaoberať niečím takýmto vo vektorových priestoroch - dôležité bude napríklad to, ako sa dajú vyjadriť matice toho istého zobrazenia vzhľadom na dve rôzne bázy, čo vedie k pojmu podobnosti matíc.
Tieto veci sú detailne vysvetlené v zelenej knižke (Korbaš-Gyurki) a budú aj na prednáške.
Skúsim aj tak napísať nejaké stručné poznámky, ktorý by mohli možno tiež dať užitočný vhľad do toho ako to funguje. (Resp. možno trochu iný pohľad na odvodenie niektorých vecí.)
Budem najprv pracovať iba v Fn, čiže menej všeobecne než na prednáške. Potom neskôr skúsim napísať niečo aj k tomu, či by sme nejako z tohoto špeciálneho prípadu vedeli dostať aj všeobecné tvrdenia o ľubovoľných vektorových priestoroch.
Zmena súradníc - cez matice
Moderators: Martin Sleziak, Ludovit_Balko, Martin Niepel, Tibor Macko
-
- Posts: 5830
- Joined: Mon Jan 02, 2012 5:25 pm
Re: Zmena súradníc - cez matice
Prechod v Fn cez matice
Budeme pracovať v priestore V=Fn.
Treba si dať pozor aby sme rozlišovali medzi vektorom a usporiadanou n-ticou ktorá predstavuje súradnice vektora vzhľadom na danú bázu. (Oboje sú v tomto prípade prvky z Fn.)
Keďže takéto označenie je aj v zelenej knihe, azda je rozumné keď sa budem držať toho, že →x=(x1,…,xn) budem označovať vektor, ale symbol X=(x1,…,xn) použijem ak pôjde o súradnice. (V knihe je použité X, ale nechce sa mi zakaždým pridávať že to má byť boldom.)
Hlavne som chcel ale zdôrazniť, že usporiadané n-tice sa tu budú vyskytovať v dvoch rôznych významoch.
Zoberme si nejakú bázu (→a1,→a2,…,→an) a vytvorme maticu A, v ktorej budú tieto vektory ako riadky:
A=(→a1→a2⋮→an).
Fakt, že ide o bázu, môžeme ekvivalentne pomocou matíc povedať tak, že A je regulárna.
Súradnice vektora.
To, že nejaký vektor má vzhľadom na túto bázu súradnice X=(x1,x2,…,xn) podľa definície znamená, že
→x=x1→a1+x2→a2+⋯+xn→an.
Môžeme ľahko skontrolovať, že toto je to isté ako maticová rovnosť
→x=XA.
Matica prechodu.
Máme teraz nejakú ďalšiu bázu →b1,→b2,…,→bn a opäť si vektory z tejto bázy poukladáme do riadkov matice P.
Keď porovnáte čo vznikne násobením matíc a ako bola definovaná matice prechodu od →a1,→a2,…,→an k →b1,→b2,…,→bn, tak by sa malo dať vidieť že ekvivalentne to môžeme povedať tak, že platí rovnosť
B=PA.
To že matica P je jednoznačne určená vieme z vlastností báz.
Ale aj ak sa pozrieme na uvedenú maticovú rovnosť, tak vidíme, že máme jedinú možnosť ako môže vyzerať matica P.
P=BA−1.
Súčasne vidíme aj to, že matica P je regulárna, keďže sa rovná súčinu dvoch regulárnych matíc.
Tiež si môžeme všimnúť, že ak P je matica prechodu jedným smerom, tak máme
B=PA⇒A=P−1B,
čo nám hovorí, že P−1 je matica prechodu opačným smerom (t.j. od →b1,…,→bn k →a1,…,→an).
Alebo napríklad ak P je matica prechodu od →a1,…,→an k →b1,…,→bn, P′ je matica prechodu od →b1,…,→bn k →c1,…,→cn, tak máme C=P′B a B=PA, z čoho vidíme
C=P′PA.
Teda matica prechodu od →a1,…,→an k →c1,…,→cn je súčin P′P.
Alebo si tiež môžeme všimnúť, že ak P a A sú regulárne matice, tak aj B=PA je regulárna matica. Toto nám hovorí, že pre zadanú bázu →a1,…,→an a regulárnu maticu P vieme takýmto spôsobom dostať novú bázu →b1,…,→bn takú, že P je príslušná matica prechodu.
Zmena súradníc vektora.
Pozrime sa teraz na to, čo vieme povedať o súradniciach vektora ak sa pozeráme na dve rôzne bázy.
Majme maticu prechodu P od bázy →a1,…,→an k →b1,…,→bn. T.j. B=PA.
Označme si Xn súradnice vzhľadom na bázu →b1,…,→bn a Xs súradnice vzhľadom na bázu →a1,…,→an. (Indexy som dal na označenie "nové súradnice" a "staré súradnice", ak sa na maticu prechodu pozeráme tak, že je to matica prechodu od starých súradníc k novým.)
Čo by sme vedeli povedať o vzťahu medzi Xs a Xn?
To, že ide o súradnice vektora vzhľadom na nejakú bázu mi hovorí to, že
→x=XsA→x=XnB
Ak dosadíme B=PA do druhej z týchto rovností, tak máme →x=XnPA, teda dostaneme:
XsA=XnPAXs=XnP
(Keďže A je regulárna, tak sme mohli rovnosť XsA=XnPA vynásobiť A−1.)
Medzi týmito súradnicami teda máme vzťahy Xs=XnP alebo Xn=XsP−1.
Budeme pracovať v priestore V=Fn.
Treba si dať pozor aby sme rozlišovali medzi vektorom a usporiadanou n-ticou ktorá predstavuje súradnice vektora vzhľadom na danú bázu. (Oboje sú v tomto prípade prvky z Fn.)
Keďže takéto označenie je aj v zelenej knihe, azda je rozumné keď sa budem držať toho, že →x=(x1,…,xn) budem označovať vektor, ale symbol X=(x1,…,xn) použijem ak pôjde o súradnice. (V knihe je použité X, ale nechce sa mi zakaždým pridávať že to má byť boldom.)
Hlavne som chcel ale zdôrazniť, že usporiadané n-tice sa tu budú vyskytovať v dvoch rôznych významoch.
Zoberme si nejakú bázu (→a1,→a2,…,→an) a vytvorme maticu A, v ktorej budú tieto vektory ako riadky:
A=(→a1→a2⋮→an).
Fakt, že ide o bázu, môžeme ekvivalentne pomocou matíc povedať tak, že A je regulárna.
Súradnice vektora.
To, že nejaký vektor má vzhľadom na túto bázu súradnice X=(x1,x2,…,xn) podľa definície znamená, že
→x=x1→a1+x2→a2+⋯+xn→an.
Môžeme ľahko skontrolovať, že toto je to isté ako maticová rovnosť
→x=XA.
Spoiler:
Máme teraz nejakú ďalšiu bázu →b1,→b2,…,→bn a opäť si vektory z tejto bázy poukladáme do riadkov matice P.
Keď porovnáte čo vznikne násobením matíc a ako bola definovaná matice prechodu od →a1,→a2,…,→an k →b1,→b2,…,→bn, tak by sa malo dať vidieť že ekvivalentne to môžeme povedať tak, že platí rovnosť
B=PA.
Spoiler:
Ale aj ak sa pozrieme na uvedenú maticovú rovnosť, tak vidíme, že máme jedinú možnosť ako môže vyzerať matica P.
P=BA−1.
Súčasne vidíme aj to, že matica P je regulárna, keďže sa rovná súčinu dvoch regulárnych matíc.
Tiež si môžeme všimnúť, že ak P je matica prechodu jedným smerom, tak máme
B=PA⇒A=P−1B,
čo nám hovorí, že P−1 je matica prechodu opačným smerom (t.j. od →b1,…,→bn k →a1,…,→an).
Alebo napríklad ak P je matica prechodu od →a1,…,→an k →b1,…,→bn, P′ je matica prechodu od →b1,…,→bn k →c1,…,→cn, tak máme C=P′B a B=PA, z čoho vidíme
C=P′PA.
Teda matica prechodu od →a1,…,→an k →c1,…,→cn je súčin P′P.
Alebo si tiež môžeme všimnúť, že ak P a A sú regulárne matice, tak aj B=PA je regulárna matica. Toto nám hovorí, že pre zadanú bázu →a1,…,→an a regulárnu maticu P vieme takýmto spôsobom dostať novú bázu →b1,…,→bn takú, že P je príslušná matica prechodu.
Zmena súradníc vektora.
Pozrime sa teraz na to, čo vieme povedať o súradniciach vektora ak sa pozeráme na dve rôzne bázy.
Majme maticu prechodu P od bázy →a1,…,→an k →b1,…,→bn. T.j. B=PA.
Označme si Xn súradnice vzhľadom na bázu →b1,…,→bn a Xs súradnice vzhľadom na bázu →a1,…,→an. (Indexy som dal na označenie "nové súradnice" a "staré súradnice", ak sa na maticu prechodu pozeráme tak, že je to matica prechodu od starých súradníc k novým.)
Čo by sme vedeli povedať o vzťahu medzi Xs a Xn?
To, že ide o súradnice vektora vzhľadom na nejakú bázu mi hovorí to, že
→x=XsA→x=XnB
Ak dosadíme B=PA do druhej z týchto rovností, tak máme →x=XnPA, teda dostaneme:
XsA=XnPAXs=XnP
(Keďže A je regulárna, tak sme mohli rovnosť XsA=XnPA vynásobiť A−1.)
Medzi týmito súradnicami teda máme vzťahy Xs=XnP alebo Xn=XsP−1.
-
- Posts: 5830
- Joined: Mon Jan 02, 2012 5:25 pm
Re: Zmena súradníc - cez matice
Platí to aj všeobecne?
Zatiaľ sme všetko robili iba pre prípad V=Fn.
Dá sa nejako tento postup použiť aj pre iné konečnorozmerné priestory, alebo tam budeme musieť vymyslieť niečo iné?
Neformálny pohľad
Vieme, že ak V je konečnorozmerný a dim(V)=n, tak V≅Fn.
Každý konečnorozmerný vektorový priestor je teda izomorfný s Fn pre nejaké n. Izomorfné vektorové priestory sú "v podstate rovnaké", vlastnosti ktoré vieme vyjadriť v reči vektorových priestorov musia teda platiť v jednom z nich práve vtedy, keď v druhom.
Formálnejšie zdôvodnenie
Keď by sme chceli trochu formálnejšie zapísať vlastnosti potrebné na to, aby sme z dôkazu uvedených tvrdení o maticiach prechodu pre Fn dostali zodpovedajúce tvrdenia v každom konečnorozmernom vektorovom priestore, tak by sme asi potrebovali zdôvodniť nejaké takéto veci:
Nech f:V→W je izomorfizmus vektorových priestorov. Potom platí:
Zatiaľ sme všetko robili iba pre prípad V=Fn.
Dá sa nejako tento postup použiť aj pre iné konečnorozmerné priestory, alebo tam budeme musieť vymyslieť niečo iné?
Neformálny pohľad
Vieme, že ak V je konečnorozmerný a dim(V)=n, tak V≅Fn.
Každý konečnorozmerný vektorový priestor je teda izomorfný s Fn pre nejaké n. Izomorfné vektorové priestory sú "v podstate rovnaké", vlastnosti ktoré vieme vyjadriť v reči vektorových priestorov musia teda platiť v jednom z nich práve vtedy, keď v druhom.
Formálnejšie zdôvodnenie
Keď by sme chceli trochu formálnejšie zapísať vlastnosti potrebné na to, aby sme z dôkazu uvedených tvrdení o maticiach prechodu pre Fn dostali zodpovedajúce tvrdenia v každom konečnorozmernom vektorovom priestore, tak by sme asi potrebovali zdôvodniť nejaké takéto veci:
Nech f:V→W je izomorfizmus vektorových priestorov. Potom platí:
- Vektory →a1,…,→an tvoria bázu vo V p.v.k. f(→a1),…,f(→an) je báza vo W.
- Ak vektor →x má súradnice X vzhľadom na bázu →a1,…,→an, tak X sú aj súradnice vektora f(→x) vzhľadom na bázu f(→a1),…,f(→an).
- Ak P je matica prechodu od bázy →a1,…,→an k báze →b1,…,→bn (v priestore V), tak P je aj matica prechodu od bázy f(→a1),…,f(→an) k báze f(→b1),…,f(→bn).
-
- Posts: 5830
- Joined: Mon Jan 02, 2012 5:25 pm
Re: Zmena súradníc - cez matice
Zmena súradníc a matica zobrazenia.
Tu je nám to, že sme veci zapisovali pomocou matíc a robili iba v Fn nedá nič nové - všeobecné odvodenie je rovnaké ako tento špeciálny prípad.. Ale pre úplnosť sa skúsme pozrieť aj na toto.
Pripomeňme, že matica zobrazenia f:Fn→Fn vzhľadom na bázu →a1,…,→an je matica, ktorej i-ty riadok obsahuje súradnice vektora f(→ai) v báze →a1,…,→an.
Fakt: Ak M je matica zobrazenia pri báze →a1,…,→an a vektor →x má v tejto báze súradnice X=(x1,…,xn), tak súradnice vektora f(→x) sa dajú vyjadriť ako XM.
Ak máme aj bázu →b1,…,→bn a matica prechodu od →a1,…,→an k →b1,…,→bn, tak sa môžeme pozrieť na vektory →x a f(→x) v oboch bázach.
Označme si Xs, Xn súradnice vektora →x vzhľadom na →a1,…,→an a na →b1,…,→bn. Takisto si označme Ms a Mn matice zobrazenia pri jednej aj druhej báze. Ak použijeme vyššie uvedený fakt, ktorý nám hovorí ako sa menia súradnice zobrazením f, tak máme
→x=XsA=XnB,f(→x)=XsMsA=XnMnB.
(Použili sme to, že súradnice vektora f(→x) sú XM.)
Ak v poslednej rovnosti ešte použijeme B=PA a Xs=XnP, tak máme
XsMsA=XnMnBXnPMsA=XnMnPAXnPMs=XnMnP
To že táto rovnosť platí pre ľubovoľnú usporiadanú n-ticu Xn nám dá takúto rovnosť matíc:
PMs=MnPMs=P−1MnP
Tu je nám to, že sme veci zapisovali pomocou matíc a robili iba v Fn nedá nič nové - všeobecné odvodenie je rovnaké ako tento špeciálny prípad.. Ale pre úplnosť sa skúsme pozrieť aj na toto.
Pripomeňme, že matica zobrazenia f:Fn→Fn vzhľadom na bázu →a1,…,→an je matica, ktorej i-ty riadok obsahuje súradnice vektora f(→ai) v báze →a1,…,→an.
Fakt: Ak M je matica zobrazenia pri báze →a1,…,→an a vektor →x má v tejto báze súradnice X=(x1,…,xn), tak súradnice vektora f(→x) sa dajú vyjadriť ako XM.
Ak máme aj bázu →b1,…,→bn a matica prechodu od →a1,…,→an k →b1,…,→bn, tak sa môžeme pozrieť na vektory →x a f(→x) v oboch bázach.
Označme si Xs, Xn súradnice vektora →x vzhľadom na →a1,…,→an a na →b1,…,→bn. Takisto si označme Ms a Mn matice zobrazenia pri jednej aj druhej báze. Ak použijeme vyššie uvedený fakt, ktorý nám hovorí ako sa menia súradnice zobrazením f, tak máme
→x=XsA=XnB,f(→x)=XsMsA=XnMnB.
(Použili sme to, že súradnice vektora f(→x) sú XM.)
Ak v poslednej rovnosti ešte použijeme B=PA a Xs=XnP, tak máme
XsMsA=XnMnBXnPMsA=XnMnPAXnPMs=XnMnP
To že táto rovnosť platí pre ľubovoľnú usporiadanú n-ticu Xn nám dá takúto rovnosť matíc:
PMs=MnPMs=P−1MnP
-
- Posts: 5830
- Joined: Mon Jan 02, 2012 5:25 pm
Re: Zmena súradníc - cez matice
Vyššie som napísal ako sa dá takéto niečo vyriešiť prenosom cez izomorfizmus.Martin Sleziak wrote: ↑Fri Apr 10, 2020 4:03 pm Platí to aj všeobecne?
Zatiaľ sme všetko robili iba pre prípad V=Fn.
Dá sa nejako tento postup použiť aj pre iné konečnorozmerné priestory, alebo tam budeme musieť vymyslieť niečo iné?
Iná možnosť je skúsiť definovať "akoby matice" - čo bude jednoducho zápis pre m-ticu vektorov.
B=(→v1→v2⋮→vm).
Aby sme ich odllíšili, označujeme takéto "akoby matice" boldom.
Takúto maticu má stále zmysel vynásobiť zľava maticou, ktorej prvky sú z F. Konkrétne to vlastne znamená, že matica A⋅B má ako i-ty riadok lineárnu kombináciu ∑mj=1aij→vj.
Mohli by sme si rozmyslieť, že platia podobné veci ako pre matice - t.j. funguje asociatívnosť a distributívnosť pre súčiny, ktoré majú zmysel.
A(BC)=A(BC)(A+B)CA(C+D)
Nemáme síce k dispozícii inverznú "akoby maticu". Ale ak riadky sú lineárne nezávislé, tak môžeme krátiť. Vtedy platí
AB=0⟹A=0A1B=A2B⟹A1=A2
Ak by sme si takéto veci premysleli, tak veci ktoré sme napísali vyššie už budeme vedieť zdôvodniť aj pre matice, kde riadky sú vektory (a nie nutne usporiadané k-tice).
Niečo takéto môžete nájsť napríklad v knihe P. Zlatoš: Lineárna algebra a geometria - Cesta z troch rozmerov s presahmi do príbuzných odborov.
http://thales.doa.fmph.uniba.sk/zlatos/la/LAG_A4.pdf
Konkrétne ide o Paragraf 2.3 - Matice nad vektorovým priestorom.
Tam je to urobené o čosi všeobecnejšie ako to, čo potrebujeme tu - je to urobené spôsobom, ktorý zahŕňa prípady, keď vektory ukladáme do riadkov, do stĺpcov a súčasne aj blokové matice.
-
- Posts: 5830
- Joined: Mon Jan 02, 2012 5:25 pm
Re: Zmena súradníc - cez matice
Môžeme sa pozrieť aj na to, ako takéto niečo môžeme použiť pre ortonormálne bázy.
Pripomeňme, že ortogonálne matice sú také štvorcové matice, pre ktoré platí AAT=I.
Nasledujúce dva fakty sme už kedysi dokázali - keď sme overovali, že O(n) je grupa. Aj tak si ich však môžeme pripomenúť.
Ak A, B sú ortogonálne matice, tak aj ich súčin AB je ortogonálna matica.
Ak A je ortogonálna matica, tak aj A−1 je ortogonálna matica.
Tiež si uvedomme, že nejaké vektory tvoria ortonormálnu bázu v Rn práve vtedy, keď matica, ktorá obsahuje tieto vektory ako riadky, je ortogonálna.
Ak teda máme nejaké dve ortonormálne bázy a poukladáme ich ako riadky do matíc A, B, tak pre maticu prechodu máme B=PA a
P=B−1A.
Vidíme teda, že P je súčin dvoch ortogonálnych matíc, a teda je to ortogonálna matica.
Obrátene, ak máme ortogonálnu bázu a zostavíme z nej maticu A, tak rovnosti B=PA dostaneme, že aj B je ortogonálna matica. Čiže nová báza, ktorú vytvoríme takýmto spôsobom, je tiež ortonormálna. (A to isté by sme ľahko dokázali aj pri prechode opačným smerom.)
Teda sme takto vlastne ukázali trochu iný zápis dôkazu vety 16.2 z Korbaš-Gyurki. (Na prednáške bola táto veta tiež pod číslom 16.2.)
Pripomeňme, že ortogonálne matice sú také štvorcové matice, pre ktoré platí AAT=I.
Nasledujúce dva fakty sme už kedysi dokázali - keď sme overovali, že O(n) je grupa. Aj tak si ich však môžeme pripomenúť.
Ak A, B sú ortogonálne matice, tak aj ich súčin AB je ortogonálna matica.
Spoiler:
Spoiler:
Ak teda máme nejaké dve ortonormálne bázy a poukladáme ich ako riadky do matíc A, B, tak pre maticu prechodu máme B=PA a
P=B−1A.
Vidíme teda, že P je súčin dvoch ortogonálnych matíc, a teda je to ortogonálna matica.
Obrátene, ak máme ortogonálnu bázu a zostavíme z nej maticu A, tak rovnosti B=PA dostaneme, že aj B je ortogonálna matica. Čiže nová báza, ktorú vytvoríme takýmto spôsobom, je tiež ortonormálna. (A to isté by sme ľahko dokázali aj pri prechode opačným smerom.)
Teda sme takto vlastne ukázali trochu iný zápis dôkazu vety 16.2 z Korbaš-Gyurki. (Na prednáške bola táto veta tiež pod číslom 16.2.)