Zmena súradníc - cez matice

Moderators: Martin Sleziak, Ludovit_Balko, Martin Niepel, Tibor Macko

Post Reply
Martin Sleziak
Posts: 5830
Joined: Mon Jan 02, 2012 5:25 pm

Zmena súradníc - cez matice

Post by Martin Sleziak »

S prechodom medzi dvoma súradnicovými sústavami ste sa už stretli pri afinných podpriestoroch.
Viac sa budeme zaoberať niečím takýmto vo vektorových priestoroch - dôležité bude napríklad to, ako sa dajú vyjadriť matice toho istého zobrazenia vzhľadom na dve rôzne bázy, čo vedie k pojmu podobnosti matíc.

Tieto veci sú detailne vysvetlené v zelenej knižke (Korbaš-Gyurki) a budú aj na prednáške.

Skúsim aj tak napísať nejaké stručné poznámky, ktorý by mohli možno tiež dať užitočný vhľad do toho ako to funguje. (Resp. možno trochu iný pohľad na odvodenie niektorých vecí.)

Budem najprv pracovať iba v Fn, čiže menej všeobecne než na prednáške. Potom neskôr skúsim napísať niečo aj k tomu, či by sme nejako z tohoto špeciálneho prípadu vedeli dostať aj všeobecné tvrdenia o ľubovoľných vektorových priestoroch.
Martin Sleziak
Posts: 5830
Joined: Mon Jan 02, 2012 5:25 pm

Re: Zmena súradníc - cez matice

Post by Martin Sleziak »

Prechod v Fn cez matice

Budeme pracovať v priestore V=Fn.
Treba si dať pozor aby sme rozlišovali medzi vektorom a usporiadanou n-ticou ktorá predstavuje súradnice vektora vzhľadom na danú bázu. (Oboje sú v tomto prípade prvky z Fn.)
Keďže takéto označenie je aj v zelenej knihe, azda je rozumné keď sa budem držať toho, že x=(x1,,xn) budem označovať vektor, ale symbol X=(x1,,xn) použijem ak pôjde o súradnice. (V knihe je použité X, ale nechce sa mi zakaždým pridávať že to má byť boldom.)
Hlavne som chcel ale zdôrazniť, že usporiadané n-tice sa tu budú vyskytovať v dvoch rôznych významoch.

Zoberme si nejakú bázu (a1,a2,,an) a vytvorme maticu A, v ktorej budú tieto vektory ako riadky:
A=(a1a2an).

Fakt, že ide o bázu, môžeme ekvivalentne pomocou matíc povedať tak, že A je regulárna.

Súradnice vektora.

To, že nejaký vektor má vzhľadom na túto bázu súradnice X=(x1,x2,,xn) podľa definície znamená, že
x=x1a1+x2a2++xnan.

Môžeme ľahko skontrolovať, že toto je to isté ako maticová rovnosť
x=XA.
Spoiler:
(x1x2xn)(a1a2an)=x1a1+x2a2++xnan
Matica prechodu.

Máme teraz nejakú ďalšiu bázu b1,b2,,bn a opäť si vektory z tejto bázy poukladáme do riadkov matice P.
Keď porovnáte čo vznikne násobením matíc a ako bola definovaná matice prechodu od a1,a2,,an k b1,b2,,bn, tak by sa malo dať vidieť že ekvivalentne to môžeme povedať tak, že platí rovnosť
B=PA.
Spoiler:
Definícia matice prechodu od bázy a1,,an k báze b1,,bn:
b1=p11a1+p12a2++p1nanb2=p21a1+p22a2++p2nanbn=pn1a1+pn2a2++pnnan

To isté dostaneme roznásobením
PA=(p11p12p1np21p22p2npn1pn2pnn)(a1a2an),
i-ty riadok v tomto súčine skutočne vyjde pi1a1+pi2a2++pinan.
To že matica P je jednoznačne určená vieme z vlastností báz.
Ale aj ak sa pozrieme na uvedenú maticovú rovnosť, tak vidíme, že máme jedinú možnosť ako môže vyzerať matica P.
P=BA1.

Súčasne vidíme aj to, že matica P je regulárna, keďže sa rovná súčinu dvoch regulárnych matíc.

Tiež si môžeme všimnúť, že ak P je matica prechodu jedným smerom, tak máme
B=PAA=P1B,

čo nám hovorí, že P1 je matica prechodu opačným smerom (t.j. od b1,,bn k a1,,an).

Alebo napríklad ak P je matica prechodu od a1,,an k b1,,bn, P je matica prechodu od b1,,bn k c1,,cn, tak máme C=PB a B=PA, z čoho vidíme
C=PPA.

Teda matica prechodu od a1,,an k c1,,cn je súčin PP.

Alebo si tiež môžeme všimnúť, že ak P a A sú regulárne matice, tak aj B=PA je regulárna matica. Toto nám hovorí, že pre zadanú bázu a1,,an a regulárnu maticu P vieme takýmto spôsobom dostať novú bázu b1,,bn takú, že P je príslušná matica prechodu.

Zmena súradníc vektora.
Pozrime sa teraz na to, čo vieme povedať o súradniciach vektora ak sa pozeráme na dve rôzne bázy.
Majme maticu prechodu P od bázy a1,,an k b1,,bn. T.j. B=PA.
Označme si Xn súradnice vzhľadom na bázu b1,,bn a Xs súradnice vzhľadom na bázu a1,,an. (Indexy som dal na označenie "nové súradnice" a "staré súradnice", ak sa na maticu prechodu pozeráme tak, že je to matica prechodu od starých súradníc k novým.)
Čo by sme vedeli povedať o vzťahu medzi Xs a Xn?
To, že ide o súradnice vektora vzhľadom na nejakú bázu mi hovorí to, že
x=XsAx=XnB

Ak dosadíme B=PA do druhej z týchto rovností, tak máme x=XnPA, teda dostaneme:
XsA=XnPAXs=XnP

(Keďže A je regulárna, tak sme mohli rovnosť XsA=XnPA vynásobiť A1.)

Medzi týmito súradnicami teda máme vzťahy Xs=XnP alebo Xn=XsP1.
Martin Sleziak
Posts: 5830
Joined: Mon Jan 02, 2012 5:25 pm

Re: Zmena súradníc - cez matice

Post by Martin Sleziak »

Platí to aj všeobecne?

Zatiaľ sme všetko robili iba pre prípad V=Fn.
Dá sa nejako tento postup použiť aj pre iné konečnorozmerné priestory, alebo tam budeme musieť vymyslieť niečo iné?

Neformálny pohľad

Vieme, že ak V je konečnorozmerný a dim(V)=n, tak VFn.
Každý konečnorozmerný vektorový priestor je teda izomorfný s Fn pre nejaké n. Izomorfné vektorové priestory sú "v podstate rovnaké", vlastnosti ktoré vieme vyjadriť v reči vektorových priestorov musia teda platiť v jednom z nich práve vtedy, keď v druhom.

Formálnejšie zdôvodnenie

Keď by sme chceli trochu formálnejšie zapísať vlastnosti potrebné na to, aby sme z dôkazu uvedených tvrdení o maticiach prechodu pre Fn dostali zodpovedajúce tvrdenia v každom konečnorozmernom vektorovom priestore, tak by sme asi potrebovali zdôvodniť nejaké takéto veci:

Nech f:VW je izomorfizmus vektorových priestorov. Potom platí:
  • Vektory a1,,an tvoria bázu vo V p.v.k. f(a1),,f(an) je báza vo W.
  • Ak vektor x má súradnice X vzhľadom na bázu a1,,an, tak X sú aj súradnice vektora f(x) vzhľadom na bázu f(a1),,f(an).
  • Ak P je matica prechodu od bázy a1,,an k báze b1,,bn (v priestore V), tak P je aj matica prechodu od bázy f(a1),,f(an) k báze f(b1),,f(bn).
Každopádne aj keď vieme takto nejaké veci z Fn preniesť na ľubovoľný konečnorozmerný priestor, nie je na škodu rozmyslieť si, či ich vieme zdôvodniť bez počítania so súradnicami. (T.j. zdôvodniť ich bez použitia Fn.)
Martin Sleziak
Posts: 5830
Joined: Mon Jan 02, 2012 5:25 pm

Re: Zmena súradníc - cez matice

Post by Martin Sleziak »

Zmena súradníc a matica zobrazenia.

Tu je nám to, že sme veci zapisovali pomocou matíc a robili iba v Fn nedá nič nové - všeobecné odvodenie je rovnaké ako tento špeciálny prípad.. Ale pre úplnosť sa skúsme pozrieť aj na toto.

Pripomeňme, že matica zobrazenia f:FnFn vzhľadom na bázu a1,,an je matica, ktorej i-ty riadok obsahuje súradnice vektora f(ai) v báze a1,,an.

Fakt: Ak M je matica zobrazenia pri báze a1,,an a vektor x má v tejto báze súradnice X=(x1,,xn), tak súradnice vektora f(x) sa dajú vyjadriť ako XM.

Ak máme aj bázu b1,,bn a matica prechodu od a1,,an k b1,,bn, tak sa môžeme pozrieť na vektory x a f(x) v oboch bázach.

Označme si Xs, Xn súradnice vektora x vzhľadom na a1,,an a na b1,,bn. Takisto si označme Ms a Mn matice zobrazenia pri jednej aj druhej báze. Ak použijeme vyššie uvedený fakt, ktorý nám hovorí ako sa menia súradnice zobrazením f, tak máme
x=XsA=XnB,f(x)=XsMsA=XnMnB.

(Použili sme to, že súradnice vektora f(x)XM.)

Ak v poslednej rovnosti ešte použijeme B=PA a Xs=XnP, tak máme
XsMsA=XnMnBXnPMsA=XnMnPAXnPMs=XnMnP

To že táto rovnosť platí pre ľubovoľnú usporiadanú n-ticu Xn nám dá takúto rovnosť matíc:
PMs=MnPMs=P1MnP
Martin Sleziak
Posts: 5830
Joined: Mon Jan 02, 2012 5:25 pm

Re: Zmena súradníc - cez matice

Post by Martin Sleziak »

Martin Sleziak wrote: Fri Apr 10, 2020 4:03 pm Platí to aj všeobecne?

Zatiaľ sme všetko robili iba pre prípad V=Fn.
Dá sa nejako tento postup použiť aj pre iné konečnorozmerné priestory, alebo tam budeme musieť vymyslieť niečo iné?
Vyššie som napísal ako sa dá takéto niečo vyriešiť prenosom cez izomorfizmus.
Iná možnosť je skúsiť definovať "akoby matice" - čo bude jednoducho zápis pre m-ticu vektorov.
B=(v1v2vm).

Aby sme ich odllíšili, označujeme takéto "akoby matice" boldom.

Takúto maticu má stále zmysel vynásobiť zľava maticou, ktorej prvky sú z F. Konkrétne to vlastne znamená, že matica AB má ako i-ty riadok lineárnu kombináciu mj=1aijvj.

Mohli by sme si rozmyslieť, že platia podobné veci ako pre matice - t.j. funguje asociatívnosť a distributívnosť pre súčiny, ktoré majú zmysel.
A(BC)=A(BC)(A+B)CA(C+D)

Nemáme síce k dispozícii inverznú "akoby maticu". Ale ak riadky sú lineárne nezávislé, tak môžeme krátiť. Vtedy platí
AB=0A=0A1B=A2BA1=A2


Ak by sme si takéto veci premysleli, tak veci ktoré sme napísali vyššie už budeme vedieť zdôvodniť aj pre matice, kde riadky sú vektory (a nie nutne usporiadané k-tice).

Niečo takéto môžete nájsť napríklad v knihe P. Zlatoš: Lineárna algebra a geometria - Cesta z troch rozmerov s presahmi do príbuzných odborov.
http://thales.doa.fmph.uniba.sk/zlatos/la/LAG_A4.pdf
Konkrétne ide o Paragraf 2.3 - Matice nad vektorovým priestorom.
Tam je to urobené o čosi všeobecnejšie ako to, čo potrebujeme tu - je to urobené spôsobom, ktorý zahŕňa prípady, keď vektory ukladáme do riadkov, do stĺpcov a súčasne aj blokové matice.
Martin Sleziak
Posts: 5830
Joined: Mon Jan 02, 2012 5:25 pm

Re: Zmena súradníc - cez matice

Post by Martin Sleziak »

Môžeme sa pozrieť aj na to, ako takéto niečo môžeme použiť pre ortonormálne bázy.

Pripomeňme, že ortogonálne matice sú také štvorcové matice, pre ktoré platí AAT=I.
Nasledujúce dva fakty sme už kedysi dokázali - keď sme overovali, že O(n) je grupa. Aj tak si ich však môžeme pripomenúť.

Ak A, B sú ortogonálne matice, tak aj ich súčin AB je ortogonálna matica.
Spoiler:
Ak platí AAT=BBT=I, tak dostaneme AB(AB)T=ABBTAT=AAT=I.
Ak A je ortogonálna matica, tak aj A1 je ortogonálna matica.
Spoiler:
Z rovnosti AAT=I vidíme aj to, že ATA=I a A1=AT. (Všeobecne vieme, že z AB=I pre štvorcové matice už vyplýva BA=I: viewtopic.php?t=1368 )
Dostali sme teda vlastne AT(AT)T=I, čo je definícia ortogonálnej matice aplikovaná na A1=AT.
Tiež si uvedomme, že nejaké vektory tvoria ortonormálnu bázu v Rn práve vtedy, keď matica, ktorá obsahuje tieto vektory ako riadky, je ortogonálna.

Ak teda máme nejaké dve ortonormálne bázy a poukladáme ich ako riadky do matíc A, B, tak pre maticu prechodu máme B=PA a
P=B1A.

Vidíme teda, že P je súčin dvoch ortogonálnych matíc, a teda je to ortogonálna matica.

Obrátene, ak máme ortogonálnu bázu a zostavíme z nej maticu A, tak rovnosti B=PA dostaneme, že aj B je ortogonálna matica. Čiže nová báza, ktorú vytvoríme takýmto spôsobom, je tiež ortonormálna. (A to isté by sme ľahko dokázali aj pri prechode opačným smerom.)

Teda sme takto vlastne ukázali trochu iný zápis dôkazu vety 16.2 z Korbaš-Gyurki. (Na prednáške bola táto veta tiež pod číslom 16.2.)
Post Reply