Ak platí $A^2=A$, tak stopa sa rovná hodnosti

Moderators: Martin Sleziak, Ludovit_Balko, Martin Niepel, Tibor Macko

Post Reply
Martin Sleziak
Posts: 5689
Joined: Mon Jan 02, 2012 5:25 pm

Ak platí $A^2=A$, tak stopa sa rovná hodnosti

Post by Martin Sleziak »

Tvrdenie. Ak $A$ je matica $n\times n$ nad poľom $\mathbb C$ taká, že $A^2=A$, tak platí$\newcommand{\Tra}{\operatorname{Tr}}\newcommand{\inv}[1]{{#1}^{-1}}$
$$\Tra(A)=h(A).$$

Podobný výsledok sme spomínali pre ortogonálne projekcie: viewtopic.php?t=1781 - toto tvrdenie je o čosi všeobecnejšie.

Niečo k tomuto tvrdeniu tu niečo napíšem - a ako zvyčajne, pridám aj nejaké linky: Pripomeňme, že $\Tra(A)$ označuje stopu, t.j. súčet diagonálnych prvkov matice $A$.
Jedna z vlastností stopy, ktorá môže byť užitočná (a ktorá sa dá dokázať pomerne ľahko), je $\Tra(AB)=\Tra(BA)$.

Ak pre maticu $A$ platí $A^2=A$, tak hovoríme, že $A$ je matica projekcie. Je to nejaké zovšeobecnenie ortogonálnej projekcie. (Bolo by teda možno prirodzenejšie označiť ju $P$ ako projekcia. Keďže sa budeme na túto maticu pozerať v rôznych bázach a sme zvyknutí používať $P$ pre maticu prechodu, tak som radšej použil iné písmenko.)

Iný názov, ktorý ste mohli stretnúť aj v iných kontextoch, je že $A$ je idempotentná matica

Na formuláciu tohto tvrdenia netreba vedieť nič viac než to, čo je súčin matíc, čo je hodnosť a čo je stopa. Zdôvodnenie tejto rovnosti je však určite výrazne jednoduchšie, ak pri tom použijeme nejaké veci, ktoré sme sa naučili v druhej časti LS.

Napríklad jedna z vecí, ktoré nám môžu pomôcť je, ak vieme ukázať, že každá takáto matica bude diagonalizovateľná. T.j. ak vieme, že $A=PD\inv P$ pre nejakú regulárnu maticu $D$.
Vedeli by ste dokázať uvedené tvrdenie, ak máme zadané, že $A$ je diagonalizovateľná?
Spoiler:
Ak $A$ a $D$ sú podobné, tak platí: $\Tra(A)=\Tra(D)$, $h(A)=h(D)$. Stačí nám teda nejako dokázať, že $\Tra(D)=h(D)$.

Súčasne máme
$$D^2=(\inv PAP)^2=\inv PA^2P = \inv PAP=D$$
Z rovnosti $D^2=D$ dostaneme, že $D$ je taká matica, ktorá má na diagonále iba nuly a jednotky. Pre takúto maticu skutočne platí, že hodnosť je rovná počte jednotiek na diagonále, čiže je to to isté ako stopa:
$$\Tra(D)=h(D).$$
Takmer to isté, ale povedané trochu inak -- diagonalizovateľnosť znamená existenciu bázy $\vec b_1,\dots,\vec b_n$ a čísel $d_1,\dots,d_n$, pre ktoré platí
$$\vec b_iA=d_i\vec b_i.$$
Z tohto by sme pri troche rozmýšľania tiež mali byť schopní dostať rovnosť hodnosti a stopy.
Spoiler:
Označme $D=\operatorname{diag}(d_1,\dots,d_n)$. Matice $A$ a $D$ sú podobné, teda majú rovnakú stopu a rovnakú hodnosť. Stačí teda ukázať, že $\Tra(D)=h(D)$.
Ak sa pozeráme na zobrazenie $f(\vec x)=\vec xA$, tak máme
$$f\circ f(\vec x)=\vec xA^2=\vec xA=f(\vec x)$$
pre každý vektor $\vec x$.
Špeciálne pre bázové vektory dostaneme
\begin{align*}
f\circ f(\vec b_i)&=f(\vec b_i)\\
d_i^2\vec b_i&=d_i\vec b_i\\
d_i^2&=d_i
\end{align*}
Opäť sme dostali, že $D$ je diagonálna matica taká, že pre diagonálne prvky platí $d_i\in\{0,1\}$. A teda $h(D)=\Tra(D)$.
Keď sme teda videli, že z diagonalizovateľnosti už dokážeme uvedené tvrdenie ľahko, tak nám vlastne stačí už rozmýšľať nad tým, ako zdôvodníme, že $A$ je diagonalizovateľná.
Samozrejme, nie je na škodu skúsiť sa zamyslieť aj nad inými riešeniami. (T.j. zamyslieť sa, či by sme vedeli nejako zdôvodniť to isté aj skôr - keď sme ešte nič nepočuli o zmene bázy, diagonalizovateľných maticiach, atď.)
Martin Sleziak
Posts: 5689
Joined: Mon Jan 02, 2012 5:25 pm

Ak $A^2=A$, tak $A$ je diagonalizovate¾ná

Post by Martin Sleziak »

Ak $A^2=A$, tak $A$ je diagonalizovate¾ná$\newcommand{\Tra}{\operatorname{Tr}}
\newcommand{\inv}[1]{{#1}^{-1}}$

Napríklad to môžeme ukázať výberom vhodnej bázy.
Vedeli by ste vymyslieť nejakú peknú bázu $\mathbb C^n$ pri ktorej bude mať zobrazenie $\vec x\mapsto \vec xP$ veľmi jednoduchú maticu?

Hint 1:
Viete nájsť nejaké vektory, pre ktoré $\vec xA=\vec x$?

Detailnejší hint 1:
Spoiler:
Skúste sa pozrie na riadky matice $A$.
Kompletná odpoveď na hint 1:
Spoiler:
Všimnime si, že ak $\vec x_1,\dots,\vec x_n$ si oznaèíme riadky matice $A$, tak rovnos $A^2=A$ vlastne znamená, že
\begin{align*}
\begin{pmatrix}\vec x_1\\\vdots\\\vec x_n\end{pmatrix}P&=\begin{pmatrix}\vec x_1\\\vdots\\\vec x_n\end{pmatrix}\\
\begin{pmatrix}\vec x_1A\\\vdots\\\vec x_nA\end{pmatrix}&=\begin{pmatrix}\vec x_1\\\vdots\\\vec x_n\end{pmatrix}
\end{align*}
Keï sa pozrieme na jednotlivé riadky na ¾avej a pravej strane rovnosti, tak vidíme, že
$$\vec x_iA=\vec x_i$$
Hint 2: Vedeli by sme k vektorom, ktoré sme našli vyššie, pridať nejaké vektory spĺňajúce $\vec xA=\vec 0$ tak, aby sme dokopy mali nejakú bázu pozostávajúcu iba z vektorov takýchto dvoch typov?

Detailnejší hint 2:
Spoiler:
Ak sa pozeráme na vektory také, že $\vec xA=\vec 0$, tak vlastne pracujeme s jadrom zobrazenia $\vec x\mapsto\vec xA$. Čo vieme povedať o jadre tohoo zobrazenia na základe $h(A)$?

Iná možnosť: Vedeli by sme sa na podmienkou $\vec xA=\vec 0$ pozrie tak, že nám nieèo o takýchto vektoroch povie hodnos transponovanej matice $A^T$.
Kompletná odpoveď na hint 2:
Spoiler:
Pre zobrazenie $f\colon\vec x \mapsto \vec xA$ máme
$$\dim(\operatorname{Ker} f)=n-\dim(\operatorname{Im} f)=n-h(A)$$
teda v báze jadra máme presne toľko vektorov, koľko nám chýba.

To isté povedané inak: Jadro je množina riešení sústavy $A^T\vec x^T=\vec 0^T$, a teda pre dimenziu máme
$$\dim(\operatorname{Ker} f)=n-h(A^T)=n-h(A).$$
Na základe toho by sme už mohli zostaviť vhodnú bázu (a dostať to, že $A$ je diagonalizovateľná.)
Spoiler:
Stačí dať dokopy bázu $\operatorname{Im} f$ a bázu $\operatorname{Ker} f$.
Vektory z $\operatorname{Im} f$ sa po vynásobení maticou $A$ zobrazia na seba, vektory z $\operatorname{Ker} f$ sa zobrazia na nulu.
Teda máme $$\vec b_iA=d_i\vec b_i,$$ prièom $d_i$ je rovné $1$ alebo $0$.
Môžeme si všimnúť aj to, že pre maticu ortogonálnej projekcie vieme veľmi ľahko dostať bázu, v ktorej prislúchajúce zobrazenie vyzerá jednoducho; stačí zobrať bázu $S$ a bázu $S^\bot$ a dať ich dokopy.
Tu sme robili niečo podobné, ale keďže nešlo o ortogonálnu projekciu, tak k $S=\operatorname{Im}(A)$ sme potrebovali pridať iný podpriestor, nie $S^\bot$.

*****

Trochu iný dôkaz diagonalizovate¾nosti.

Mohli by ste skúsiť dokázať diagonalizovateľnosť matice $A$ takto:
Pozrieť sa na podpriestory $$S=\{\vec xA; \vec x\in\mathbb C^n\}\qquad\text{ a }\qquad T=\{\vec x(I-A); \vec x\in\mathbb C^n\}.$$
Ukázať postupne:
  • a) $\vec xA=\vec x$ pre $\vec x\in S$
  • b) $\vec xA=\vec0$ pre $\vec x\in T$;
  • c) $S\oplus T=V$;
  • d) Pozrieť sa na maticu pri báze zostavenej z bázy $S$ a bázy $T$.
Detaily jednotlivých krokov už nechám na vás.
Asi jediná vec, ktorá nie je úplne priamočiara, je zdôvodnenie, že $S\oplus T=V$.
Pomerne ľahko by sme mali dostať, že každý vektor je súčet vektora z $S$ a vektora z $T$.
Spoiler:
Máme $\vec x=\vec x(I-A)+\vec xA$.
Treba ešte ukázať, že $S\cap T=\{\vec0\}$.
Spoiler:
Ak $\vec y=\vec x_1A=\vec x_2(I-A)$, tak máme
\begin{align*}
\vec yA&=\vec x_1A^2=\vec x_1A=\vec y\\
\vec yA&==\vec x_2(I-A)A=\vec x_2A-=\vec x_2A^2=\vec x_2A-=\vec x_2A=\vec 0
\end{align*}
z čoho vidíme, že $\vec y=\vec 0$.
V princípe to nie je nejako výrazne odlišné riešenie od toho, čo je uvedené vyššie. Konkrétne si môžeme všimnúť, že $S=\operatorname{Im}(A)$ je presne podpriestor generovaný riadkami $A$; s týmto podpriestorom sme pracovali aj v predošlom riešení. Akurát vektory, ktoré sme pridali k báze $S$, sme teraz našli o trochu inak.
Martin Sleziak
Posts: 5689
Joined: Mon Jan 02, 2012 5:25 pm

Riešenie cez rozklad na súčin

Post by Martin Sleziak »

Riešenie cez rozklad na súčin

Ako som sľúbil vyššie, chceme sa pozrieť aj na dôkaz bez použitia diagonalizovateľnosti.

Takéto riešenie sa dá nájsť napríklad tu: Ja len stručne zhrniem jednotlivé kroky, aby ste sa mohli nad nimi skúsiť zamyslieť aj samostatne:
  • Ak $A$ je matica $n\times n$, ktorá má hodnosť $k$, tak existujú matice $B$ rozmerov $n\times k$ a $C$ rozmerov $k\times n$, také, že $$A=BC$$ a navyše $h(B)=h(C)=k$.
  • Ak matica $C$ má plnú stĺpcovú hodnosť, tak platia implikácie
    \begin{align*}
    ZC=0 &\Rightarrow Z=0\\
    XC=YC &\Rightarrow X=Y
    \end{align*}
    t.j. takouto maticou sa dá krátiť sprava.
  • Ak matica $B$ má plnú riadkovú hodnosť, tak platia implikácie
    \begin{align*}
    BZ=0 &\Rightarrow Z=0\\
    BX=BY &\Rightarrow X=Y
    \end{align*}
    t.j. takouto maticou sa dá krátiť zľava.
Z uvedených tvrdení (a z toho, čo už vieme o stope matice) by sa už malo dať poskladať celé riešenie. (A kompletné riešenie môžete nájsť na spomenutých linkách.)
Post Reply