Kedy sa polynóm rovná nule?

Moderators: Martin Sleziak, Ludovit_Balko, Martin Niepel, Tibor Macko

Post Reply
Martin Sleziak
Posts: 5517
Joined: Mon Jan 02, 2012 5:25 pm

Kedy sa polynóm rovná nule?

Post by Martin Sleziak »

Azda sa oplatí trochu zamyslieť nad tým, kedy sa dva polynómy zhodujú resp. kedy sa nejaký polynóm rovná nule.
Takáto vec sa totiž skoro vždy vcelku prirodzene vyskytne v kurze lineárnej algebry - polynómy totiž tvoria vektorový priestor, ktorý človek ľahko nájde bežne pohodený v prírode, takže sa dosť často vyskytuje v príkladoch. (Jednak to je príklad vektorového priestoru, ktorý je vcelku prirodzený a teda vhodný na príklady. Navyše takýto priestor je občas užitočný v aplikáciach - podobne aj viaceré priestory ktoré vyzerajú do istej miery podobne.)

(Samozrejme, je možné aj to, že som hlboko podcenil veci čo už viete zo strednej a opakujem tu niečo, čo už dávno viete. Ale aj v takom prípade sa mi sem azda podarí napísať sem-tam aj niečo zaujímavé, čo ste zatiaľ nevedeli.)

Najprv začnime s tým, čo vlastne je polynóm. Dohodnime sa, že pre účely tohoto vlákna budeme chápať polynóm ako funkciu špeciálneho tvaru:
Definícia. Polynóm $p(x)$ je ľubovoľná funkcia $p\colon \mathbb R\to\mathbb R$, ktorá sa dá zapísať v tvare
$$p(x)=a_nx^n+a_{n-1}x^{n-1}+\dots+a_2x^2+a_1x+a_0$$
pre nejaké prirodzené číslo $n$ a reálne konštanty $a_0,a_1,\dots,a_n\in\mathbb R$.

Podobne ste mali polynómy definované napríklad v knihe LAG1 (príklady 1.7.2(2) a 1.7.4(5)).
Samozrejme, že namiesto $\mathbb R$ by sme mohli aj s niektorými inými poľami. Neskôr (matematici na Algebre 1, informatici na Algebre 2) sa dozviete ako definovať polynómy nad ľubovoľným poľom - a tiež že treba robiť niektoré veci trochu inak ak chceme pracovať v takejto všeobecnosti. (A to s čím my pracujeme tu budete neskôr volať polynomické funkcie, nie polynómy.)
Ja som vybral ako príklad reálne čísla - vďaka tomu môžeme využívať aj niektoré argumenty z analýzy. Ukážeme si aj nejaké algebraické argumenty, tie by prešli pre ľubovoľné nekonečné pole.

Podstatná vec, ku ktorej sa chceme dostať, je takýto výsledok:
Tvrdenie. Polynóm, $p(x)=a_nx^n+a_{n-1}x^{n-1}+\dots+a_2x^2+a_1x+a_0$ je rovný nulovej funkcii práve vtedy, keď má všetky koeficienty nulové, t.j. $a_n=a_{n-1}=\dots=a_0=0$.

Na konci pridám aj nejaké odkazy - ak by ste sa chceli pozrieť na zdôvodnenie tohoto faktu inde.

Môžete sa zamyslieť nad tým, že z tohoto hneď dostaneme ako dôsledok, že dva polynómy sa rovnajú (v zmysle rovnosti funkcií) práve vtedy, keď majú rovnaké koeficienty. T.j. ak $p(x)=a_nx^n+a_{n-1}x^{n-1}+\dots+a_1x+a_0$ a $q(x)=b_nx^n+b_{n-1}x^{n-1}+\dots+b_1x+b_0$, tak
$$(\forall x\in\mathbb R) p(x)=q(x) \qquad \Leftrightarrow \qquad a_0=b_0 \land a_1=b_1 \land \dots \land a_n=b_n.$$
Spoiler:
Stačí sa pozrieť na to, kedy $p(x)-q(x)=0$.
Takisto sa môžete zamyslieť nad uvedeným tvrdením o polynómoch aj samostatne. Ja sa väčšinu dôkazov budem snažiť napísať tak, že skúsim napísať nejaký hint prv než prejdem k detailnému dôkazu - presne z toho dôvodu aby ste mohli vyskúšať na čo z tohoto viete prísť aj sami.
Martin Sleziak
Posts: 5517
Joined: Mon Jan 02, 2012 5:25 pm

Re: Kedy sa polynóm rovná nule?

Post by Martin Sleziak »

Začnime najprv s prístupom, ktorým by sme aspoň niečo mohli ukázať aj pre ľubovoľné pole. (Ako som povedal, pre jednoduchosť sa držme reálnych čísel - a kto chce môže potom skontrolovať ktoré časti by prešli aj na akýmkoľvek poľom.)

Delenie so zvyškom

V podstate sa nám bude hodiť základný fakt, že $c$ je koreňom polynómu $p(x)$ práve vtedy, keď $p(x)$ sa dá napísať ako súčin $(x-c)$ s nejakým iným polynómom.

Túto vec by ste mali poznať zo strednej školy aspoň pre kvadratické polynómy. Tu si ju dokážeme o čosi všeobecnejšie.
Začnime s takýmto tvrdením, z ktorého tento fakt už vcelku ľahko vyjde.

Tvrdenie. Ak $p(x)$ je polynóm $c$ je reálne číslo, tak existuje polynóm $q(x)$ taký, že
$$p(x)=q(x)(x-c)+p(c).$$

Toto tvrdenie by vám mohlo aspoň trochu pripomínať vetu o delení so zvyškom, ktorú poznáte pre celé čísla: viewtopic.php?t=1335
Dalo by sa dokázať aj výrazne všeobecnejšie - toto čo robíme my je vlastne špeciálny prípad vety o delení so zvyškom pre polynómy, keď delím iba polynómom stupňa jedna. (Ako obvykle, pridám aj linky na WP: Factor theorem a Polynomial remainder theorem.)
Keďže nám stačí takýto výsledok (a dôkaz je takto azda o máličko jednoduchší), tak sa možno zatiaľ uspokojme aj s týmto. (Dalo by sa dokázať aj to, že polynóm $q(x)$ je touto podmienkou jednoznačne určený. Keďže to nebudeme potrebovať, tak sa nevenujem ani tomuto dôkazu.)
S veľkou pravdepodobnosťou mnohí z vás poznáte delenie polynómov s zvyškom - a aj algoritmus ktorý sa pritom používa - zo strednej školy. (A tento algoritmus je v podstate to, čo použijeme v dôkaze.)

Možno sa oplatí všimnúť si, že stupeň polynómu $q(x)$ musí byť o jedna nižší než stupeň polynóm $p(x)$. (Stupeň polynómu je číslo, ktoré určuje najvyšší nenulový koeficient. T.j. ak $p(x)=a_nx^n+\dots+a_1x+a_0$ a $a_n\ne0$, tak hovoríme že $p(x)$ je polynóm stupňa $n$. Asi nie je moc ťažké vidieť, že ak polynóm vynásobím $x-c$, tak stupeň o jedna zvýšim. Resp. všeobecne ak násobím dva polynómy, tak stupne sa sčítajú. Jediný polynóm, kde takéto úvahy o stupni a násobení robia problémy, je nulový polynóm.)

Hint:
Spoiler:
Skúste takéto niečo dokazovať indukciou vzhľadom na stupeň polynómu $p(x)$.
Detailný dôkaz:
Spoiler:
Nech $p(x)=a_nx^n+a_{n-1}x_{n-1}+\dots+a_1x+a_0$, dôkaz budeme robiť indukciou na $n$.

$1^\circ$ Ak $n=0$, tak stačí zobrať $q(x)=0$ a máme
$$p(x)=a_0=0\cdot(x-c)+a_0=q(x)(x-c)+p(c).$$

$2^\circ$ Prepokladajme, že tvrdenie platí pre polynómy stupňa najviac $n-1$, pokúsme sa ho dokázať pre $p(x)=a_nx^n+a_{n-1}x_{n-1}+\dots+a_1x+a_0$.
Ak od tohoto polynómu odčítame polynóm $a_nx^{n-1}(x-c)=a_nx^n-a_ncx^{n-1}$, tak dostaneme
$$p_1(x)=p(x)-a_nx^{n-1}(x-c)=(a_{n-1}+a_nc)x^{n-1}+a_{n-2}x^{n-2}+\dots+a_1x+a_0.$$
Všimnime si, že sme dostali polynóm nižšieho stupňa (pre vedúce členy polynóm z ktorých sme urobili rozdiel sme dostali $a_nx^n-a_nx^n=0$). Takže na $p_1(x)$ sa dá použiť indukčný predpoklad, čo znamená že existuje polynóm $q_1(x)$ taký, že
$$p_1(x)=q_1(x)(x-c)+p_1(c).$$
Jednoduchou úpravou dostaneme
$$p(x)=a_nx^{n-1}(x-c)+q_1(x)(x-c)+p_1(c)=(a_nx^{n-1}+q_1(x))(x-c)+p_1(c).$$
Ak označíme $q(x)=a_nx^{n-1}+q_1(x)$, tak sme náš polynóm skutočne upravili do tvaru
$$p(x)=q(x)(x-c)+r,$$
kde $r$ je nejaká konštanta. Ak do tejto rovnosti dosadíme $x=c$, tak vidíme, že jediná možná hodnota tejto konštanty je $r=p(c)$.

Tým je uvedené tvrdenie dokázané.
Pripomeňme, že číslo $c$ voláme koreňom polynóm $p(x)$, ak platí $p(c)=0$ (t.j. po dosadení $c$ do polynómu dostaneme nulu).
Z predošlého tvrdenia hneď vidíme, že platí:
Dôsledok. Reálne číslo $c$ je koreňom polynómu $p(x)$ práve vtedy, keď pre nejaký polynóm $q(x)$ platí $p(x)=q(x)(x-c)$.

Počet koreňov je najviac stupeň.

Teraz už máme nachystané všetko na to, čo by sme v tejto časti chceli ukázať - že jediný polynóm ktorý má nekonečne veľa koreňov je nulový polynóm.
Dokonca vieme z tvaru polynómu ľahko zistiť nejaký odhad na možný počet koreňov.

Tvrdenie. Nech $p(x)=a_nx^n+\dots+a_1x+a_0$ a $a_n\ne0$. Potom $p(x)$ má najviac $n$ koreňov. (Stručne: Pre nenulové polynómy je počet koreňov menší alebo rovný jeho stupňu.)

Hint:
Spoiler:
Opäť sa oplatí skúsiť dôkaz indukciou vzhľadom na $n$.
Hint 2:
Spoiler:
Zrejme budeme chcieť využiť vyjadrenie v tvare $p(x)=q(x)(x-c)$.
Dôkaz:
Spoiler:
$1^\circ$ Ak $p(x)=a_0$ je konštantný nenulový polynóm, tak má nula koreňov.
(Ak by niekto chcel radšej začať indukciu od polynómov stupňa jedna, tak nie je ťažké explicitne nájsť jediné riešenie rovnice $a_1x+a_0=0$ pre $a_1\ne0$, toto je jediný koreň príslušného lineárneho polynómu.)

$2^\circ$ Nech $p(x)=a_nx^n+\dots+a_1x+a_0$ a $a_n\ne0$, pričom $n\ge1$. Predpokladáme že tvrdenie platí pre polynómy nižšieho stupňa.
Ak polynóm $p(x)$ má nejaký koreň $c$, tak ho vieme zapísať v tvare $$p(x)=q(x)(x-c),$$ kde $q(x)$ je polynóm stupňa $n-1$.
Ľubovoľný koreň polynómu $p(x)$ spĺňa rovnosť
$$q(x)(x-c)=0$$
čiže $x-c=0$ alebo $q(x)=0$. Teda máme iba možnosť, že tento koreň sa rovná $c$ alebo je to niektorý z koreňov polynómu $q(x)$; a tých je podľa indukčného predpokladu najviac $n-1$.
Spolu dostávame, že koreňov polynómu $p(x)$ je najviac $n$,
Záver. Ľubovoľný nenulový polynóm má najviac toľko koreňov koľko je jeho stupeň, a teda iba konečne veľa koreňov.
Z toho hneď vidíme, že ak $p(x)=0$ pre všetky reálne čísla, tak $p(x)$ musí byť nulový polynóm.

Všetky úvahy, ktoré sme robili v tomto dôkaze, by prešli bez zmeny aj pre ľubovoľné nekonečné pole. (Dokonca skoro všetko aj pre ľubovoľné pole - to že je nekonečné sme potrebovali už iba v poslednom kroku, t.j. v zdôvodnení že $p(x)$ má nulové koeficienty; tu sme využívali že ak každý prvok poľa je koreňom, tak máme viac ako $n$ koreňov.)
Martin Sleziak
Posts: 5517
Joined: Mon Jan 02, 2012 5:25 pm

Re: Kedy sa polynóm rovná nule?

Post by Martin Sleziak »

Aspoň ak pracujeme s reálnymi číslami, tak možno by sa dalo niečo povedať aj na základe vecí čo viete z analýzy alebo na základe toho, že viete kresliť grafy funkcií. (Spomeniem aspoň nejaké, môžete sa zamyslieť nad tým, či viete vymyslieť ešte aj nejaké ďalšie argumenty ako dostať tento výsledok pre reálne polynómy. A ak veci ktoré sa tu spomínajú - ako napríklad deriváciu, limitu, spojitosť - zatiaľ z analýzy nepoznáte, tak sa k tomuto postu môžete znovu vrátiť neskôr.)

Pozerajme sa teda na polynóm $p(x)=a_nx^n+a_{n-1}x^{n-1}+\dots+a_1x+a_0$ pričom $a_n\ne 0$. A pozrite sa na to, čo sa o ňom dá povedať

Limita v nekonečne

Čo by ste vedeli povedať o $\lim\limits_{x\to\infty} p(x)$?
Spoiler:
Ak ste sa naučili nejaké základné veci o limitách, tak už viete, že pre $a_n>0$ platí
$$\lim\limits_{x\to\infty} (a_nx^n+a_{n-1}x^{n-1}+\dots+a_1x+a_0)=+\infty.$$
Podobne pre $a_n<0$ máte
$$\lim\limits_{x\to\infty} (a_nx^n+a_{n-1}x^{n-1}+\dots+a_1x+a_0)=-\infty.$$

Samozrejme, ak platí $p(x)=0$, tak aj limita $\lim\limits_{x\to\infty} p(x)$ je rovná nule, čiže toto môže nastať iba pre $a_n=0$.

Ak túto úvahu viackrát zopakujete, dostanete že aj ostatné koeficienty sú rovné nule. (Resp. dalo by sa to dokazovať indukciou. Alebo prehlásiť na tomto mieste, že máme spor)
Derivácia

Čo dostanete keď (viackrát) zderivujete $p(x)$?

Hint:
Spoiler:
Čomu sa rovná $n$-tá derivácia $p(x)$?
Detailnejší hint
Spoiler:
Opakovaným derivovaním dostanete
$$p^{(n)}(x)=n!a_n.$$
Detaily:
Spoiler:
Ak derivujeme $p(x)=a_nx^n+a_{n-1}x^{n-1}+\dots+a_1x+a_0$, tak prvá derivácia $p'(x)$ bude polynóm stupňa $(n-1)$ kde vedúci člen je $na_nx^{n-1}$.
Ako druhú deriváciu $p''(x)$ dostaneme polynóm stupňa $(n-2)$, kde vedúci člen je $n(n-1)a_nx^{n-2}$.
Ak túto úvahu $n$-krát zopakujeme, tak v $n$-tej derivácii už dostaneme iba jediný člen
$$p^{(n)}(x)=n!a_n.$$

Ak platí $p(x)=0$, tak samozrejme aj všetky derivácie sú nulové, čiže $n!a_n=0$, a teda $a_n=0$.
Opäť nie je veľmi ťažké rozšíriť to aj na ďalšie koeficienty nášho polynómu.
Spojitosť

Ak platí $p(x)=0$ (pre každé $x$), tak špeciálne dostávame, že $a_0=p(0)=0$.
Potom teda máme $p(x)=a_nx^n+a_{n-1}x^{n-1}+\dots+a_1x$.
Vedeli by ste nejako využiť funkciu $q(x)=\frac{p(x)}x$ na to, aby ste povedali niečo o $a_1$?

Hint 1:
Spoiler:
Táto funkcia má tvar $$q(x)=\frac{p(x)}x=a_nx^{n-1}+a_{n-1}x^{n-2}+\dots+a_1.$$
Je takáto funkcia spojitá? Pomôže nám nejako spojitosť funkcie $q(x)$?

Poznámka: Ak chceme byť presnejší, tak hovoríme o funkcii $q(x)=a_nx^{n-1}+a_{n-1}x^{n-2}+\dots+a_1$, ktorá sa zhoduje z $p(x)/x$ pre $x\ne0$. (Pre $x=0$ máme v predpise $p(x)/x$ problém s delením nulou.)
Hint 2.
Spoiler:
Ešte si uvedomme, že pre $x\ne0$ máme $q(x)=0$. (Pretože $p(x)=0$ vo všetkých bodoch.)
Čo potom dostaneme zo spojitosti?
Dokončenie:
Spoiler:
Už vieme, že funkcia $q(x)$ je spojitá a ľubovoľne blízko nuly nájdeme bod $x_n$ taký, že $q(x_n)=0$.
Z toho dostaneme, že aj $q(0)=0$, čiže $a_1=0$.
Zatiaľ sme ukázali iba $a_0=a_1=0$, ale asi je jasné že naznačeným spôsobom by sa dalo pokračovať pre ďalšie koeficienty.
Martin Sleziak
Posts: 5517
Joined: Mon Jan 02, 2012 5:25 pm

Re: Kedy sa polynóm rovná nule?

Post by Martin Sleziak »

Vandermondova matica

Môžeme sa pozrieť na to, ako tento problém súvisí so sústavami lineárnych rovníc - a prípadne sa k tomuto postu môžete vrátiť keď sa naučíme niečo o súvise medzi vlastnosťami matice sústavy a veľkosťou množiny riešení sústavy.

Pozrime sa na polynóm $p(x)=a_nx^n+a_{n-1}x^{n-1}+\cdots+a_1x+a_0$ stupňa $n$ (t.j. $a_n\ne0$).
Ak by tento polynóm mal $(n+1)$ rôznych koreňov, tak to znamená, že existuje $(n+1)$ rôznych reálnych čísel $x_0,x_1,\dots,x_n$ pre ktoré platí $p(x_i)=0$, t.j. máme rovnosť
$$a_nx_i^n+a_{n-1}x_i^{n-1}+\cdots+a_1x_i+a_0=0$$
(pre $i=0,1,\dots,n$.)

Chceme teda aby platilo:
\begin{align*}
a_0+a_1x_0+\cdots+a_{n-1}x_0^{n-1}+a_nx_0^n&=0\\
a_0+a_1x_1+\cdots+a_{n-1}x_1^{n-1}+a_nx_1^n&=0\\
&\vdots\\
a_0+a_1x_{n-1}+\cdots+a_{n-1}x_{n-1}^{n-1}+a_nx_{n-1}^n&=0\\
a_0+a_1x_n+\cdots+a_{n-1}x_n^{n-1}+a_nx_n^n&=0
\end{align*}

Na uvedené rovnosti sa pozrime takto: Čísla $x_0,x_1,\dots,x_n$ považujme za dané. Pýtame sa, čo z toho vieme vyčítať o koeficientoch $a_0,a_1,\dots,a_n$.
Keď sa teda pozeráme na úlohu takto, tak je to vlastne homogénna sústava lineárnych rovníc, v ktorej sú neznámymi čísla $a_0,a_1,\dots,a_n$.
Z vecí, čo sa tento semester naučíme na lineárnej algebre budeme vidieť, že to či táto sústava má iba nulové riešenie sa dá zistiť na základe nejakých vlastností matice tejto sústavy, čo je v našom prípade:
$$
\begin{pmatrix}
1 & x_0 & \ldots & x_0^{n-1} & x_0^n \\
1 & x_1 & \ldots & x_1^{n-1} & x_1^n \\
\vdots & \vdots & \ddots & \vdots & \vdots \\
1 & x_{n-1} & \ldots & x_{n-1}^{n-1} & x_{n-1}^n \\
1 & x_n & \ldots & x_n^{n-1} & x_n^n
\end{pmatrix}
$$
(Túto maticu sme dostali tak, že sme sa pozreli na koeficienty, ktorými sú vynásobené neznáme $a_0,a_1,\dots,a_n$.)

Konkrétne ak ukážeme že táto matica je pre ľubovoľnú voľbu rôznych čisel $x_0,\dots,x_n$ regulárna (t.j. že má nenulový determinant), tak uvedená sústava má iba nulové riešenie.
Takto dostávame inú možnosť ako zdôvodniť, že polynóm stupňa $n$ môže mať najviac $n$ koreňov.

S maticou takéhoto tvaru sa v prvom kurze lineárnej algebry s veľkou pravdepodobnosťou stretnete - prinajmenšom sa objaví medzi cvičeniami.
Táto matica sa nazýva Vandermondova matica.

Wikipédia: Vandermonde matrix
Martin Sleziak
Posts: 5517
Joined: Mon Jan 02, 2012 5:25 pm

Re: Kedy sa polynóm rovná nule?

Post by Martin Sleziak »

Linky

Zopár miest, kde sa dá niečo o tomto prečítať - ešte sa časom pozriem na nejaké ďalšie linky TODO čo by sa sem mohli pridať, ale napríklad toto môže byť užitočné:
Post Reply