Minimum, maximum a parciálne derivácie

Moderators: Martin Sleziak, Ludovit_Balko, Martin Niepel, Tibor Macko

Post Reply
Martin Sleziak
Posts: 5686
Joined: Mon Jan 02, 2012 5:25 pm

Minimum, maximum a parciálne derivácie

Post by Martin Sleziak »

Na matematickej analýze ste sa učili niečo o hľadaní extrémov funkcie jednej premennej - a v druhom ročníku sa naučíte ako je to s viac premennými.

Môžeme však aspoň stručne spomenúť niečo aj tu - občas sa takéto veci môžu hodiť, prinajmenšom niekedy môžeme ukázať iné spôsoby riešenia niektorých problémov. (Napríklad sme sa tento semester zaoberali hľadaním vzdialeností - to je spravidla hľadanie minima vhodnej funkcie. Podobne sme sa snažili nejaký výraz minimalizovať aj pri metóde najmenších štvorcov.)

Všimnime si najprv aspoň nejaké jednoduché veci.

Nutná podmienka pre lokálne extrémy

Pre reálne funkcie jednej premennej viete, že na to aby v nejakom bode mala funkcia $f$ lokálne minimum/maximum, musí nutne platiť $f'(x)=0$. Ako by to bolo s funkciami viac premenných?

Ak si zafixujem nejakú hodnotu premennej $y_0$, môžem sa pozerať na túto funkciu ako na funkciu jednej premennej
$$x \mapsto f(x,y_0).$$
Je jasné, že ak má funkcia dvoch premenných v bode $(x_0,y_0)$ lokálne minimum/maximum, tak ak sa pozerám na takúto funkciu jednej premennej, tak tá bude nadobúdať lokálne minimum/maximum pre $x=x_0$. To isté sa stane ak fixujem premennú $x$ a mením $y$.

Dostal som sa do situácie, ktorú už poznám - hľadám extrémy funkcie jednej premennej. Kandidátov na body, kde sa nadobúdajú extrémne hodnoty, nájdem derivovaním tejto funkcie a hľadaním bodov, kde je derivácia nulová.
Treba teda počítať derivácie tak, že vždy jednu z premenných chápem ako konštantu a derivujem podľa tej druhej. Takejto operácii sa hovorí parciálna derivácia a používa sa označenie
\begin{align*}
\frac{\partial f}{\partial x}(x,y) &= \lim_{t\to 0} \frac{f(x+t,y)-f(x,y)}{t}\\
\frac{\partial f}{\partial y}(x,y) &= \lim_{t\to 0} \frac{f(x,y+t)-f(x,y)}{t}
\end{align*}
Podobne by sa dali počítať parciálne derivácie aj ak máme funkcie viac premenných. Pri funkcii $n$ premenných bude $(n-1)$ premenných zafixovaných (t.j. pozerám sa na ne ako na konštanty) a derivujeme podľa zostávajúcej premennej.

Nutná podmienka pre body, v ktorých sa nadobúdajú lokálne extrémy, je aby v tomto bode boli nulové parciálne derivácie. (Samozrejme, za predpokladu že parciálne derivácie existujú.)

Wikipédia: Critical point
Martin Sleziak
Posts: 5686
Joined: Mon Jan 02, 2012 5:25 pm

Re: Minimum, maximum a parciálne derivácie

Post by Martin Sleziak »

Postačujúca podmienka pre lokálne extrémy

Keď už vieme niečo o kvadratických formách, tak si vieme niečo povedať aj o tom ako sa dá overiť či v nejako bode je skutočne minimum/maximum. (Opäť s s tým, že poriadne budete mať tieto veci dokázané na druháckej analýze - keď budete už mať za sebou veci, ktoré na to potrebujete.)

Opäť začnem tým, že pripomeniem čo viete o funkciách jednej premennej. Ak sa pozerám na funkciu blízko bodu $x_0$ tak môžem napísať Taylorov rozvoj
$$f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac1{2!}f''(x_0)(x-x_0)^2+\dots$$

Ak sa pozeráme na prvé dva členy $f(x_0)+f'(x_0)(x-x_0)$, dostaneme funkciu ktorá je najlepšou lineárnou aproximáciou pre $f$ a naša funkcia sa v danom bode správe približne ako táto funkcia. Špeciálne, podľa toho, či $f'(x_0)$ je kladné/záporné vieme povedať či v $x_0$ funkcia $f$ rastie. V prípade, že je prvá prvá derivácia $f'(x_0)$ nulová, aby sme popísali správanie funkcie v danom bode musíme sa pozrieť aj na ďalšie derivácie.

Opäť ak sa pozrieme na ďalšie členy, t.j. $f(x_0)+f'(x_0)(x-x_0)+\frac1{2!}f''(x_0)(x-x_0)^2$, tak sme dostali najlepšiu aproximáciu funkcie $f$ v bode $x_0$ pomocou kvadratickej funkcie. Ak $f''(x_0)\ne0$, tak dosť blízko bodu $x_0$ sú ďalšie členy zanedbateľné oproti tým, ktoré sme uviedli.
Teda pre $f'(x_0)=0$ máme
$$f(x)\approx f(x_0)+\frac1{2!}f''(x_0)(x-x_0)^2.$$
To nám hovorí, že funkcia $f$ lokálne vyzerá približne ako posunutá parabola, znamienko druhej derivácie $f''(x_0)$ nám hovorí, či je táto parabola otočená nahor alebo nadol.

Niečo podobné sa dá urobiť aj pre funkcie viac premenných. Pre jednoduchosť sa pozrime na funkciu dvoch premenných $f(x,y)$ v nejakom bode $(x_0,y_0)$. (Pre viac premenných platí niečo podobné.)
Aj tu sa dá nájsť nejaká lineárna funkcia, ktorá aproximuje danú funkciu - a bude sa dať vyjadriť pomocou prvých parciálnych derivácií.
Ak sú parciálne derivácie prvého rádu nulové, tak to opäť funguje tak, že vlastne funkciu môžeme aproximovať "niečím kvadratickým". Pre viac premenných to znamená, že sa to dá aproximovať nejakou kvadratickou formou, t.j. hodnoty funkcie blízko bodu $(x_0,y_0)$ sú približne
$$f(x,y) \approx f(x_0,y_0) + \frac1{2!}(x-x_0,y-y_0)A(x-x_0,y-y_0)^T.$$
Maticu $A$ vieme vypočítať pomocou parciálnych derivácií druhého rádu. T.j. derivujeme funkciu $f$ dvakrát - ak obe derivácie robíme podľa $x$ dostaneme deriváciu, ktorú označíme $f_{xx}=\frac{\partial^2f}{\partial x^2}$; ak derivujeme podľa $x$ a potom podľa $y$, tak máme $f_{xy}=\frac{\partial^2f}{\partial x\partial y}$, atď.
Matica uvedenej kvadratickej formy je potom
$$A=
\begin{pmatrix}
f_{xx} & f_{xy} \\
f_{yx} & f_{yy} \\
\end{pmatrix}
$$
(Pre "slušné" funkcie máme $f_{xy}=f_{yx}$, čiže je to symetrická matica.)

Pre nás je podstatné si uvedomiť to, že naša funkcia sa približne správa ako nejaká kvadratická forma.
Z toho, čo už vieme o kvadratických formách, vieme že po vhodnej transformácii premenných môžeme dostať túto kvadratickú formu do jednoduchšieho tvaru. (Dá sa dostať na diagonálny tvar nejakou ortogonálnou transformáciou, čo je vlastne otočenie. Dokonca ju vieme dostať na kanonický tvar, ak pripustíme aj iné transformácie premenných.)

V nejakej novej súradnicovej sústave sa teda naša funkcia správa približne ako $$d_1x_1^2+d_2x_2^2.$$
(Budeme sa tváriť, že sme si súradnicovú sústavu posunuli tak, aby začiatok bol v bode $(x_0,y_0)$.)
O koeficientoch $d_{1,2}$ vieme, že sú to vlastné čísla matice $A$.
Ak sú obe kladné, tak je vidieť, že $d_1x_1^2+d_2x_2^2>0$ pre $(x_1,x_2)\ne 0$. Vtedy máme v bode $(x_0,y_0)$ minimum. Toto je presne prípad keď matica $A$ je kladne definitná.
Ak sú $d_1$ aj $d_2$ záporné - t.j. ak je matica záporne definitná - tak dostaneme minimum.
Ak majú rôzne znamienka, tak nedostaneme ani minimum ani maximum.
(Môže pomôcť ak si skúsite nakresliť obrázok ako vyzerá funkcia $(x_1,x_2)\mapsto d_1x_1^2+d_2x_2^2$. Nejaké obrázky si môžete pozrieť aj na Wikipédii: Paraboloid.)

S výnimkou prípadu keď je niektoré vlastné číslo nulové vieme teda ako približne vyzerá naša funkcia v okolí daného bodu a aj to, či tam je minimum alebo maximum. (Nulovú vlastnú hodnotu dostaneme pre singulárnu maticu $A$. V takom prípade ovplyvňujú správanie funkcie aj členy tretieho rádu a vyšších rádov, ktoré sme zanedbali.)

Opäť pridám linku na Wikipédiu: Second partial derivative test

Niečo k tejto téme mám napísané aj v poznámkach z Algebry 3 pre informatikov - určite však netvrdím že sa mi to tam podarilo napísať zrozumiteľnejšie ako tu. (Každopádne, toto je myslené skôr ako informácia aby ste vedeli, že niečo takéto existuje a že vedieť overiť kladnú definitnosť môže byť na niečo užitočné. Časom - na iných predmetoch - sa to naučíte poriadne, budete vidieť dôkaz a prepočítate pomerne veľa úloh takéhoto typu. Konkrétne takéto niečo je v informačnom liste predmetu 1-MAT-210/22 Matematická analýza (3) - ktorý je na odboroch MAT, MMN ako povinný predmet, na odbore INF ako výberovka.)
Martin Sleziak
Posts: 5686
Joined: Mon Jan 02, 2012 5:25 pm

Re: Minimum, maximum a parciálne derivácie

Post by Martin Sleziak »

Príklad 1. Skúsme si to ukázať aspoň na nejakom veľmi jednoduchom príklade, napríklad
$$f(x,y)=x^2+xy+y^2.$$
Aj keď minimum tejto funkcie by sme veľmi ľahko mohli nájsť aj so stredoškolskými vedomosťami, bez akéhokoľvek používania derivácií.
Spoiler:
Doplnením na štvorec dostaneme
$$f(x,y)=x^2+xy+y^2=\left(x+\frac y2\right)^2+\frac34y^2.$$
Hneď vidíme, že $f(x,y)\ge0$ a nule sa rovná iba keď $x+y/2=0$ a $y=0$, čo nastane práve v prípade $x=y=0$.
Minimum sa teda nadobúda v bode $(0,0)$.
Vyskúšajme sa aj tak pozrieť, čo dostaneme pomocou parciálnych derivácií.

Prvé derivácie sú
\begin{align*}
f_x &= 2x+y\\
f_y &= x+2y
\end{align*}
Nutná podmienka pre lokálne extrémy je aby sa parciálne derivácie rovnali nule.
Z podmienok $2x+y=0$ a $x+2y=0$ ľahko dostávame, že $x=y=0$.

Ešte chceme zistiť, či sa v tomto bode nadobúda extrém a či to je lokálne maximum/minimum.
Spočítame druhé parciálne derivácie:
\begin{align*}
f_{xx} &= 2\\
f_{xy} = f_{yx} &= 1\\
f_{yy} &=2
\end{align*}
Matica
$$
\begin{pmatrix}
2 & 1 \\
1 & 2 \\
\end{pmatrix}
$$ je kladne definitná. (Napríklad môžeme skontrolovať, že rohové determinanty sú kladné: $D_1=2$, $D_2=3$.)
To nám hovorí, že v bode $(0,0)$ je lokálne minimum.
Post Reply