Extrémy funkcí

Obsah:

  1. Lokální extrémy
  2. Vyšetřování absolutních extrémů
  3. Vázané extrémy

Lokální extrémy

Definice. Nechť \(f:G\to\mathbb{R}\) je funkce definovaná na otevřené množině \(G\subset\mathbb{R}^{n}.\) Řekneme, že funkce \(f\) nabývá v bodě \(x\in G\) lokální minimum (resp. lokální maximum), existuje-li \(\delta>0\) tak, že pro každé \(y\in G\) $$ \lvert x-y\rvert_e \lt \delta\implies f(x)\le f(y),\ \ {\rm resp.}\ f(x)\ge f(y). $$ (\(\lvert x\rvert_e\) značí Euklidovskou normu v \(\mathbb R^n,\) \(\lvert x\rvert_e = \sqrt{x_1^2+\cdots+x_n^2}\)).

Věta. Nechť \(f:G\to\mathbb{R}\) nabývá v bodě \(x^{0}\in G\) lokální extrém a nechť pro každé \(i\in\{1,\ldots,n\}\) existuje parciální derivace \(\frac{\partial f(x^{0})}{\partial x_{i}}.\) Pak pro každé \(i\in\{1,\ldots,n\}\) \[ \frac{\partial f}{\partial x_{i}}(x^{0}) = 0. \]

Definice. Funkci \(q:\mathbb{R}^{n}\to\mathbb{R},\) která je dána předpisem \[ q(x)=\sum_{i,j=1}^{n}a_{i,j}x_{i}x_{j}, \] kde \(a_{i,j}\in\mathbb{R}\) jsou konstanty nazýváme kvadratickou formou na prostoru \(\mathbb{R}^{n}.\) Kvadratická forma \(q:\mathbb{R}^{n}\to\mathbb{R}\) se nazývá pozitivně definitní (negativně definitní), jestliže pro každý nenulový vektor \(\xi=(\xi_{1},\ldots,\xi_{n})\neq(0,\ldots,0)\) platí \[ \sum_{i,j=1}^{n}a_{i,j}\xi_{i}\xi_{j}>0\ \ \ {\rm resp.} \sum_{i,j=1}^{n}a_{i,j}\xi_{i}\xi_{j} \lt 0. \]

Věta. Nechť \(f:G\to\mathbb{R},\) kde \(G\subset\mathbb{R}^n\) je otevřenou množinou a \(f\in C^{2}(G,\mathbb{R}).\) Dále nechť \(x^0\in G\) je stacionárním bodem funkce \(f,\) tj. pro každé \(i\in\{1,\ldots,n\}\) je \(\frac{\partial f}{\partial x_i}(x^0)=0\) a nechť je kvadratická forma \[ q(\xi)=\sum_{i,j=1}^{n}\frac{\partial^{2} f}{\partial x_i\partial x_j}(x^0)\xi_i\xi_j \] pozitivně definitní (negativně definitní). Potom funkce \(f\) nabývá v bodě \(x^0\) lokální minimum (lokální maximum.)

Důkaz. Předpokládejme například, že forma \(q(\xi)\) je pozitivně definitní. Protože je \(q\) spojitou funkcí na \(\mathbb{R}^n\) a jednotková sféra \(S_{\mathbb{R}^n}=\{\xi\in\mathbb{R}^n\mid \lvert \xi\rvert_e=1\}\) je kompaktní množinou, nabývá na \(S_{\mathbb{R}^n}\) funkce \(q\) své absolutní minimum v jistém bodě \(\hat{\xi}\in S_{\mathbb{R}^n}.\) Pak z pozitivní definitnosti formy \(q\) plyne, že pro každé \(\xi\in S_{\mathbb{R}^n}\) je \[q(\xi)\ge q(\hat{\xi})>2m>0\] pro jistou konstantu \(m>0.\) Nyní položme \[M=\max\{\sum_{i,j=1}^n\lvert \xi_i\xi_j\rvert\mid \xi\in S_{\mathbb{R}^n}\}\] a \(\varepsilon=m/M.\) Odtud díky spojitosti parciálních derivací druhého řádu vyplývá existence \(\delta>0\) tak, že \[\lvert y-x^0\rvert_e<\delta\implies \left\lvert\frac{\partial^2 f}{\partial x_i\partial x_j}(y)-\frac{\partial^2 f}{\partial x_i\partial x_j}(x^0)\right\rvert<\varepsilon\] pro \(i,j=1,\ldots,n.\) Pak máme dále \[\begin{split} &\lvert y-x^0\rvert_e<\delta\wedge\xi\in S_{\mathbb{R}^n}\implies\\ &\implies \left\lvert\sum_{i,j=1}^n\frac{\partial^2 f}{\partial x_i\partial x_j}(y)\xi_i\xi_j-\sum_{i,j=1}^n\frac{\partial^n f}{\partial x_i\partial x_j}(x^0)\xi_i\xi_j\right\rvert\\ &\le\sum_{i,j=1}^n\left\lvert\frac{\partial^2 f}{\partial x_i\partial x_j}(y)-\frac{\partial^2 f}{\partial x_i\partial x_j}(x^0)\right\rvert\lvert\xi_i\xi_j\rvert\le\varepsilon\sum_{i,j=1}^n\lvert\xi_i\xi_j\rvert\le M\varepsilon=m.\, \end{split}\] Tudíž jestliže \(\lvert y-x^0\rvert<\delta\) a \(\xi\in S_{\mathbb{R}^n}\) , potom je \[\sum_{i,j=1}^n\frac{\partial^2 f}{\partial x_i\partial x_j}(y)\xi_i\xi_j>m>0.\] Nechť je \(\lvert y-x^0\rvert<\delta\), pak existuje v důsledku Věty [taylor_viceprom] bod \(x\in(x^0,y)\) tak, že \[\label{eq:1} \begin{split} f(y)&=f(x^0)+\sum_{i=1}^n\frac{\partial f}{\partial x_i}(x^0)(y_i-x^0_i)+\\ &\quad +\frac{1}{2}\sum_{i,j=1}^n\frac{\partial^2 f}{\partial x_i\partial x_j}(x)(y_i-x^0_i)(y_j-x^0_j)\,. \end{split}\] Neboť \(x^0\) je stacionárním bodem funkce \(f\), je \(\sum_{i=1}^n \frac{\partial f}{\partial x_i}(x^0)(y_i-x^0_i)=0.\) Dále pak \(\lvert x-x^0\rvert_e<\delta\) a tudíž pro každé \(\xi\in\mathbb{R}^n,\) \(\lvert\xi\rvert_e>0\) je \(\xi/\lvert\xi\rvert_e\in S_{\mathbb{R}^n}\) a \[\sum_{i,j=1}^n\frac{\partial^2 f}{\partial x_i\partial x_j}(x)\frac{\xi_i}{\lvert\xi\rvert_e}\frac{\xi_j}{\lvert\xi\rvert_e}>m\] \(\implies\) \[\sum_{i,j=1}^n\frac{\partial^2 f}{\partial x_i\partial x_j }(x)\xi_i\xi_j>m\lvert\xi\rvert_e^2>0.\] Nyní ze vztahu ([eq:1]) plyne, že pokud \(\lvert y-x^0\rvert_e<\delta,\) potom existuje \(x\in(x^0,y)\) tak, že \[f(y)=f(x^0)+\frac{1}{2}\sum_{i,j=1}^n\frac{\partial^2 f}{\partial x_i\partial x_j}(x)(y_i-x^0_i)(y_j-x_j^0)>f(x^0).\] Tedy funkce \(f\) nabývá v bodě \(x^0\) (ostré) lokální minimum. Důkaz probíhá analogicky v případě lokálního maxima. \(\Box\)

Zde je notebook obsahující výpočty lokálních extrémů a další věci.

Vyšetřování absolutních extrémů.

Podívejte se na toto video , kde dokazuji větu o nabývání maxima spojité funkce. Dále v nahlédněte zde kde najdete postup, jak řešit úlohu nalezení absolutních extrémů spojitých funkcí na omezené uzavřené množině.

Vázané extrémy

Definice. Nechť je dána reálná funkce \(n\) proměnných \(f\), množina \(M\subseteq\mathbb R^n\) a bod \(a\in M\cap D_f.\) Řekneme, že funkce \(f\) nabývá v bodě \(a\) vázané lokální minimum (maximum) vzhledem k množině \(M\), existuje-li okolí \(U\) bodu \(a\) takové, že pro každé \(x\in U\cap M\) platí: \[ f(a) \le f(x), \ \ (f(x) \le f(a)). \] Lze-li uvedené nerovnosti nahradit pro \(x\neq a\) ostrými nerovnostmi, potom hovoříme o tzv. ostrém lokálním minimu (resp. maximu) vzhledem k množině \(M\).

Věta. Nechť \(f,g_1,\ldots,g_s,\ 1\le s < n\) jsou reálnými funkcemi třídy \(\textrm{C}^1\) na otevřené množině \(U\subseteq\mathbb R^n\) a nechť pro každé \(x\in U\) má Jacobiho matice zobrazení \(G = (g_1,\ldots,g_s):\mathbb R^n\supset\to\mathbb R\): $$ \nabla G(x) = \left( \begin{matrix} \frac{\partial g_1}{\partial x_1}(x)&\ldots&\frac{\partial g_1}{\partial x_n}(x)\\ \cdots&\cdots&\cdots\\ \frac{\partial g_s}{\partial x_1}(x)&\ldots&\frac{\partial g_s}{\partial x_n} \end{matrix} \right) $$ maximální hodnost \(s.\) Nechť $$ M = \{x\in U: G(x) = 0\} = \{x\in U: g_1(x) = 0,\ldots,g_s(x) = 0\} $$ a funkce \(f\) nabývá v bodě \(a\in M\) lokální maximum nebo minimum vzhledem k množině \(M.\) Potom existuje právě jedna \(s-\)tice reálných čísel \((\lambda_1,\ldots,\lambda_s)\) taková, že bod \(a\) je stacionárním bodem tzv. Lagrangeovy funkce $$ L(x) = f(x) + \sum_{i=1}^s \lambda_i g_i(x). $$

Příklad. Hledejme extrémy funkce \(f(x,y) = x^2 + 2y^2\) na kružnici \(x^2 + y^2 = 1.\)

Řešení. Položme \(g(y,y) = x^2 + y^2 - 1.\) Je zřejmé, že obě funkce \(f,g\) jsou třídy \(C^{1}\) na prostoru \(\mathbb R^2\) a výpočtem zjistíme, že \(\nabla g(x,y) = (2x, 2y).\) Hledejme stacionární body Lagrangeovy funkce na množině \(M = \{(x,y)\in\mathbb R^2: g(x,y) = 0\}.\) Za tím účelem řešme soustavu rovnic: $$ \begin{eqnarray} \nabla f(x,y) &=& \nabla g(x,y)\\ g &=& 0. \end{eqnarray} $$ Tedy budeme řešit soustavu tří rovnic o třech neznámých: $$ \begin{eqnarray} 2x &=& 2x\lambda\\ 4y &=& 2y\lambda\\ x^2 + y^2 - 1 &=& 0. \end{eqnarray} $$ Řešením jsou trojice \((x,y,\lambda)\): $$ (1, 0, 1), (-1, 0, 1), (0, -1, 2), (0, 1, 2). $$ Porovnáním funkčních hodnot a s využitím Weierstrassovy věty o nabývání maxima a minima zjistíme, že funkce \(f\) nabývá maximum \(f(0,\pm 1) = 2\) a minimum \(f(\pm 1, 0) = 1.\) \(\Box\)

Text (handwritten in czech)
Zde je jupyter notebook obsahující výpočet vázaných extrémů s využitím tzv. Lagrangeových multiplikátorů.