From 1e80a527a24d0b2a65e655e4f72140e34e4c3a74 Mon Sep 17 00:00:00 2001 From: lcw Date: Sat, 4 Nov 2023 13:35:15 +0800 Subject: [PATCH] =?UTF-8?q?=E5=AF=B9=E7=AC=AC~9=E7=AB=A0=E3=80=81=E7=AC=AC?= =?UTF-8?q?10=E7=AB=A0=E5=81=9A=E4=BA=86=E8=A1=A5=E5=85=85=EF=BC=8C?= =?UTF-8?q?=E5=B9=B6=E6=96=B0=E6=B7=BB=2010.6=E9=AB=98=E9=98=B6=E5=AF=BC?= =?UTF-8?q?=E6=95=B0=20=E5=92=8C=2010.7=E5=87=B8=E5=87=BD=E6=95=B0?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- src/~9.md | 35 +++++- src/第10章 函数的微分.md | 241 +++++++++++++++++++++++++++++++++++---- 2 files changed, 248 insertions(+), 28 deletions(-) diff --git a/src/~9.md b/src/~9.md index 42103ca..1f25e0f 100644 --- a/src/~9.md +++ b/src/~9.md @@ -149,10 +149,14 @@ $$ 故 $(1+x)^q=1+qx+\frac{q(q-1)}{2}x^2+o(x^2),x\to 0$。 + +- **推论 ~9.2.4**:当 $x\to 0$ 时,$\frac{1}{1-x}=1+x+x^2+o(x^2)$。 + +推论 ~9.2.4 常用来将除法化为乘法。 接下来的 $e^x$ 和 $\sin x$ 在 $x\to 0$ 时的更高阶展开方法,依赖于下面这个引理。 -- **引理 ~9.2.4**:设 $X\subseteq \mathbb R$ 包含 $0$ 的某个邻域,函数 $f:X\to\mathbb R$ 在 $x=0$ 处连续,$f(0)=0$,且 $\lim\limits_{x\to 0}\frac{f(2x)-f(x)}{x}=\lambda$。那么当 $x\to 0$ 时,$f(x)=\lambda x+o(x)$。 +- **引理 ~9.2.5**:设 $X\subseteq \mathbb R$ 包含 $0$ 的某个邻域,函数 $f:X\to\mathbb R$ 在 $x=0$ 处连续,$f(0)=0$,且 $\lim\limits_{x\to 0}\frac{f(2x)-f(x)}{x}=\lambda$。那么当 $x\to 0$ 时,$f(x)=\lambda x+o(x)$。 **证明**:设 $\varepsilon>0$ 是任意正实数,存在 $\delta>0$ 使得对于任意 $x$ 有 $0<|x|<\varepsilon\implies |f(2x)-f(x)-\lambda x|<\varepsilon|x|$。 @@ -169,7 +173,7 @@ 对于 $|f(x)-f(\frac x{2^n})-\lambda(1-\frac 1{2^n})x|<(1-\frac 1{2^n})\varepsilon|x|$,让 $n\to +\infty$,得到 $|f(x)-\lambda x|\leq \varepsilon|x|$。从而当 $x\to 0$ 时,$f(x)=\lambda x+o(x)$。 -- **例 ~9.2.5**:$e^x$ 和 $\sin x$ 在 $x\to 0$ 时的更高阶展开。 +- **例 ~9.2.6**:$e^x$ 和 $\sin x$ 在 $x\to 0$ 时的更高阶展开。 1. 当 $x\to 0$ 时,$e^x=1+x+\frac {x^2}2+o(x^2)$。 @@ -211,7 +215,7 @@ \end{aligned} $$ - 这里使用类似引理 ~9.2.4 的证明方法,归纳证明对任意 $\varepsilon>0$,存在 $\delta>0$,使得对任意 $x$ 满足 $|x|<\delta$ 和自然数 $k$ 有: + 这里使用类似引理 ~9.2.5 的证明方法,归纳证明对任意 $\varepsilon>0$,存在 $\delta>0$,使得对任意 $x$ 满足 $|x|<\delta$ 和自然数 $k$ 有: $$ \left|g(x)-\frac{1}{2^{k}}g\left(\frac{x}{2^{k}}\right)+\frac 12\left(\frac{1}{4}+\frac 1{4^2}+\cdots+\frac{1}{4^{k}}\right)x\right|\leq \varepsilon\left(1-\frac{1}{2^{k}}\right)|x| @@ -221,6 +225,31 @@ 这种方法的思路可以理解为:我们知道待展开函数 $f$ 的 $f(x)$ 和 $f(\frac x2)$ 有关系,并且 $f$ 在 $0$ 处收敛到 $L$,那么我们就能利用这个关系,推出 $f(x)$ 与 $f(\frac x2),f(\frac x4),\cdots,f(\frac x{2^k}),\cdots$ 的关系,再利用 $f$ 在 $0$ 处收敛,推出 $f(x)$ 与 $L$ 的关系,也就得到一个仅描述 $f(x)$ 而不与 $f(\frac x2)$ 有关的式子。 +除此之外,有一些函数,在 $x\to 0$ 时是任何 $x^n$ 的小 $o$(也就是说它们没有多项式的渐近展开),此时它们之间仍然是有阶的大小区分的,于是我们需要熟知一些这样的函数的阶的大小关系。不过,更为一般和熟知的是比较一些函数在无穷远处增长速度的阶的大小关系,两者可以通过取倒数来等价。 + +- **引理 ~9.2.7**:设函数 $f,g:\mathbb N^+\to\mathbb R$ 满足 $\lim\limits_{n\to +\infty} f(n)=\lim\limits_{n\to +\infty} g(n)=+\infty$ 且 $g(n)=o(f(n)),n\to+\infty$。那么当 $n\to+\infty$ 时: + + 1. $c=o(f(n))$,其中 $c\in\mathbb R$。 + + 2. $\ln(f(n))=o(f(n))$。 + + **证明**:$\lim\limits_{n\to+\infty}\frac{\ln f(n)}{f(n)}=\lim\limits_{x\to+\infty}\frac{\ln x}{x}=\ln \lim\limits_{x\to+\infty}x^{\frac 1x}=\ln 1=0$。 + + 3. $c^{g(n)}=o(c^{f(n)})$,其中 $c>1$。 + + **证明**:显然放个底数在下面只会放大它们的差距。 + + 4. $f(n)^{f(n)^{d}}=o(c^{f(n)})$,其中 $d<11$。 + + 作为上述性质的推论,我们可以排列出下列函数,其中任意相邻的两者中前者都是后者的小 $o$: + $$ + 1\prec \ln\ln n\prec \ln n\prec n^{\frac 12}\prec \frac{n}{\ln n}\prec n\prec n^{\log n}\prec n^{n^{\frac 12}}\prec 2^n\prec n!\prec n^n\prec c^{c^n} + $$ + ## ~9.3 应用:9.12 一些其他的工具 有界闭区间套的经典应用是二分法,这样闭区间的长度收敛到 $0$,从而它们的交集只含唯一的实数。这里就不举例了。 diff --git a/src/第10章 函数的微分.md b/src/第10章 函数的微分.md index ca0fe07..0bf806a 100644 --- a/src/第10章 函数的微分.md +++ b/src/第10章 函数的微分.md @@ -18,13 +18,11 @@ 设 $\varepsilon>0$ 是任意正实数。任取 $\varepsilon'>0$,根据命题 10.1.2,存在 $0<\delta\leq \frac \varepsilon {\varepsilon'+|L|}$,使得对于任意 $x\in X$ 且 $|x-x_0|\leq \delta$,都有 $|f(x)-(f(x_0)+L(x-x_0))|\leq\varepsilon'|x-x_0|$,得到 $|f(x)-f(x_0)|\leq(\varepsilon'+|L|)|x-x_0|\leq (\varepsilon'+|L|)\delta\leq \varepsilon$。证毕。 -连续不一定可微。例如绝对值函数 $f(x):=|x|$ 在 $0$ 处连续但不可微。 +连续不一定可微。例如绝对值函数 $f(x):=|x|$ 在 $0$ 处连续但不可微。另一个反例是,构造 $f:[0,+\infty)\to \mathbb R$ 满足 $f(x):=\begin{cases}x&\exists_{n\text{为正偶数}},x=\frac1n\\-x&\exists_{n为正奇数},x=\frac1n\\0&\text{true}\end{cases}$,那么 $f$ 同样是在 $0$ 处连续但不可微(斜率存在 $0,-1,1$ 三种)的。”图像有切线“ 也不一定可微,因为切线可能是垂直的,例如 $f(x):=\sqrt x$ 在 $0$ 处就连续但不可微。 -另一个反例是,构造 $f:[0,+\infty)\to \mathbb R$ 满足 $f(x):=\begin{cases}x&\exists_{n\text{为正偶数}},x=\frac1n\\-x&\exists_{n为正奇数},x=\frac1n\\0&\text{true}\end{cases}$,那么 $f$ 同样是在 $0$ 处连续但不可微(斜率存在 $0,-1,1$ 三种)的。这个构造给我们一种启发:先构造一个在序列上的反例 $(a_n)_{n=1}^{\infty}$,然后通过令 $f(\frac1n):=a_n$ 把序列的反例放到函数啥上。 +连续(极限)和微分在某种意义上是相似的:考虑函数 $f$ 在 $x_0$ 处是连续的,其实等价于 $f(x)=f(x_0)+o(1),x\to x_0$;而 $f$ 在 $x_0$ 处有导数 $f'(x_0)$,就等价于 $f(x)=f(x_0)+f'(x_0)(x-x_0)+o(x-x_0),x\to x_0$。这说明 “极限” 实际上描述了 $f$ 在 $x_0$ 附近的常数近似(从而 ”连续“ 或 ”有极限“ 是在说明 $f$ 在 $x_0$ 附近有常数近似),而 “微分” 实际上描述了 $f$ 在 $x_0$ 附近的线性近似(从而 ”可微“ 是在说明 $f$ 在 $x_0$ 附近有线性近似),进一步地,如果存在 $a_0,a_1,\cdots,a_n$ 使得 $f(x)=a_0+a_1(x-x_0)+a_2(x-x_0)^2+\cdots+a_n(x-x_0)^n+o((x-x_0)^n)$,我们就找到了 $f$ 在 $x_0$ 附近的多项式近似(注意这与所谓的 ”高阶导数“ 是完全不同的概念)。所以无论如何,极限、导数、多项式近似,都是为了用更简单的方式刻画 $f$ 在某一点附近的函数性质。当然,作为推论,可微性蕴含连续性是极其合理的。 -//连续意味着能一笔画完,可微意味着平滑? - -//可微函数的导函数不一定连续:$f(x):=\begin{cases}x^2\sin \frac 1x &x\neq 0\\0&x=0\end{cases}$。 +可微函数的导函数不一定连续:$f(x):=\begin{cases}x^2\sin \frac 1x &x\neq 0\\0&x=0\end{cases}$,其导数为 $f'(x)=\begin{cases}2x\sin \frac 1x-\cos \frac 1x&x\neq 0\\0& x=0\end{cases}$,那么对于任意正整数 $k$ 有 $f'(\frac 1{2k\pi})=\frac{1}{k\pi}\sin(2k\pi)-\cos(2k\pi)=-1$,则 $f'$ 在 $0$ 处不连续。 - **定义 10.1.4**:设 $X\subseteq \mathbb R$,$f:X\to \mathbb R$ 是函数。称 $f$ 是可微的,当且仅当对于任意 $x_0\in X$ 且是 $X$ 的聚点,都有 $f$ 在 $x_0$ 处可微。 @@ -32,7 +30,7 @@ **证明**:联合定义 10.1.4 和 “$f$ 在任何孤立点 $x_0$ 处都连续” 这一事实。 -- **定理 10.1.6(微分算法)**:设 $X\subseteq \mathbb R$,$x_0\in X$ 且是 $X$ 的聚点,$f:X\to\mathbb R$ 和 $g:X\to \mathbb R$ 是函数。 +- **定理 10.1.6(微分算律)**:设 $X\subseteq \mathbb R$,$x_0\in X$ 且是 $X$ 的聚点,$f:X\to\mathbb R$ 和 $g:X\to \mathbb R$ 是函数。 1. 若 $f$ 是常值函数,则 $f$ 可微且 $f'(x_0)=0$。 2. 若对于任意 $x\in X$ 有 $f(x)=x$,则 $f$ 可微且 $f'(x_0)=1$。 @@ -56,7 +54,7 @@ 当然,正确的方向应该是从后往前推,这样才是正确使用极限算律的方向。 -- **定理 10.1.7(链式法则)**:设 $X,Y\subseteq \mathbb R$,$x_0\in X$ 且是 $X$ 的聚点,$f:X\to Y$ 是在 $x_0$ 处可微的函数,$y_0:=f(x_0)$ 是 $Y$ 的聚点,$g:Y\to \mathbb R$ 是在 $y_0$ 处可微的函数。那么函数 $g\circ f:X\to \mathbb R$ 在 $x_0$ 处可微,且 $(g\circ f)'(x_0)=g'(y_0)f'(x_0)$。 +- **定理 10.1.7(链式法则)**:设 $X,Y\subseteq \mathbb R$,$x_0\in X$ 且是 $X$ 的聚点,$f:X\to Y$ 是在 $x_0$ 处可微的函数,$y_0:=f(x_0)\in Y$ 是 $Y$ 的聚点,$g:Y\to \mathbb R$ 是在 $y_0$ 处可微的函数。那么函数 $g\circ f:X\to \mathbb R$ 在 $x_0$ 处可微,且 $(g\circ f)'(x_0)=g'(y_0)f'(x_0)$。 **证明**:设 $k_1:=f'(x_0)$ 和 $k_2:=g'(y_0)$。设 $\varepsilon>0$ 是任意正实数。 @@ -81,7 +79,6 @@ \end{aligned} $$ - 证毕。 ## 10.2 局部极值和导数 @@ -93,7 +90,7 @@ 显然 $f$ 的孤立点是同时达到局部最大值和局部最小值的。 -- **命题 10.2.2(局部极值是稳定的)**:设实数 $a,b$ 且 $a0$ 使得对于任意 $x\in (a,b)$ 且 $|x-x_0|\leq\delta_1$ 有 $f(x)\leq f(x_0)$。 @@ -107,27 +104,62 @@ 该命题的逆命题也不一定成立,导数为 $0$ 并不一定是局部极值,而应当出现导数正负性变化才行,例如 $f(x):=x^3$ 在 $0$ 处导数为 $0$ 但并非局部极值。 -- **定理 10.2.3(罗尔定理)**:设实数 $a,b$ 且 $aM(y-x)$。根据拉格朗日中值定理,存在 $z\in(x,y)$ 使得 $f'(z)=\frac{f(y)-f(x)}{y-x}$,那么 $|f'(z)|>M$,矛盾。 -- **推论 10.2.6**:设 $f:I\to\mathbb R$ 是实区间 $I$ 上的连续函数,满足 $f$ 在任意 $x\in I\setminus\{\inf I,\sup I\}$ 处可微且 $|f'(x)|\leq M$。那么 $f$ 是一致连续函数。 +- **推论 10.2.6**:设 $f:I\to\mathbb R$ 是实区间 $I$ 上的连续函数,$\overparen I=I\setminus\{\inf I,\sup I\}$,满足 $f$ 在任意 $x\in \overparen I$ 处可微且 $|f'(x)|\leq M$。那么 $f$ 是一致连续函数。 -- **引理 10.2.7**:设 $F:I\to\mathbb R$ 和 $G:I\to\mathbb R$ 都是实区间 $I$ 上的连续函数,它们在任意 $x\in I\setminus\{\inf I,\sup I\}$ 处可微且导数相同。那么存在 $C\in\mathbb R$,使得对于任意 $x\in I$ 有 $G(x)=F(x)+C$。 +- **引理 10.2.7**:设 $F:I\to\mathbb R$ 和 $G:I\to\mathbb R$ 都是实区间 $I$ 上的连续函数,它们在任意 $x\in \overparen I$ 处可微且导数相同。那么存在 $C\in\mathbb R$,使得对于任意 $x\in I$ 有 $G(x)=F(x)+C$。 **证明**:考虑函数 $H=G-F$,再结合命题 10.2.5。 -注意推论 10.2.6 的逆命题并不成立,例如由 $f(x):=\sqrt x$ 定义的函数 $f:(0,+\infty)\to\mathbb R$ 是可微且一致连续的函数,但其导数无界。 +事实上,罗尔定理可以推广到无限区间。 + +- **定理 10.2.8(广义罗尔定理)**:设 $a,b\in \mathbb R^*$ 且 $a< b$,$f:(a,b)\to\mathbb R$ 是可微函数,且 $\lim\limits_{x\to a}f(x)=\lim\limits_{x\to b}f(x)=A\in\mathbb R\cup\{\pm\infty\}$。那么存在 $x\in(a,b)$ 使得 $f'(x)=0$。 + + **证明**:只证明 $a=-\infty,b=+\infty$ 的情况。排除 $f$ 是常值函数的特殊情况,那么存在 $x_0\in\mathbb R$ 使得 $f(x_0)\neq A$。不妨假设 $f(x_0)f(x_0)$。不妨假设 $f(x_0)0$,则 $f$ 是严格单调增的。 +- **命题 10.3.2**:设 $f:I\to\mathbb R$ 是实区间 $I$ 上的连续函数,$\overparen I=I\setminus\{\inf I,\sup I\}$,满足 $f$ 在任意 $x\in \overparen I$ 处可微且导数恒正,则 $f$ 是严格单调增的。 - **证明**:若存在 $x,y\in [a,b]$ 且 $x0$。 + + 若 $n$ 是偶数,则 $x_0$ 是 $f$ 的严格极小值点;若 $n$ 是奇数,则 $f$ 在 $x_0$ 附近严格单调增。 + + **证明**:$n$ 阶导数 $>0$,说明 $n-1$ 阶导函数在 $x_0$ 附近左侧为负、右侧为正,说明 $n-2$ 阶导数在 $x_0$ 处是严格极小值点(从而左右侧附近都为正),说明 $n-3$ 阶导数在 $x_0$ 附近严格单调增(从而附近左侧为负、右侧为正),陷入循环。 + +对于 $f^{(n)}(x_0)<0$ 的情况,也有类似的结论。 + +## 10.7 凸函数 + +- **定义 10.7.1(凸函数)**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是函数。称 $f$ 是下凸的,当且仅当对任意 $x_1,x_2\in I \land x_1\neq x_2$ 和 $0(1-t)f(x_1)+tf(x_2)$,记 $x_3=(1-t)x_1+tx_2$,类似引理 10.7.2 的证明,可以证明 $k(x_1,x_3)>k(x_1,x_2)>k(x_3,x_2)$,根据拉格朗日中值定理,存在 $a\in (x_1,x_3),b\in (x_3,x_2)$ 使得 $f'(a)=k(x_1,x_3)>k(x_3,x_2)=f'(b)$,与 $f'$ 单调增矛盾。 + + 严格下凸推严格单调增时,由于极限的非严格保序,所以需要在 $(x_1,x_2)$ 间随便多找一个中间点严格地把 $f'(x_1),f'(x_2)$ 隔开。而严格单调增推严格下凸是类似的。 + +- **推论 10.7.4(凸函数与其二阶导函数)**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是 $2$ 阶可微函数。那么 $f$ 是下凸函数当且仅当 $f''$ 是恒非负的。若 $f''$ 是恒正的,那么 $f$ 是严格下凸函数。 + +注意 $f'$ 严格单调增并不能推出 $f''$ 恒正,从而 $f$ 严格下凸并不能推出 $f''$ 恒正。例如 $x^4$ 是严格下凸函数,其导函数 $4x^3$ 是严格单调增的,但其 $2$ 阶导函数 $12x^2$ 就不是恒正的。 + +- **定义 10.7.5(单侧的可微性)**:设 $X\subseteq \mathbb R$,$x_0\in X$,$f:X\to\mathbb R$ 是函数。 + + 若 $x_0$ 是 $X\cap(-\infty,x_0)$ 的附着点,称 $f$ 在 $x_0$ 处左侧可微且具有左导数 $L$,记作 $f'_-(x_0):=L$,当且仅当 $\lim\limits_{x\to x_0^-}\dfrac{f(x)-f(x_0)}{x-x_0}$ 收敛到 $L$。 + + 若 $x_0$ 是 $X\cap(x_0,+\infty)$ 的附着点,称 $f$ 在 $x_0$ 处右侧可微且具有右导数 $L$,记作 $f'_+(x_0):=L$,当且仅当 $\lim\limits_{x\to x_0^+}\dfrac{f(x)-f(x_0)}{x-x_0}$ 收敛到 $L$。 + +- **引理 10.7.6**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是(严格)下凸函数,$\overparen{I}=I\setminus\{\inf I,\sup I\}$。那么 $f$ 在 $\overparen I$ 上每点左侧可微且右侧可微,$f'_-(x_0)\leq f'_+(x_0)$ 对任意 $x_0\in \overparen I$ 成立,且 $f'_-,f'_+$ 均(严格)单调增。 + + **证明**:设 $x_0\in \overparen I$,对任意 $x_1,x_2\in I\land x_10\\-1&x=0\end{cases}$ 是上凸函数,但在 $0$ 处右侧不可微,且在 $0$ 处也不连续。 + +- **引理 10.7.8**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是下凸函数,$\overparen{I}=I\setminus\{\inf I,\sup I\}$,$x_0\in \overparen I$。若 $f'_-$ 在 $x_0$ 处连续,那么 $f$ 在 $x_0$ 处可微。 + + **证明**:对任意 $x\in I$ 且 $x>x_0$,我们知道 $k(x_0,x)\leq f'_-(x)$,而 $\lim\limits_{x\to x_0^+}f_-'(x)=f_-'(x_0)$,那么 $f'_+(x_0)=\lim\limits_{x\to x_0^+}k(x_0,x)\leq f'_-(x_0)$,于是 $f'_+(x_0)=f'_-(x_0)$,$f$ 在 $x_0$ 处可微。 + +- **推论 10.7.9**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是下凸函数,那么 $f$ 在至多可数个位置不可微。 + + **证明**:$f_-'$ 在 $\overparen I$ 上是单调函数,故 $f_-'$ 的间断点只有可数多个,从而 $f$ 在 $\overparen I$ 上只有至多可数个位置不可微,即 $f$ 在 $I$ 上也只有至多可数个位置不可微。 + +凸函数的最值可以借助其导数判断。 + +- **引理 10.7.10**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是下凸函数,$\overparen{I}=I\setminus\{\inf I,\sup I\}$,$S:=\{x\in\overparen I:f'_-(x)\leq 0\}$。若 $S$ 非空且 $\sup S\neq \sup I$,那么 $S$ 有最大值且 $\max S=\max\{x\in I:x\text{ 是 }f\text{ 的最小值点}\}$。 + + **证明**:记 $x_0:=\sup S$,那么对任意 $x\in \overparen I\land x0$,那么可以类似地证明 $f$ 在 $I\cap (x_0,+\infty)$ 上严格单调增,从而 $x_0$ 是 $f$ 的最小值点,且 $x_0$ 右侧不再有任何 $f$ 的最小值点。 + +注意到引理 10.7.10 中证明 $f$ 在 $x_0$ 左侧单调减时用到了 $f$ 的凸性,但实际上也可以把条件约束变得更强。 + +- 设 $f$ 是区间上的连续函数,$f$ 在定义域上任意处左侧可微且左导数恒小于等于 $0$,那么 $f$ 是单调减的。 + +该命题不需要用到 $f$ 的凸性,但仍然是正确的。读者可以尝试自证。 + +- **定理 10.7.11(凸函数在其任意一条切线之上)**:设 $I\subseteq\mathbb R$ 是区间,$x_0\in I$,$f:I\to\mathbb R$ 是下凸函数,$f$ 在 $x_0$ 处左侧可微。那么对于任意 $x\in I$,$f(x)\geq f(x_0)+f'_-(x_0)(x-x_0)$。 + + **证明**:定义 $g:I\to\mathbb R$ 满足 $g(x):=f(x)-(f(x_0)+f'_-(x_0)(x-x_0))$。由于 $g$ 是凸函数减一次函数,求导后就是导函数再减去一个常数,从而单调性保持,那么 $g$ 仍然是凸函数。而 $g'_-(x_0)=f'_-(x_0)-f'_-(x_0)=0$,那么 $g(x_0)=0$ 是 $g$ 的最小值。 + +在推论 10.7.7 中,我们说了 $f$ 在 $\overparen I$ 上是连续的。接下来我们说明,闭区间上的凸函数在端点处有极限,从而它几乎是连续的(只需把端点处的值修正)。 + +- **引理 10.7.12**:设 $a,b\in\mathbb R\land aL-\varepsilon$ 的范围内矛盾。 + +牛顿迭代法适用在凸函数上。 + +- **定理 10.7.13(牛顿迭代法)**:设 $a,b\in\mathbb R\land a0$,存在序列 $(x_n)_{n=0}^{\infty}$ 满足 $x_{n+1}=x_n-\frac{f(x_n)}{f'(x_n)}$ 对任意 $n$ 成立,且该序列收敛到 $f$ 的唯一零点。 + + **证明**:归纳地假设 $x_n \in(a,b)$ 且 $f(x_n)\geq 0$。$x_{n+1}$ 是 $f$ 在 $x_n$ 处的切线与 $x$ 轴的交点,由于导数为正,所以 $x_{n+1}\leq x_n$。同时 $x_{n+1}>a$,否则根据函数图像在该切线上方说明函数图像整体在 $x$ 轴上方,矛盾。于是 $x_{n+1}\in(a,b)$,而 $f(x_{n+1})\geq 0$ 是由函数图像在切线上方得到的。 + + 从而 $(x_n)_{n=0}^{\infty}$ 单调有界收敛,设极限为 $x^*$。易证 $x^*\in(a,b)$ 且 $f(x^*)\geq 0$。 + + 由于 $f'$ 在 $(a,b)$ 上是单调的,而根据推论 10.2.11 可知 $f'$ 不存在第一类间断点,而开区间上的单调函数本身不应该存在第二类间断点,从而 $f'$ 在 $(a,b)$ 上连续,那么 $x-\frac{f(x)}{f'(x)}$ 也在 $(a,b)$ 上有定义且连续,从而: + $$ + x^*-\frac{f(x^*)}{f'(x^*)}=\lim_{n\to+\infty}x_n-\frac{f(x_n)}{f'(x_n)}=\lim_{n\to+\infty}x_{n+1}=x^* + $$ + 这蕴含 $f(x^*)=0$。 + +最后,我们推广凸函数的定义。 + +- **定义 10.7.14(凸集)**:设 $n$ 是正整数,$C\subseteq\mathbb R^n$,称 $C$ 是凸集,当且仅当对任意 $x_1,x_2\in C$ 和 $t\in(0,1)$,有 $(1-t)x_1+tx_2\in C$。 + +凸集的几何直观解释是:凸集中任意两点为端点的线段也在 $C$ 中。$\mathbb R$ 中的凸集就是区间。 + +- **定义 10.7.15(凸函数)**:设 $n$ 是正整数,$C\subseteq\mathbb R^n$ 是凸集,$f:C\to\mathbb R$ 是函数。称 $f$ 是下凸的,当且仅当对任意 $x_1,x_2\in C$ 和 $t\in(0,1)$,有 $f((1-t)x_1+tx_2)\leq(1-t)f(x_1)+tf(x_2)$。称 $f$ 是上凸的,当且仅当 $-f$ 是下凸的。 + +那么定义 10.7.1 与上述定义是相容的。 + +- **引理 10.7.16**:设 $n$ 是正整数,$C\subseteq\mathbb R^n$ 是凸集,$f:C\to\mathbb R$ 是函数。那么 $f$ 是下凸的,当且仅当 $\{(x,y):x\in C,y\in \mathbb R,y\geq f(x)\}$ 是凸集。 + +引理 10.7.16 中所述的集合有时被称为 $f$ 的 “上镜图”。 \ No newline at end of file