Compare commits

...

2 Commits

4 changed files with 443 additions and 86 deletions

View File

@ -1,6 +1,4 @@
## ~10.1 导数的计算 ## ~10.1 导数的计算和应用
计算的前提仍然是了解常见函数的导数。
- **例 ~10.1.1**:设 $a\in\mathbb R$ 是常数。在各自函数的定义域中: - **例 ~10.1.1**:设 $a\in\mathbb R$ 是常数。在各自函数的定义域中:
@ -14,4 +12,67 @@
5. $(e^x)'=e^x,(\ln x)'=\frac{1}{x}$。 5. $(e^x)'=e^x,(\ln x)'=\frac{1}{x}$。
6. 三角函数的导数,待补。 6. $(\sin x)'=\cos x,(\cos x)'=-\sin x,(\tan x)'=\frac{1}{\cos^2 x}$。
**证明**$\lim\limits_{h\to 0}\frac{\sin(x+h)-\sin x}{h}=\lim\limits_{h\to 0}\frac{\sin x(\cos h-1)+\cos x\sin h}{h}=\sin x\lim\limits_{h\to 0}\frac{\cos h-1}{h}+\cos x\lim\limits_{h\to 0}\frac{\sin h}{h}=\cos x$
$(\cos x)'=(\sin(\frac{\pi}2-x))'=-\cos(\frac\pi2-x)=-\sin x$
$(\tan x)'=(\frac{\sin x}{\cos x})'=\frac{\cos^2x+\sin^2x}{\cos^2 x}=\frac 1{\cos^2x}$。
7. $(\arcsin x)'=\frac{1}{\sqrt{1-x^2}},(\arccos x)'=-\frac{1}{\sqrt{1-x^2}},(\arctan x)'=\frac{1}{1+x^2}$。
**证明**$(\arcsin x)'=\frac{1}{\cos(\arcsin x)}=\frac{1}{\sqrt{1-\sin^2(\arcsin x)}}=\frac{1}{\sqrt{1-x^2}}$$\arccos$ 同理;
$(\arctan x)'=\cos^2(\arctan x)=\frac{\cos^2(\arctan x)}{\cos^2(\arctan x)+\sin^2(\arctan x)}=\frac{1}{1+x^2}$。
- **例 ~10.1.2**:设 $a\in\mathbb R$,讨论由 $f(x):=(1+\frac 1x)^{x+a}$ 定义的函数 $f:(-\infty,-1)\cup (0,+\infty)\to\mathbb R$ 的单调性。
**解**:当 $x>0$ 时,$(1+\frac{1}{1-x})^{(1-x)+a}=(1+\frac{1}{x})^{x+1-a}$,所以 $(1+\frac 1x)^{x+a}$ 在 $(-\infty,-1)$ 上的图像与 $(1+\frac 1x)^{x+1-a}$ 在 $(0,+\infty)$ 上的图像是关于 $x=-\frac12$ 对称的。所以下面我们只考虑 $f$ 的定义域为 $(0,+\infty)$ 的情况。
底和指数都带变量的函数的导数一般不好直接计算(注意 $(x^x)'\neq x\cdot x^{x-1}\cdot 1$),所以一般先将函数取对数,变为 $g(x):=(x+a)\ln(1+\frac 1x)$,此时单调性不变。
$$
g'(x)=\ln\left(1+\frac 1x\right)+(x+a)\frac{-\frac 1{x^2}}{1+\frac 1x}=\ln\left(1+\frac 1x\right)-\frac{x+a}{x(x+1)}
$$
我们要关注的是 $g'$ 的正负性。这里带 $\ln$ 仍然不好处理,考虑再求一次导把 $\ln$ 去掉:
$$
g''(x)=-\frac{1}{x(x+1)}-\frac{x(x+1)-(x+a)(2x+1)}{x^2(x+1)^2}=\frac{(2a-1)x+a}{x^2(x+1)^2}
$$
此时变为关注 $g''$ 的零点,它对应 $g'$ 的极值点。当然,$0^+$ 和 $+\infty$ 也可能成为 $g'$ 的 “极值点”,所以我们可以先把它们的极限求出:
$$
\lim_{x\to +\infty}g'(x)=\lim_{x\to+\infty}\ln\left(1+\frac 1x\right)-\frac{x+a}{x(x+1)}=\lim_{x\to+\infty}\ln\left(1+\frac 1x\right)-\lim_{x\to+\infty}\frac{x+a}{x(x+1)}=0\\
\begin{aligned}
\lim\limits_{x\to0^+}g'(x)&=\lim_{x\to 0}\ln\left(1+\frac 1x\right)-\frac{x+a}{x(x+1)}\\
&=\lim_{x\to 0^+}\ln\left(\frac 1x\left(\frac{1+\frac 1x}{\frac 1x}\right)\right)-\frac 1x\left(1+\frac{a-1}{x+1}\right)\\
&=\lim_{x\to 0^+}\left(\ln \frac 1x-\frac 1x\right)+\lim_{x\to 0^+}\ln(1+x)-\lim_{x\to 0^+}\frac{a+1}{x(x+1)}\\
&=-\infty
\end{aligned}
$$
- 若 $0<a<\frac 12$那么 $g''(x)=0\iff x=\frac{a}{1-2a}$。此时 $g'(\frac a{1-2a})=\ln(\frac{1}{a}-1)-2(1-2a)$。
由 $h(a):=\ln(\frac{1}{a}-1)-2(1-2a)$ 定义函数 $h:(0,\frac 12)\to \mathbb R$。由于 $\lim\limits_{a\to \frac 12}h(a)=0$,而 $h'(a)=\frac 1{(a-1)a}+4<0$ $h$ 恒正那么 $g'(\frac a{1-2a})>0$。而 $\lim\limits_{x\to 0^+}g'(x)=-\infty,\lim\limits_{x\to+\infty}g'(x)=0$。这说明 $g'$ 先恒负后恒正,即 $g$ 先严格单调减,后严格单调增。
- 若 $a\geq \frac 12$。那么 $g''(x)$ 恒不为 $0$,于是 $g'(x)$ 单调。再结合 $g'$ 在 $0^+$ 和 $+\infty$ 处的极限可知 $g'$ 恒负。从而 $g$ 严格单调减。
## ~10.2 泰勒公式的计算和应用
- **例 ~10.2.1**:设 $n\in\mathbb N$。当 $x\to 0$ 时:
1. $e^x=1+x+\frac{x^2}{2}+\cdots+\frac{x^n}{n!}+o(x^n)$。
2. $(1+x)^{\alpha}=1+\alpha x+\cdots+\frac{\alpha^{\underline{n}}}{n!}x^n+o(x^n)$。
3. $\ln(1+x)=x-\frac{x^2}{2}+\cdots+\frac{(-1)^n}{n+1}x^{n+1}+o(x^{n+1})$。
4. $\sin x=x-\frac{x^3}{3!}+\cdots+\frac{(-1)^nx^{2n+1}}{(2n+1)!}+o(x^{2n+2})$
$\cos x=1-\frac{x^2}{2!}+\cdots+\frac{(-1)^nx^{2n}}{(2n)!}+o(x^{2n+1})$
$\arctan x=x-\frac{x^3}{3}+\cdots+\frac{(-1)^nx^{2n+1}}{2n+1}+o(x^{2n+2})$
$\arcsin x=x+\frac{x^3}{6}+\cdots+\frac{(2n-1)!!x^{2n+1}}{(2n)!!(2n+1)}+o(x^{2n+2})$,其中 $(2n)!!=\prod_{i=1}^n2i$$(2n-1)!!=\prod_{i=1}^n(2i-1)$。
- **例 ~10.2.2**:设序列 $(x_n)_{n=0}^{\infty}$ 满足 $x_{n+1}=\sin x_n$。求 $n\to+\infty$ 时,$x_n$ 的渐近展开式。
**解**

118
src/~7.md Normal file
View File

@ -0,0 +1,118 @@
//离散的极限已经学习完成
## ~7.1 不等式
微积分的核心思想是通过近似和逼近解决问题,过程中常常需要用到放缩的手法(而不是单纯的解不等式),所以一些基本的不等式是重要的工具。接下来我们将会介绍一些常见的不等式,它们的证明思路多是归纳法。
下面假设 $((\mathbb F,+,\times,0,1),\leqslant )$ 是序域。
- **定理 ~7.1.1(柯西施瓦茨不等式)**:设 $n\in\mathbb N$$a_1,\cdots,a_n,b_1,\cdots,b_n\in\mathbb F$,那么:
$$
\left(\sum_{i=1}^na_ib_i\right)^2\leq\left(\sum_{i=1}^na_i^2\right)\left(\sum_{i=1}^nb_i^2\right)
$$
其中 $\leq$ 取等当且仅当存在 $\lambda\in\mathbb F$ 使得 $\forall_{1\leq i\leq n},a_i=\lambda b_i$ 或 $\forall_{1\leq i\leq n},b_i=\lambda a_i$。
**证明**:对 $n$ 归纳证明下式即可。
$$
\left(\sum_{i=1}^na_i^2\right)\left(\sum_{i=1}^nb_i^2\right)-\left(\sum_{i=1}^na_ib_i\right)^2=\sum_{1\leq i<j\leq n}(a_ib_j-a_jb_i)^2
$$
定理 ~7.1.1 证明中的等式可以理解为,左侧,$|\alpha|^2|\beta|^2-(\alpha\cdot\beta)^2=\big(|\alpha||\beta|\sin\langle\alpha,\beta\rangle\big)^2$ 是 $\alpha$ 和 $\beta$ 所张成的平行四边形面积的平方,等于右侧,$\alpha$ 和 $\beta$ 在各 $2$ 维坐标平面上投影的平行四边形的面积平方和。
- **定理 ~7.1.2(伯努利不等式)**:设 $n\in\mathbb N$$x_1,\cdots,x_n\in\mathbb F\land x_1,\cdots,x_n>-1$,且对任意 $1\leq i,j\leq n$ 有 $x_ix_j\geq 0$。那么:
$$
\prod_{i=1}^n(1+x_i)\geq 1+\sum_{i=1}^nx_i
$$
其中 $\geq$ 取等当且仅当 $x_1,\cdots,x_n$ 中至多一个非零。
- **推论 ~7.1.3**:设 $n\in\mathbb N$$x\in\mathbb F\land x>-1$,那么:
$$
(1+x)^n\geq 1+nx
$$
其中 $\geq$ 取等当且仅当 $n\leq 1$ 或 $x=0$。
推论 ~7.1.3 常用于将乘方降级放缩为乘法运算。
- 设 $n\in\mathbb N^+$$x_1,\cdots,x_n\in\mathbb F\land x_1,\cdots,x_n\geq 0$,那么:
$$
\prod_{i=1}^nx_i\leq\left(\frac{\sum_{i=1}^nx_i}{n}\right)^n
$$
当然,解决问题的过程中,往往最困难的地方是如何正确地运用这些不等式,使放缩行之有效(不会放的太过或者放的角度不对)、恰到好处(恰好放成了需要的简单形式),这既需要对不等式的深入理解,也需要敏锐的观察能力。
## ~7.2 自然对数
- **引理 ~7.2.1**:序列 $\big((1+\frac 1n)^n\big)_{n=1}^{\infty}$ 和 $(\sum_{k=0}^n\frac 1{k!})_{n=1}^{\infty}$ 都有极限,且极限值相等。
**证明**
## ~7.3 三角函数
- **定义 ~7.3.1(三角函数)**:正弦 $\sin:\mathbb R\to\mathbb R$ 和余弦 $\cos:\mathbb R\to\mathbb R$ 是两个函数,满足存在实数 $\pi>0$ 使得:
1. $\cos 0=\sin\frac \pi2=1$$\cos \pi=-1$。
2. 设 $x,y\in \mathbb R$,那么 $\cos(x-y)=\cos x\cos y+\sin x\sin y$。
3. 设 $x\in\mathbb R$ 满足 $0<x<\frac \pi 2$那么 $0<\cos x<\frac{\sin x}{x}<\frac{1}{\cos x}$。
上述定义是公理化的,并不能说明三角函数存在,但在后续的章节中,我们确实可以构造出两个函数满足上面所述的性质,于是我们先做出如下假设。
- **假设 ~7.3.2**:存在函数 $\sin$ 和 $\cos$ 满足定义 ~7.3.1 中所述的性质。
根据三角函数的定义,我们可以得到如下性质。
- **引理 ~7.3.3**:三角函数的基本性质。
1. 设 $x\in\mathbb R$,那么 $\cos^2 x+\sin^2 x=1$。
2. $\pi$ 是唯一的。
3. $\sin 0=\sin \pi=\cos\frac{\pi}{2}=0$。
4. 设 $x\in\mathbb R$,那么:
$$
\begin{aligned}
\cos(-x)=\cos x,\quad\cos \left(\frac \pi2+x\right)=-\sin x,\quad\cos(\pi+x)=-\cos x,\quad\cos(2\pi+x)=\cos x\\
\sin(-x)=-\sin x,\quad\sin\left(\frac \pi 2+x\right)=\cos x,\quad\sin(\pi+x)=-\sin x,\quad\sin(2\pi+x)=\sin x
\end{aligned}
$$
5. 设 $x,y\in\mathbb R$,那么:
$$
\begin{aligned}
\cos(x+y)&=\cos x\cos y-\sin x\sin y\\
\sin(x+y)&=\sin x\cos y+\cos x\sin y\\
\sin x-\sin y&=2\sin \frac{x-y}{2}\cos\frac{x+y}{2}\\
\cos x-\cos y&=-2\sin\frac{x-y}{2}\sin\frac{x+y}{2}
\end{aligned}
$$
6. 设 $x\in\mathbb R$,那么:
$$
\begin{aligned}
\sin 2x&=2\sin x\cos x\\
\cos 2x&=\cos^2x-\sin^2x=2\cos^2x-1=1-2\sin^2x\\
\sin 3x&=3\sin x-4\sin^3x\\
\cos 3x&=4\cos^3x-3\cos x
\end{aligned}
$$
7. 设 $x\in\mathbb R$ 满足 $0<x<\frac \pi2$那么 $0<\cos x<\frac{\sin x}{x}<1$。
8. $\sin$ 在 $[-\frac{\pi}2,\frac{\pi}2]$ 上严格单调增,$\cos$ 在 $[0,\pi]$ 上严格单调减。
9. $2\pi$ 是 $\sin$ 和 $\cos$ 的最小正周期。
10. 定义正切函数 $\tan:=\frac{\sin}{\cos}$。那么:
1. $\tan$ 是奇函数。
2. $\tan$ 在 $(-\frac \pi2,\frac \pi2)$ 上有定义且是严格增函数。
3. 设 $x,y\in\mathbb R$ 满足 $0<y<x<\frac \pi 2$那么
$$
\tan(x-y)=\frac{\tan x-\tan y}{1+\tan x\tan y}
$$
**证明**:留作习题(也可能以后补)。
## ~7.4 序列极限的计算和应用

114
src/~9.md
View File

@ -55,7 +55,15 @@
当 $x\to a$ 时,可以通过换元变成 $x\to 0$,然后再换元变成 $x\to\infty$,从而也可能用这种整数夹挤实数的方法。 当 $x\to a$ 时,可以通过换元变成 $x\to 0$,然后再换元变成 $x\to\infty$,从而也可能用这种整数夹挤实数的方法。
- **例 ~9.1.5**:一些有简单但可能不易察觉到的做法的问题。 - **引理 ~9.1.5**:三角函数关于连续和极限的性质。
1. $\sin,\cos$ 是连续函数。
2. $\lim\limits_{x\to 0}\frac{\sin x}{x}=1$。**证明**:利用引理 ~7.3.3.7,联合夹挤定理。
3. $\lim\limits_{x\to 0}\frac{\tan x}{x}=1$。**证明**$\lim\limits_{x\to 0}\frac{\tan x}{x}=\frac{1}{\lim\limits_{x\to 0}\cos x}\lim\limits_{x\to 0}\frac{\sin x}{x}=1$。
4. $\lim\limits_{x\to 0}\frac{1-\cos x}{x^2}=\frac 12$。**证明**$\lim\limits_{x\to 0}\frac{1-\cos x}{x^2}=\lim\limits_{x\to 0}\frac{2\sin^2\frac x2}{4(\frac x2)^2}=\frac 12$。
5. $\sin,\cos$ 的值域都是 $[-1,1]$$\tan$ 的值域是 $\mathbb R$。
6. $\sin|_{[-\frac \pi2,\frac\pi2]}$ 有连续的反函数 $\arcsin:[-1,1]\to[-\frac\pi2,\frac\pi2]$$\cos|_{[0,\pi]}$ 有连续的反函数 $\arccos:[-1,1]\to [0,\pi]$$\tan|_{(-\frac \pi2,\frac\pi2)}$ 有连续的反函数 $\arctan:\mathbb R\to(-\frac\pi2,\frac\pi2)$。
- **例 ~9.1.6**:一些可能做法不易察觉的问题。
1. 设 $k>0$,求 $\lim\limits_{x\to+\infty}x^{\frac 1{x^k}}$。 1. 设 $k>0$,求 $\lim\limits_{x\to+\infty}x^{\frac 1{x^k}}$。
@ -115,7 +123,25 @@
其中当 $x\to 0$ 时,$\alpha x+o(x)$ 这个集合也整体趋于 $0$,从而对任意 $y\in\alpha x+o(x)$$e^{y}=1+y+o(y)$。那么 $e^{\alpha x+o(x)}=1+(\alpha x+o(x))+o(\alpha x+o(x)),x\to 0$ 是合理的。 其中当 $x\to 0$ 时,$\alpha x+o(x)$ 这个集合也整体趋于 $0$,从而对任意 $y\in\alpha x+o(x)$$e^{y}=1+y+o(y)$。那么 $e^{\alpha x+o(x)}=1+(\alpha x+o(x))+o(\alpha x+o(x)),x\to 0$ 是合理的。
4. 三角函数和反三角函数在 $0$ 处的的渐近展开。待主线补充三角函数的相关内容后再补。 4. 当 $x\to 0$ 时,
$$
\begin{aligned}
\sin x&=x+o(x)\\
\cos x&=1-\frac{x^2}2+o(x^2)\\
\tan x&=x+o(x)
\end{aligned}
$$
**证明**:利用引理 ~9.1.5 即可。
5. 当 $x\to 0$ 时,
$$
\begin{aligned}
\arcsin x&=x+o(x)\\
\arccos x&=\frac \pi 2-x+o(x)\\
\arctan x&=x+o(x)
\end{aligned}
$$
**证明**$\sin x=x+o(x),x\to 0$,那么 $x=\sin x+o(\sin x),x\to 0$,又由 $\lim\limits_{y\to 0}\arcsin(y)=0$ 可代入得 $\arcsin(y)=y+o(y)$;由 $\cos x=\sin(\frac \pi2-x)$ 知 $\arccos y=\frac \pi 2-\arcsin y$$\arctan x$ 的证明类似 $\arcsin x$。
初等函数也可以求更高阶展开,此时往往更具技巧性。 初等函数也可以求更高阶展开,此时往往更具技巧性。
@ -156,23 +182,41 @@
接下来的 $e^x$ 和 $\sin x$ 在 $x\to 0$ 时的更高阶展开方法,依赖于下面这个引理。 接下来的 $e^x$ 和 $\sin x$ 在 $x\to 0$ 时的更高阶展开方法,依赖于下面这个引理。
- **引理 ~9.2.5**:设 $X\subseteq \mathbb R$ 包含 $0$ 的某个邻域,函数 $f:X\to\mathbb R$ 在 $x=0$ 处连续,$f(0)=0$,且 $\lim\limits_{x\to 0}\frac{f(2x)-f(x)}{x}=\lambda$。那么当 $x\to 0$ 时,$f(x)=\lambda x+o(x)$。 - **引理 ~9.2.5**:设 $X\subseteq \mathbb R$ 包含 $0$ 的某个去心邻域,函数 $f:X\to\mathbb R$,常数 $\lambda>1\geq |A|,\alpha>0$。当 $x\to 0$ 时,$f(x)=o(1)$ 且 $f(\lambda x)-Af(x)-Bx^{\alpha}=o(x^{\alpha})$,那么 $f(x)=\frac{B}{\lambda^{\alpha}-A}x^{\alpha}+o(x^{\alpha})$。
**证明**:设 $\varepsilon>0$ 是任意正实数,存在 $\delta>0$ 使得对于任意 $x$ 有 $0<|x|<\varepsilon\implies |f(2x)-f(x)-\lambda x|<\varepsilon|x|$。 **证明**:设 $\varepsilon>0$ 是任意正实数,存在 $\delta>0$ 使得对于任意 $x$ 有 $0<|x|<\varepsilon\implies |f(\lambda x)-Af(x)-Bx^{\alpha}|<\varepsilon|x|$。
设 $x$ 满足 $0<|x|<\varepsilon$。归纳假设 $|f(x)-f(\frac{x}{2^n})-\lambda(1-\frac 1{2^n})x|<(1-\frac1{2^n})\varepsilon|x|$ 对自然数 $n$ 成立那么 设 $x$ 满足 $0<|x|<\varepsilon$。那么
$$
$$
\begin{aligned} \begin{aligned}
&\left|f(x)-f\left(\frac x{2^{n+1}}\right)-\lambda\left(1-\frac 1{2^{n+1}}\right)x\right|\\ f(x)-Af\left(\frac{x}{\lambda}\right)-B\left(\frac{x}{\lambda}\right)^{\alpha}&<\left|\frac{1}{\lambda^{\alpha}}\right|\varepsilon\left|x^\alpha\right|\\
=&\left|f(x)-f\left(\frac x{2^n}\right)-\lambda\left(1-\frac 1{2^n}\right)x+f\left(\frac x{2^n}\right)-f\left(\frac x{2^{n+1}}\right)-\lambda \frac 1{2^{n+1}} x\right|\\ Af\left(\frac{x}{\lambda}\right)-A^2f\left(\frac{x}{\lambda^2}\right)-AB\left(\frac{x}{\lambda^2}\right)^{\alpha}&<\left|\frac{A}{\lambda^{2\alpha}}\right|\varepsilon\left|x^\alpha\right|\\
\leq &\left|f(x)-f\left(\frac x{2^n}\right)-\lambda\left(1-\frac 1{2^n}\right)x\right|+\left|f\left(\frac x{2^n}\right)-f\left(\frac x{2^{n+1}}\right)-\lambda \frac 1{2^{n+1}} x\right|\\ A^2f\left(\frac{x}{\lambda^2}\right)-A^3f\left(\frac{x}{\lambda^3}\right)-A^2B\left(\frac{x}{\lambda^3}\right)^{\alpha}&<\left|\frac{A^2}{\lambda^{3\alpha}}\right|\varepsilon\left|x^\alpha\right|\\
<&\left(1-\frac 1{2^n}\right)\varepsilon|x|+\varepsilon \left|\frac x{2^{n+1}}\right|=\left(1-\frac 1{2^{n+1}}\right)\varepsilon|x| &\vdots\\
A^{n-1}f\left(\frac{x}{\lambda^{n-1}}\right)-A^nf\left(\frac{x}{\lambda^n}\right)-A^{n-1}B\left(\frac{x}{\lambda^n}\right)^{\alpha}&<\left|\frac{A^{n-1}}{\lambda^{n\alpha}}\right|\varepsilon\left|x^\alpha\right|\\
&\vdots\\
\end{aligned} \end{aligned}
$$ $$
于是累加得到:
$$
\begin{aligned}
f(x)-A^nf\left(\frac{x}{\lambda^n}\right)-\left(A^{n-1}B\left(\frac{x}{\lambda^n}\right)^{\alpha}+\cdots+AB\left(\frac{x}{\lambda^2}\right)^{\alpha}+B\left(\frac{x}{\lambda}\right)^{\alpha}\right)&<\left(\left|\frac{A^{n-1}}{\lambda^{n\alpha}}\right|+\cdots+\left|\frac{A}{\lambda^{2\alpha}}\right|+\left|\frac{1}{\lambda^{\alpha}}\right|\right)\varepsilon|x^{\alpha}|\\
f(x)-A^nf\left(\frac{x}{\lambda^n}\right)-\frac{B}{\lambda^{\alpha}}x^{\alpha}\frac{1-(\frac{A}{\lambda^{\alpha}})^n}{1-\frac{A}{\lambda^{\alpha}}}&<\frac 1{\lambda^{\alpha}} \frac{1-|\frac{A}{\lambda^{\alpha}}|^n}{1-|\frac{A}{\lambda^{\alpha}}|}\varepsilon|x^{\alpha}|
\end{aligned}
$$
两侧让 $n\to+\infty$,得到:
$$
\begin{aligned}
f(x)-\frac{B}{\lambda^{\alpha}}x^{\alpha}\frac{1}{1-\frac{A}{\lambda^{\alpha}}}&<\frac 1{\lambda^{\alpha}} \frac{1}{1-|\frac{A}{\lambda^{\alpha}}|}\varepsilon|x^{\alpha}|\\
f(x)-\frac{B}{\lambda^{\alpha}-A}x^{\alpha}&<\frac{\varepsilon}{\lambda^{\alpha}-|A|}|x^{\alpha}|
\end{aligned}
$$
对称地,可以得到另一侧的不等式。从而当 $x\to 0$ 时,$f(x)-\frac{B}{\lambda^{\alpha}-A}x^{\alpha}=o(x^{\alpha})$,即 $f(x)=\frac{B}{\lambda^{\alpha}-A}x^{\alpha}+o(x^{\alpha})$。
根据引理 ~9.2.5,只要条件满足,就可以直接猜 $f(x)=Cx^{\alpha}+o(x^{\alpha}),x\to 0$,然后代入 $f$ 的那条关系式解出 $C$ 即可。
这种方法的思路可以理解为:我们知道待展开函数 $f$ 的 $f(x)$ 和 $f(\frac x\lambda)$ 有关系,并且 $f$ 在 $0$ 处收敛到 $L$,那么我们就能利用这个关系,推出 $f(x)$ 与 $f(\frac x\lambda),f(\frac x{\lambda^2}),\cdots,f(\frac x{\lambda^n}),\cdots$ 的关系,再利用 $f$ 在 $0$ 处收敛,推出 $f(x)$ 与 $L$ 的关系,也就得到一个仅描述 $f(x)$ 而不与 $f(\frac x{\lambda})$ 有关的式子。
对于 $|f(x)-f(\frac x{2^n})-\lambda(1-\frac 1{2^n})x|<(1-\frac 1{2^n})\varepsilon|x|$,让 $n\to +\infty$,得到 $|f(x)-\lambda x|\leq \varepsilon|x|$。从而当 $x\to 0$ 时,$f(x)=\lambda x+o(x)$。
- **例 ~9.2.6**$e^x$ 和 $\sin x$ 在 $x\to 0$ 时的更高阶展开。 - **例 ~9.2.6**$e^x$ 和 $\sin x$ 在 $x\to 0$ 时的更高阶展开。
1. 当 $x\to 0$ 时,$e^x=1+x+\frac {x^2}2+o(x^2)$。 1. 当 $x\to 0$ 时,$e^x=1+x+\frac {x^2}2+o(x^2)$。
@ -188,7 +232,7 @@
\end{aligned} \end{aligned}
$$ $$
从而 $\lim\limits_{x\to 0}\frac{f(2x)-f(x)}x=\frac 12$那么当 $x\to 0$ 时,$f(x)=\frac 12 x+o(x)$$e^x=1+x+f(x)x=1+x+\frac 12 x^2+o(x^2)$。 那么当 $x\to 0$ 时,$f(x)=\frac 12 x+o(x)$$e^x=1+x+f(x)x=1+x+\frac 12 x^2+o(x^2)$。
2. 当 $x\to 0$ 时,$\sin x=x-\frac 16 x^3+o(x^3)$。 2. 当 $x\to 0$ 时,$\sin x=x-\frac 16 x^3+o(x^3)$。
@ -203,7 +247,7 @@
\end{aligned} \end{aligned}
$$ $$
从而 $\lim\limits_{x\to 0}\frac{f(2x)-f(x)}x=0$那么当 $x\to 0$ 时,$f(x)=o(x)$$\sin x=x+f(x)x=x+o(x^2)$。 那么当 $x\to 0$ 时,$f(x)=o(x)$$\sin x=x+f(x)x=x+o(x^2)$。
定义 $g:\mathbb R\to \mathbb R$ 满足 $g(x):=\begin{cases}\frac{\sin x-x}{x^2} &x\neq 0\\0&x=0\end{cases}$,那么 $g(x)=o(1),x\to 0$,那么 $\lim\limits_{x\to 0}g(x)=0=g(0)$ 故 $g$ 在 $x=0$ 处连续。当 $x\to 0$ 时, 定义 $g:\mathbb R\to \mathbb R$ 满足 $g(x):=\begin{cases}\frac{\sin x-x}{x^2} &x\neq 0\\0&x=0\end{cases}$,那么 $g(x)=o(1),x\to 0$,那么 $\lim\limits_{x\to 0}g(x)=0=g(0)$ 故 $g$ 在 $x=0$ 处连续。当 $x\to 0$ 时,
$$ $$
@ -215,29 +259,19 @@
\end{aligned} \end{aligned}
$$ $$
这里使用类似引理 ~9.2.5 的证明方法,归纳证明对任意 $\varepsilon>0$,存在 $\delta>0$,使得对任意 $x$ 满足 $|x|<\delta$ 和自然数 $k$ 那么当 $x\to 0$ 时,$g(x)=-\frac 16x+o(x)$$\sin x=x-\frac 16x^3+o(x^3)$。
$$ 在第 10 章中,我们将学习泰勒公式,这将帮助我们更方便地得到更多函数的更多项渐近展开。
\left|g(x)-\frac{1}{2^{k}}g\left(\frac{x}{2^{k}}\right)+\frac 12\left(\frac{1}{4}+\frac 1{4^2}+\cdots+\frac{1}{4^{k}}\right)x\right|\leq \varepsilon\left(1-\frac{1}{2^{k}}\right)|x|
$$
然后对 $k$ 取极限得到 $|g(x)+\frac 16x|\leq \varepsilon|x|$。从而可以说明当 $x\to 0$ 时,$g(x)=-\frac 16x+o(x)$$\sin x=x-\frac 16x^3+o(x^3)$。 除此之外,有一些函数,在 $x\to 0$ 时是任何 $x^n$ 的小 $o$(也就是说它们没有多项式的渐近展开),此时它们之间仍然是有阶的大小区分的,于是我们需要熟知一些这样的函数的阶的大小关系。不过,更为一般和熟知的是比较一些函数在无穷远处的无穷大的大小关系,两者可以通过取倒数来等价。
这种方法的思路可以理解为:我们知道待展开函数 $f$ 的 $f(x)$ 和 $f(\frac x2)$ 有关系,并且 $f$ 在 $0$ 处收敛到 $L$,那么我们就能利用这个关系,推出 $f(x)$ 与 $f(\frac x2),f(\frac x4),\cdots,f(\frac x{2^k}),\cdots$ 的关系,再利用 $f$ 在 $0$ 处收敛,推出 $f(x)$ 与 $L$ 的关系,也就得到一个仅描述 $f(x)$ 而不与 $f(\frac x2)$ 有关的式子。
除此之外,有一些函数,在 $x\to 0$ 时是任何 $x^n$ 的小 $o$(也就是说它们没有多项式的渐近展开),此时它们之间仍然是有阶的大小区分的,于是我们需要熟知一些这样的函数的阶的大小关系。不过,更为一般和熟知的是比较一些函数在无穷远处增长速度的阶的大小关系,两者可以通过取倒数来等价。
- **引理 ~9.2.7**:设函数 $f,g:\mathbb N^+\to\mathbb R$ 满足 $\lim\limits_{n\to +\infty} f(n)=\lim\limits_{n\to +\infty} g(n)=+\infty$ 且 $g(n)=o(f(n)),n\to+\infty$。那么当 $n\to+\infty$ 时: - **引理 ~9.2.7**:设函数 $f,g:\mathbb N^+\to\mathbb R$ 满足 $\lim\limits_{n\to +\infty} f(n)=\lim\limits_{n\to +\infty} g(n)=+\infty$ 且 $g(n)=o(f(n)),n\to+\infty$。那么当 $n\to+\infty$ 时:
1. $c=o(f(n))$,其中 $c\in\mathbb R$。 1. $c=o(f(n))$,其中 $c\in\mathbb R$。
2. $\ln(f(n))=o(f(n))$。 2. $\ln(f(n))=o(f(n))$。**证明**$\lim\limits_{n\to+\infty}\frac{\ln f(n)}{f(n)}=\lim\limits_{x\to+\infty}\frac{\ln x}{x}=\ln \lim\limits_{x\to+\infty}x^{\frac 1x}=\ln 1=0$。
**证明**$\lim\limits_{n\to+\infty}\frac{\ln f(n)}{f(n)}=\lim\limits_{x\to+\infty}\frac{\ln x}{x}=\ln \lim\limits_{x\to+\infty}x^{\frac 1x}=\ln 1=0$。 3. $c^{g(n)}=o(c^{f(n)})$,其中 $c>1$。**证明**:显然放个底数在下面只会放大它们的差距。
3. $c^{g(n)}=o(c^{f(n)})$,其中 $c>1$。
**证明**:显然放个底数在下面只会放大它们的差距。
4. $f(n)^{f(n)^{d}}=o(c^{f(n)})$,其中 $d<1<c$ 4. $f(n)^{f(n)^{d}}=o(c^{f(n)})$,其中 $d<1<c$
@ -246,9 +280,23 @@
5. $c^{f(n)}=o(f(n)^{f(n)})$,其中 $c>1$。 5. $c^{f(n)}=o(f(n)^{f(n)})$,其中 $c>1$。
作为上述性质的推论,我们可以排列出下列函数,其中任意相邻的两者中前者都是后者的小 $o$ 作为上述性质的推论,我们可以排列出下列函数,其中任意相邻的两者中前者都是后者的小 $o$
$$ $$
1\prec \ln\ln n\prec \ln n\prec n^{\frac 12}\prec \frac{n}{\ln n}\prec n\prec n^{\log n}\prec n^{n^{\frac 12}}\prec 2^n\prec n!\prec n^n\prec c^{c^n} 1\prec \ln\ln n\prec \ln n\prec n^{\frac 12}\prec \frac{n}{\ln n}\prec n\prec n^{\log n}\prec n^{n^{\frac 12}}\prec 2^n\prec n!\prec n^n\prec c^{c^n}
$$ $$
- **例 ~9.2.8**:一些做法可能不易察觉的问题。
1. 设 $X\subseteq\mathbb R$$f:X\to\mathbb R$ 有反函数且 $f^{-1}$ 在 $0$ 处连续,$A\neq 0,k>1$ 为常数。当 $x\to 0$ 时,$f(x)=Ax+Bx^k+o(x^k)$。求 $f^{-1}$ 在 $y\to 0$ 时的渐进展开,要求精确到 $y^k$ 项。
**解**$f(x)=Ax+o(x)$,那么 $x=\frac{1}{A}f(x)+o(f(x)),x\to 0$,那么 $f^{-1}(y)=\frac 1A y+o(y),y\to 0$。
设 $f^{-1}(y)=\frac 1A y+g(y)$,那么 $g(y)=o(y),y\to 0$。
由于 $f(x)=Ax+Bx^k+o(x^k),x\to 0$,所以 $y=Af^{-1}(y)+B(f^{-1}(y))^k+o((f^{-1}(y))^k),y\to 0$。
即 $y=A(\frac 1Ay+g(y))+B(\frac 1Ay+g(y))^k+o((\frac 1Ay+g(y))^k)=y+Ag(y)+\frac{B}{A^k}y^k+o(y^k),y\to0$。
那么 $g(y)=-\frac{B}{A^{k+1}}y^k+o(y^k),y\to 0$。从而 $f^{-1}(y)=\frac 1Ay-\frac{B}{A^{k+1}}y^{k}+o(y^k),y\to 0$。
## ~9.3 应用9.12 一些其他的工具 ## ~9.3 应用9.12 一些其他的工具

View File

@ -22,7 +22,7 @@ $\renewcommand{\overgroup}[1]{\overparen{#1}}$
连续不一定可微。例如绝对值函数 $f(x):=|x|$ 在 $0$ 处连续但不可微。另一个反例是,构造 $f:[0,+\infty)\to \mathbb R$ 满足 $f(x):=\begin{cases}x&\exists_{n\text{为正偶数}},x=\frac1n\\-x&\exists_{n为正奇数},x=\frac1n\\0&\text{true}\end{cases}$,那么 $f$ 同样是在 $0$ 处连续但不可微(斜率存在 $0,-1,1$ 三种)的。”图像有切线“ 也不一定可微,因为切线可能是垂直的,例如 $f(x):=\sqrt x$ 在 $0$ 处就连续但不可微。 连续不一定可微。例如绝对值函数 $f(x):=|x|$ 在 $0$ 处连续但不可微。另一个反例是,构造 $f:[0,+\infty)\to \mathbb R$ 满足 $f(x):=\begin{cases}x&\exists_{n\text{为正偶数}},x=\frac1n\\-x&\exists_{n为正奇数},x=\frac1n\\0&\text{true}\end{cases}$,那么 $f$ 同样是在 $0$ 处连续但不可微(斜率存在 $0,-1,1$ 三种)的。”图像有切线“ 也不一定可微,因为切线可能是垂直的,例如 $f(x):=\sqrt x$ 在 $0$ 处就连续但不可微。
连续(极限)和微分在某种意义上是相似的:考虑函数 $f$ 在 $x_0$ 处是连续的,其实等价于 $f(x)=f(x_0)+o(1),x\to x_0$;而 $f$ 在 $x_0$ 处有导数 $f'(x_0)$,就等价于 $f(x)=f(x_0)+f'(x_0)(x-x_0)+o(x-x_0),x\to x_0$。这说明 “极限” 实际上描述了 $f$ 在 $x_0$ 附近的常数近似(从而 ”连续“ 或 ”有极限“ 是在说明 $f$ 在 $x_0$ 附近有常数近似),而 “微分” 实际上描述了 $f$ 在 $x_0$ 附近的线性近似(从而 ”可微“ 是在说明 $f$ 在 $x_0$ 附近有线性近似),进一步地,如果存在 $a_0,a_1,\cdots,a_n$ 使得 $f(x)=a_0+a_1(x-x_0)+a_2(x-x_0)^2+\cdots+a_n(x-x_0)^n+o((x-x_0)^n)$,我们就找到了 $f$ 在 $x_0$ 附近的多项式近似(注意这与所谓的 ”高阶导数“ 是完全不同的概念)。所以无论如何,极限、导数、多项式近似,都是为了用更简单的方式刻画 $f$ 在某一点附近的函数性质。当然,作为推论,可微性蕴含连续性是极其合理的。 连续(极限)和微分在某种意义上是相似的:考虑函数 $f$ 在 $x_0$ 处是连续的,其实等价于 $f(x)=f(x_0)+o(1),x\to x_0$;而 $f$ 在 $x_0$ 处有导数 $f'(x_0)$,就等价于 $f(x)=f(x_0)+f'(x_0)(x-x_0)+o(x-x_0),x\to x_0$。这说明 “极限” 实际上描述了 $f$ 在 $x_0$ 附近的常数近似(从而 ”连续“ 或 ”有极限“ 是在说明 $f$ 在 $x_0$ 附近有常数近似),而 “微分” 实际上描述了 $f$ 在 $x_0$ 附近的线性近似(从而 ”可微“ 是在说明 $f$ 在 $x_0$ 附近有线性近似),进一步地,如果存在 $a_0,a_1,\cdots,a_n$ 使得 $f(x)=a_0+a_1(x-x_0)+a_2(x-x_0)^2+\cdots+a_n(x-x_0)^n+o((x-x_0)^n)$,我们就找到了 $f$ 在 $x_0$ 附近的多项式近似(注意这与所谓的 ”高阶导数“ 是不同的概念,尽管我们将看到它们之间确实存在联系)。所以无论如何,极限、导数、多项式近似,都是为了用更简单的方式刻画 $f$ 在某一点附近的函数性质。当然,作为推论,可微性蕴含连续性是极其合理的。
可微函数的导函数不一定连续:$f(x):=\begin{cases}x^2\sin \frac 1x &x\neq 0\\0&x=0\end{cases}$,其导数为 $f'(x)=\begin{cases}2x\sin \frac 1x-\cos \frac 1x&x\neq 0\\0& x=0\end{cases}$,那么对于任意正整数 $k$ 有 $f'(\frac 1{2k\pi})=\frac{1}{k\pi}\sin(2k\pi)-\cos(2k\pi)=-1$,则 $f'$ 在 $0$ 处不连续。 可微函数的导函数不一定连续:$f(x):=\begin{cases}x^2\sin \frac 1x &x\neq 0\\0&x=0\end{cases}$,其导数为 $f'(x)=\begin{cases}2x\sin \frac 1x-\cos \frac 1x&x\neq 0\\0& x=0\end{cases}$,那么对于任意正整数 $k$ 有 $f'(\frac 1{2k\pi})=\frac{1}{k\pi}\sin(2k\pi)-\cos(2k\pi)=-1$,则 $f'$ 在 $0$ 处不连续。
@ -199,49 +199,15 @@ $\renewcommand{\overgroup}[1]{\overparen{#1}}$
注意定理 10.4.2 中 “$f^{-1}$ 在 $y_0$ 处连续” 的条件不可省略。例如由 $f(x):=\begin{cases}x+1&-1\leq x<0\\x-1&0\leq x<1\end{cases}$ 定义的函数 $f:[-1,1)\to[-1,1)$ 并取 $x_0=-1$ 就是一个反例 注意定理 10.4.2 中 “$f^{-1}$ 在 $y_0$ 处连续” 的条件不可省略。例如由 $f(x):=\begin{cases}x+1&-1\leq x<0\\x-1&0\leq x<1\end{cases}$ 定义的函数 $f:[-1,1)\to[-1,1)$ 并取 $x_0=-1$ 就是一个反例
## 10.5 洛必达法则 ## 10.5 高阶导数
- **命题 10.5.1(洛必达法则 1**:设 $X\subseteqq \mathbb R$ 和 $X$ 的聚点 $x_0$,函数 $f:X\to\mathbb R$ 和 $g:X\to\mathbb R$,满足 $f(x_0)=g(x_0)=0$$f$ 和 $g$ 都在 $x_0$ 处可微且 $g'(x_0)\neq 0$。那么: - **定义 10.5.1(高阶导数)**:设 $X\subseteq \mathbb R$$f:X\to\mathbb R$ 是函数。那么称 $f$ 是 $0$ 阶可微的,且有 $0$ 阶导函数 $f^{(0)}:=f$。然后递归地定义函数的高阶可微性,设 $n\in\mathbb N$
$$
\lim_{x\to x_0}\frac{f(x)}{g(x)}=\frac{f'(x_0)}{g'(x_0)}
$$
**证明**:正确的顺序是从后往前推:
$$
\begin{aligned}\lim_{x\to x_0}\frac{f(x)}{g(x)}&=\lim_{x\to x_0}\frac{\frac{f(x)-f(x_0)}{x-x_0}}{\frac{g(x)-g(x_0)}{x-x_0}}\\&=\frac{\lim\limits_{x\to x_0}\frac{f(x)-f(x_0)}{x-x_0}}{\lim\limits_{x\to x_0}\frac{g(x)-g(x_0)}{x-x_0}}\\&=\frac{f'(x_0)}{g'(x_0)}\end{aligned}
$$
- **命题 10.5.2(洛必达法则 2**:设实数 $a,b$ 满足 $a<b$$f:[a,b]\to\mathbb R$ $g:[a,b]\to\mathbb R$ 都是在 $[a,b]$ 上连续且在 $(a,b)$ 上可微的函数满足 $f(a)=g(a)=0$且对于任意 $x\in(a,b)$ $g'(x)\neq 0$且满足
$$
\lim_{x\to a}\frac{f'(x)}{g'(x)}=L
$$
那么对于任意 $x\in (a,b]$ 有 $g(x)\neq 0$,且:
$$
\lim_{x\to a}\frac{f(x)}{g(x)}=L
$$
**证明**:若存在 $x\in (a,b]$ 使得 $g(x)=0$,根据拉格朗日中值定理,存在 $y\in(0,x)$ 使得 $g'(y)=0$,矛盾。
设任意 $(a,b]$ 上的收敛到 $a$ 的序列 $(x_n)_{n=0}^{\infty}$。
设 $n\geq 0$ 和由 $h_n(x):=f(x)g(x_n)-g(x)f(x_n)$ 定义的函数 $h_n:[a,x_n]\to\mathbb R$。那么 $h_n$ 在 $(a,x_n)$ 上可微,且对于任意 $x\in(a,x_n)$ 有 $h_n'(x)=f'(x)g(x_n)-g'(x)f(x_n)$,同时我们知道 $h_n(a)=h_n(x_n)=0$,于是根据拉格朗日中值定理,存在 $y_n\in(a,x_n)$ 使得 $h_n'(y_n)=0$,即 $\frac{f(x_n)}{g(x_n)}=\frac{f'(y_n)}{g'(y_n)}$。
根据选择公理,存在一组 $(y_n)_{n=0}^{\infty}$ 满足条件。注意到 $(y_n)_{n=0}^{\infty}$ 应收敛到 $a$,那么 $\left(\frac{f'(y_n)}{g'(y_n)}\right)_{n=0}^{\infty}$ 收敛到 $L$,即 $\left(\frac{f(x_n)}{g(x_n)}\right)_{n=0}^{\infty}$ 收敛到 $L$。
## 10.6 高阶导数
- **定义 10.6.1(高阶导数)**:设 $X\subseteq \mathbb R$$f:X\to\mathbb R$ 是函数。那么称 $f$ 是 $0$ 阶可微的,且有 $0$ 阶导函数 $f^{(0)}:=f$。然后递归地定义函数的高阶可微性,设 $n\in\mathbb N$
设 $f$ 是 $n$ 阶可微的。若 $x_0\in X$ 是 $X$ 的聚点且 $f^{(n)}$ 在 $x_0$ 处可微,那么称 $f$ 在 $x_0$ 处 $n+1$ 阶可微,且记其在 $x_0$ 处的 $n+1$ 阶导数为 $f^{(n+1)}(x_0):=(f^{(n)})'(x_0)$。若 $f$ 在任意 $x_0\in X$ 处 $n+1$ 阶可微,那么称 $f$ 是 $n+1$ 阶可微的,$f^{(n+1)}$ 记为其 $n+1$ 阶导函数。 设 $f$ 是 $n$ 阶可微的。若 $x_0\in X$ 是 $X$ 的聚点且 $f^{(n)}$ 在 $x_0$ 处可微,那么称 $f$ 在 $x_0$ 处 $n+1$ 阶可微,且记其在 $x_0$ 处的 $n+1$ 阶导数为 $f^{(n+1)}(x_0):=(f^{(n)})'(x_0)$。若 $f$ 在任意 $x_0\in X$ 处 $n+1$ 阶可微,那么称 $f$ 是 $n+1$ 阶可微的,$f^{(n+1)}$ 记为其 $n+1$ 阶导函数。
定义 $\mathscr C^n(X):=\{f\in \mathbb R^X:f\text{ 是 }n\text{ 阶可微的且 }f^{(n)}\text{ 是连续函数}\}$$\mathscr C^{\infty}(X):=\bigcap\limits_{n\in\mathbb N}\mathscr C^n(X)$。 定义 $\mathscr C^n(X):=\{f\in \mathbb R^X:f\text{ 是 }n\text{ 阶可微的且 }f^{(n)}\text{ 是连续函数}\}$$\mathscr C^{\infty}(X):=\bigcap\limits_{n\in\mathbb N}\mathscr C^n(X)$。
- **引理 10.6.2(函数加乘的高阶导数算律)**:设 $X\subseteq\mathbb R$$x_0\in X$ 是 $X$ 的聚点,$n\in\mathbb N$$f,g:X\to\mathbb R$ 是在 $x_0$ 处 $n$ 阶可微的函数。那么: - **引理 10.5.2(函数加乘的高阶导数算律)**:设 $X\subseteq\mathbb R$$x_0\in X$ 是 $X$ 的聚点,$n\in\mathbb N$$f,g:X\to\mathbb R$ 是在 $x_0$ 处 $n$ 阶可微的函数。那么:
1. $f+g$ 在 $x_0$ 处 $n$ 阶可微且 $(f+g)^{(n)}(x_0)=f^{(n)}(x_0)+g^{(n)}(x_0)$。 1. $f+g$ 在 $x_0$ 处 $n$ 阶可微且 $(f+g)^{(n)}(x_0)=f^{(n)}(x_0)+g^{(n)}(x_0)$。
2. $kf$ 在 $x_0$ 处 $n$ 阶可微且 $(kf)^{(n)}(x_0)=kf^{(n)}(x_0)$。 2. $kf$ 在 $x_0$ 处 $n$ 阶可微且 $(kf)^{(n)}(x_0)=kf^{(n)}(x_0)$。
@ -249,29 +215,31 @@ $\renewcommand{\overgroup}[1]{\overparen{#1}}$
**证明**:对 $n$ 归纳即可。直观的看法是1,2 的原因是求导是线性变换(这是因为微分是函数的线性近似,那么对函数做线性组合,它们对应的微分也应做对应的线性组合),而线性变换的复合仍然是线性变换。而对于 3函数乘起来求导可以看作是选一个求导再加起来那么 $n$ 次求导就可以看作是选 $n$ 次、选完之后再将所有的结果加起来(这也依赖于求导的线性性)。 **证明**:对 $n$ 归纳即可。直观的看法是1,2 的原因是求导是线性变换(这是因为微分是函数的线性近似,那么对函数做线性组合,它们对应的微分也应做对应的线性组合),而线性变换的复合仍然是线性变换。而对于 3函数乘起来求导可以看作是选一个求导再加起来那么 $n$ 次求导就可以看作是选 $n$ 次、选完之后再将所有的结果加起来(这也依赖于求导的线性性)。
- **引理 10.6.3(复合函数的高阶导数算律)**:设 $X,Y\subseteq \mathbb R$$x_0\in X$ 且是 $X$ 的聚点,$n\in\mathbb N$$f:X\to Y$ 是在 $x_0$ 处 $n$ 阶可微的函数,$y_0:=f(x_0)\in Y$ 是 $Y$ 的聚点,$g:Y\to \mathbb R$ 是在 $y_0$ 处 $n$ 阶可微的函数。 - **引理 10.5.3(复合函数的高阶导数算律)**:设 $X,Y\subseteq \mathbb R$$x_0\in X$ 且是 $X$ 的聚点,$n\in\mathbb N$$f:X\to Y$ 是在 $x_0$ 处 $n$ 阶可微的函数,$y_0:=f(x_0)\in Y$ 是 $Y$ 的聚点,$g:Y\to \mathbb R$ 是在 $y_0$ 处 $n$ 阶可微的函数。
那么函数 $g\circ f:X\to \mathbb R$ 在 $x_0$ 处 $n$ 阶可微,且是关于 $f'(x_0),f''(x_0),\cdots,f^{(n)}(x_0),(g'\circ f)(x_0),(g''\circ f)(x_0),\cdots,(g^{(n)}\circ f)(x_0)$ 的多项式。进一步地: 那么函数 $g\circ f:X\to \mathbb R$ 在 $x_0$ 处 $n$ 阶可微,且是关于 $f'(x_0),f''(x_0),\cdots,f^{(n)}(x_0),(g'\circ f)(x_0),(g''\circ f)(x_0),\cdots,(g^{(n)}\circ f)(x_0)$ 的多项式。进一步地:
$$ $$
(g\circ f)^{(n)}(x_0)=\left.\sum_{1 m_1+2m_2+\cdots+nm_n=n}\frac{\binom{n}{\underbrace{1,\cdots,1}_{m_1\text{个}},\underbrace{2,\cdots,2}_{m_2\text{个}},\cdots,\underbrace{n,\cdots,n}_{m_n\text{个}}}}{m_1!\cdots m_n!}(g^{(m_1+\cdots+m_n)}\circ f)\cdot (f')^{m_1}\cdot (f'')^{m_2}\cdots (f^{(n)})^{m_n}\right|_{x_0} (g\circ f)^{(n)}(x_0)=\left.\sum_{1 m_1+2m_2+\cdots+nm_n=n}\frac{\binom{n}{\underbrace{1,\cdots,1}_{m_1\text{个}},\underbrace{2,\cdots,2}_{m_2\text{个}},\cdots,\underbrace{n,\cdots,n}_{m_n\text{个}}}}{m_1!\cdots m_n!}(g^{(m_1+\cdots+m_n)}\circ f)\cdot (f')^{m_1}\cdot (f'')^{m_2}\cdots (f^{(n)})^{m_n}\right|_{x_0}
$$ $$
**证明**:对 $n$ 归纳。假设命题关于 $n$ 成立,$(g\circ f)^{(n+1)}(x_0)=((g'\circ f)\cdot f')^{(n)}(x_0)$,由于 $g',f$ 在 $x_0$ 处 $n$ 阶可微,所以 $(g'\circ f)$ 在 $x_0$ 处 $n$ 阶可微,而 $f'$ 也在 $x_0$ 处 $n$ 阶可微,于是根据引理 10.6.2.3$(g'\circ f)\cdot f'$ 也在 $x_0$ 处 $n$ 阶可微,从而 $g\circ f$ 在 $x_0$ 处 $n+1$ 阶可微。
**证明**:对 $n$ 归纳。假设命题关于 $n$ 成立,$(g\circ f)^{(n+1)}(x_0)=((g'\circ f)\cdot f')^{(n)}(x_0)$,由于 $g',f$ 在 $x_0$ 处 $n$ 阶可微,所以 $(g'\circ f)$ 在 $x_0$ 处 $n$ 阶可微,而 $f'$ 也在 $x_0$ 处 $n$ 阶可微,于是根据引理 10.5.2.3$(g'\circ f)\cdot f'$ 也在 $x_0$ 处 $n$ 阶可微,从而 $g\circ f$ 在 $x_0$ 处 $n+1$ 阶可微。
而那个式子实际上就是一个组合问题:每次为形如 $(g^{(m_1+\cdots+m_n)}\circ f)\cdot (f')^{m_1}\cdot (f'')^{m_2}\cdots (f^{(n)})^{m_n}$ 的每一项求导,那要么在后面的 $m_1+\cdots+m_n$ 个形如 $f^{(i)}$ 的可区分的函数中选一个出来求一次导变成 $f^{(i+1)}$,要么为第一项 $g^{(m_1+\cdots+m_n)}\circ f$ 求导,变成 $g^{(m_1+\cdots+m_n+1)}\circ f$ 再往后多添一个 $f'$。所以枚举最后乘积中的函数构成:$m_1$ 个 $f'$、$m_2$ 个 $f''$、……、$m_n$ 个 $f^{(n)}$,对应的在最前面乘着的就应该是 $g^{(m_1+\cdots+m_n)}\circ f$,因为每多添一项 $g$ 的导数就多一阶。然后为后面的每个 $f^{(i)}$ 分配是 $n$ 次操作中的哪 $i$ 次操作让它依次变成 $f',f'',\cdots,f^{(i)}$,但是对于每个 $i$,这 $m_i$ 个 $f^{(i)}$ 在出现时不应被加以区分(或者说它们出现时是被 $g^{(\cdots)}\circ f$ 求导创造出来的,而不是从一堆 $f^{(0)}$ 中选一个求导得到的),所以最后要除以 $m_i!$。 而那个式子实际上就是一个组合问题:每次为形如 $(g^{(m_1+\cdots+m_n)}\circ f)\cdot (f')^{m_1}\cdot (f'')^{m_2}\cdots (f^{(n)})^{m_n}$ 的每一项求导,那要么在后面的 $m_1+\cdots+m_n$ 个形如 $f^{(i)}$ 的可区分的函数中选一个出来求一次导变成 $f^{(i+1)}$,要么为第一项 $g^{(m_1+\cdots+m_n)}\circ f$ 求导,变成 $g^{(m_1+\cdots+m_n+1)}\circ f$ 再往后多添一个 $f'$。所以枚举最后乘积中的函数构成:$m_1$ 个 $f'$、$m_2$ 个 $f''$、……、$m_n$ 个 $f^{(n)}$,对应的在最前面乘着的就应该是 $g^{(m_1+\cdots+m_n)}\circ f$,因为每多添一项 $g$ 的导数就多一阶。然后为后面的每个 $f^{(i)}$ 分配是 $n$ 次操作中的哪 $i$ 次操作让它依次变成 $f',f'',\cdots,f^{(i)}$,但是对于每个 $i$,这 $m_i$ 个 $f^{(i)}$ 在出现时不应被加以区分(或者说它们出现时是被 $g^{(\cdots)}\circ f$ 求导创造出来的,而不是从一堆 $f^{(0)}$ 中选一个求导得到的),所以最后要除以 $m_i!$。
作为引理 10.6.3 的推论,$(g(ax+b))^{(n)}=g^{(n)}(ax+b)a^n$,这是因为 $ax+b$ 求两次导就变成 $0$ 了。 作为引理 10.5.3 的推论,$(g(ax+b))^{(n)}=g^{(n)}(ax+b)a^n$,这是因为 $ax+b$ 求两次导就变成 $0$ 了。
- **引理 10.6.4(函数相除的高阶导数算律)**:设 $X\subseteq\mathbb R$$x_0\in X$ 是 $X$ 的聚点,$n\in\mathbb N$$f,g:X\to\mathbb R$ 是在 $x_0$ 处 $n$ 阶可微的函数,$g(x_0)\neq 0$。那么 $\frac fg$ 在 $x_0$ 处 $n$ 阶可微。 - **引理 10.5.4(函数相除的高阶导数算律)**:设 $X\subseteq\mathbb R$$x_0\in X$ 是 $X$ 的聚点,$n\in\mathbb N$$f,g:X\to\mathbb R$ 是在 $x_0$ 处 $n$ 阶可微的函数,$g(x_0)\neq 0$。那么 $\frac fg$ 在 $x_0$ 处 $n$ 阶可微。
**证明**:记 $h(y):=\frac 1y$,那么 $\frac fg=f\cdot (h\circ g)$,而 $h$ 任意阶可微(归纳并利用多项式的微分),所以 $\frac fg$ 在 $x_0$ 处 $n$ 阶可微。 **证明**:记 $h(y):=\frac 1y$,那么 $\frac fg=f\cdot (h\circ g)$,而 $h$ 任意阶可微(归纳并利用多项式的微分),所以 $\frac fg$ 在 $x_0$ 处 $n$ 阶可微。
- **引理 10.6.5(反函数的高阶导数算律)**:设 $X,Y\subseteq \mathbb R$$x_0\in X$ 是 $X$ 的聚点,$n\in\mathbb N$$f:X\to Y$ 是双射,$y_0=f(x_0)$。若 $f$ 在 $x_0$ 处 $n$ 阶可微且 $f'(x_0)\neq 0$$f^{-1}$ 在 $y_0$ 处连续,那么 $f^{-1}$ 在 $y_0$ 处 $n$ 阶可微。 - **引理 10.5.5(反函数的高阶导数算律)**:设 $X,Y\subseteq \mathbb R$$x_0\in X$ 是 $X$ 的聚点,$n\in\mathbb N$$f:X\to Y$ 是双射,$y_0=f(x_0)$。若 $f$ 在 $x_0$ 处 $n$ 阶可微且 $f'(x_0)\neq 0$$f^{-1}$ 在 $y_0$ 处连续,那么 $f^{-1}$ 在 $y_0$ 处 $n$ 阶可微。
**证明**:对 $n$ 归纳。假设命题关于 $n$ 成立,$(f^{-1})^{(n+1)}(y_0)=(\frac{1}{f'\circ f^{-1}})^{(n)}(y_0)$,由于 $f',f^{-1}$ 分别在 $x_0,y_0$ 处 $n$ 阶可微且 $(f'\circ f^{-1})(y_0)=f'(x_0)\neq 0$,故 $\frac{1}{f\circ f^{-1}}$ 在 $y_0$ 处 $n$ 阶可微,从而 $f^{-1}$ 在 $y_0$ 处 $n+1$ 阶可微。 **证明**:对 $n$ 归纳。假设命题关于 $n$ 成立,$(f^{-1})^{(n+1)}(y_0)=(\frac{1}{f'\circ f^{-1}})^{(n)}(y_0)$,由于 $f',f^{-1}$ 分别在 $x_0,y_0$ 处 $n$ 阶可微且 $(f'\circ f^{-1})(y_0)=f'(x_0)\neq 0$,故 $\frac{1}{f\circ f^{-1}}$ 在 $y_0$ 处 $n$ 阶可微,从而 $f^{-1}$ 在 $y_0$ 处 $n+1$ 阶可微。
高阶导数的一个直接应用是判断极值。 高阶导数的一个直接应用是判断极值。
- **定理 10.6.6**:设 $X\subseteq \mathbb R$$x_0\in X$ 是 $X$ 的聚点,$n\geq 2$ 是正整数,$f:X\to\mathbb R$ 是在 $x_0$ 处 $n$ 阶可微的函数,且 $f'(x_0)=\cdots=f^{(n-1)}(x_0)=0,f^{(n)}(x_0)>0$。 - **定理 10.5.6**:设 $X\subseteq \mathbb R$$x_0\in X$ 是 $X$ 的聚点,$n\geq 2$ 是正整数,$f:X\to\mathbb R$ 是在 $x_0$ 处 $n$ 阶可微的函数,且 $f'(x_0)=\cdots=f^{(n-1)}(x_0)=0,f^{(n)}(x_0)>0$。
若 $n$ 是偶数,则 $x_0$ 是 $f$ 的严格极小值点;若 $n$ 是奇数,则 $f$ 在 $x_0$ 附近严格单调增。 若 $n$ 是偶数,则 $x_0$ 是 $f$ 的严格极小值点;若 $n$ 是奇数,则 $f$ 在 $x_0$ 附近严格单调增。
@ -279,9 +247,69 @@ $\renewcommand{\overgroup}[1]{\overparen{#1}}$
对于 $f^{(n)}(x_0)<0$ 的情况也有类似的结论 对于 $f^{(n)}(x_0)<0$ 的情况也有类似的结论
## 10.6 洛必达法则与泰勒公式
- **定理 10.6.1(洛必达法则 $\frac{0}{0}$**:设 $c,A$ 有邻域,$X$ 是 $c$ 的去心邻域,$f,g:X\to\mathbb R$ 是可微函数且 $g'$ 恒非零,$\lim\limits_{x\to c}f(x)=\lim\limits_{x\to c}g(x)=0$$\lim\limits_{x\to c}\frac{f'(x)}{g'(x)}=A$。那么 $\lim\limits_{x\to c}\frac{f(x)}{g(x)}=A$。
**证明**:不妨设 $c\neq \infty$,否则对 $c=-\infty$ 和 $c=+\infty$ 分别得出结论后再结合到一起即可。
设 $V$ 是 $A$ 的任意邻域。存在 $c$ 的去心邻域 $W$ 使得对于任意 $x\in W$ 有 $\frac{f'(x)}{g'(x)}\in V$。那么对任意 $x\in W$,不妨设 $c<x$由柯西微分中值定理存在 $\xi\in (c,x)$ 使得 $f'(\xi)(g(x)-0)=g'(\xi)(f(x)-0)$又命题 10.3.3 可知 $g$ $(c,x)$ 上严格单调 $g(x)\neq 0$于是可化简为 $\frac{f(x)}{g(x)}=\frac{f'(\xi)}{g'(\xi)}\in V$。从而 $\lim\limits_{x\to c}\frac{f(x)}{g(x)}=A$。
- **定理 10.6.2(洛必达法则 $\frac{\infty}{\infty}$**:设 $c$ 有邻域,$X$ 是 $c$ 的去心邻域,$f,g:X\to\mathbb R$ 是可微函数且 $g'$ 恒非零,$\lim\limits_{x\to c}g(x)=\infty$$\lim\limits_{x\to c}\frac{f'(x)}{g'(x)}=A\in\mathbb R^*\cup \{\infty\}$。那么 $\lim\limits_{x\to c}\frac{f(x)}{g(x)}=A$。
**证明**:不妨设 $A\in\mathbb R$,其它情况的证明是类似的。不妨设 $c$ 有左去心邻域($c\neq -\infty$),接下来说明 $\lim\limits_{x\to c^-}\frac{f(x)}{g(x)}=A$。$c$ 右侧的极限可以类似说明(如果 $c$ 有右去心邻域),再结合在一起即可。
根据命题 10.3.3 可知 $g$ 在 $c$ 左侧(即 $X\cap (-\infty,c)$ 上)严格单调,不妨设 $\lim\limits_{x\to c}g(x)=+\infty$,那么存在 $g$ 的 $c$ 的左去心邻域 $W'$,使得 $g$ 在 $W'$ 上恒正且严格单调增。
设 $\varepsilon'>0$ 是任意正实数,任取 $0<\varepsilon<\varepsilon'$。存在 $c$ 的左去心邻域 $W\subseteq W'$ 使得对任意 $x\in W$ $\frac{f'(x)}{g'(x)}\in (A-\varepsilon,A+\varepsilon)$。
任取 $x_0\in W$,对任意 $x\in(x_0,c)$,根据柯西微分中值定理,存在 $\xi \in(x_0,x)$ 使得 $f'(\xi)(g(x)-g(x_0))=g'(\xi)(f(x)-f(x_0))$,从而 $\frac{f(x)-f(x_0)}{g(x)-g(x_0)}=\frac{f'(\xi)}{g'(\xi)}\in(A-\varepsilon,A+\varepsilon)$,那么 $f(x)>(A-\varepsilon')g(x)+(\varepsilon'-\varepsilon)g(x)+(f(x_0)-(A-\varepsilon) g(x_0))$。由于 $\lim\limits_{x\to c}g(x)=+\infty$,于是在 $c$ 的某左去心邻域必然有 $f(x)>(A-\varepsilon')g(x)$,即 $\frac{f(x)}{g(x)}>A-\varepsilon'$。另一侧同理。
于是 $\lim\limits_{x\to c^-}\frac{f(x)}{g(x)}=A$。
注意,$\frac\infty\infty$ 型的洛必达法则中,相较于 $\frac 00$ 型,$A$ 可取的范围更有限。例如由 $f(x):=x$ 和 $g(x)=x+1$ 定义的函数 $f,g:[0,+\infty)\to\mathbb R$ 满足 $\frac\infty\infty$ 型洛必达法则的其他条件和 $\lim\limits_{x\to +\infty}\frac{f'(x)}{g'(x)}=1^+$,但 $\lim\limits_{x\to+\infty}\frac{f(x)}{g(x)}\neq 1^+$。
- **推论 10.6.3**:设 $I\subseteq\mathbb R$ 是区间,$x_0\in I$$f:I\to\mathbb R$ 是连续函数且在 $I\setminus\{x_0\}$ 上可微,$\lim\limits_{x\to x_0}f'(x)=A\in\mathbb R$。那么 $f$ 在 $x_0$ 处可微且 $f'(x_0)=A$。
**证明**:应用 $\frac 00$ 型洛必达法则:$\lim\limits_{x\to x_0}\frac{f(x)-f(x_0)}{x-x_0}=\lim\limits_{x\to x_0}\frac{(f(x)-f(x_0))'}{(x-x_0)'}=\lim\limits_{x\to x_0}f'(x)=A$。
事实上,推论 10.6.3 重在说明 $f$ 在 $x_0$ 处可微,因为由达布引理可以知道此时一定有 $f'(x_0)=A$。
接下来我们介绍泰勒公式。
- **定义 10.6.4(泰勒多项式)**:设 $X\subseteq\mathbb R$$x_0\in X$ 是 $X$ 的聚点,$n\in\mathbb N$$f:X\to\mathbb R$ 是在 $x_0$ 处 $n$ 阶可微的函数。那么定义 $f$ 在 $x_0$ 处的 $n$ 阶泰勒多项式为 $Tf_{x_0,n}(h):=f(x_0)+f'(x_0)h+\frac{f''(x_0)}{2}h^2+\cdots+\frac{f^{(n)}(x_0)}{n!}h^n$。
- **定理 10.6.5(泰勒公式-皮亚诺余项)**:设 $I\subseteq\mathbb R$ 是区间,$x_0\in I$$n\in\mathbb N$$f:I\to\mathbb R$ 是在 $x_0$ 处 $n$ 阶可微的函数。那么多项式 $P_n(h)=a_0+a_1h+\cdots+a_nh^n$ 满足 $f(x_0+h)=P_n(h)+o(h^n),h\to 0$,当且仅当 $P_n(h)=Tf_{x_0,n}(h)$。
**证明**:对 $n$ 归纳。$n=0$ 时命题显然成立。归纳假设命题关于 $n\in\mathbb N$ 成立。那么对任意 $1\leq i\leq n$,由于 $Tf^{(i)}_{x_0,n}(h)=T(f^{(i)})_{x_0,n-i}$,再结合归纳假设可知 $\lim\limits_{h\to 0}f^{(i)}(x_0+h)-Tf^{(i)}_{x_0,n}(h)=0$。
$$
\lim_{h\to 0}\frac{f(x_0+h)-Tf_{x_0,n}(h)}{h^{n+1}}=\lim_{h\to 0}\frac{f'(x_0+h)-Tf_{x_0,n}'(h)}{(n+1)h^{n}}=\cdots=\lim_{h\to 0}\frac{f^{(n)}(x_0+h)-Tf^{(n)}_{x_0,n}(h)}{(n+1)!h}=\frac{f^{(n+1)}(x_0)}{(n+1)!}
$$
前面都是在用 $\frac 00$ 型的洛必达法则。最后一步是因为:
$$
\frac{f^{(n)}(x_0+h)-Tf^{(n)}_{x_0,n}(h)}{(n+1)!h}=\frac{f^{(n)}(x_0+h)-T(f^{(n)})_{x_0,0}(h)}{(n+1)!h}=\frac{f^{(n)}(x_0)+f^{(n+1)}(x_0)h+o(h)-f^{(n)}(x_0)}{(n+1)!h}=\frac{f^{(n+1)}(x_0)}{(n+1)!}+o(1)
$$
最后一步不能用洛必达法则是因为条件并没有保证 $f^{(n)}$ 在 $x_0$ 附近可导,只保证了 $f$ 在 $x_0$ 处 $n+1$ 阶可微。
注意,两个具有相同泰勒多项式的函数不一定相等。最典型的例子就是两个函数都比任意 $h^n$ 阶小,但一者可能恒为 $0$,一者可能是指数级趋向于 $0$ 的,比如由 $f(x):=\begin{cases}e^{-\frac{1}{x}}&x\neq 0\\0&x=0\end{cases}$ 定义的函数 $f:\mathbb R\to\mathbb R$ 在 $0$ 处的任意阶泰勒多项式都是恒零。那么对任意的函数 $g$,可以证明 $g$ 与 $g(1+f)$ 在 $0$ 处具有相同的泰勒多项式,从而这种情况是普遍存在的。
- **定理 10.6.6(泰勒公式-拉格朗日余项)**:设 $I\subseteq\mathbb R$ 是区间,$x_0\in I$$n\in\mathbb N$$f:I\to\mathbb R$ 是 $n+1$ 阶可微的函数。那么对于任意 $x \in I$ 且 $x\neq x_0$,都存在严格介于 $x_0,x$ 之间的 $\xi$ 使得 $f(x)=Tf_{x_0,n}(x-x_0)+\frac{f^{(n+1)}(\xi)}{(n+1)!}(x-x_0)^{n+1}$。
**证明**:不妨设 $x_0<x$。那么根据柯西微分中值定理存在 $x_0<\xi_{n+1}<\cdots<\xi_1<x$ 使得
$$
\frac{f(x)-Tf_{x_0,n}(x-x_0)}{(x-x_0)^{n+1}}=\frac{f'(\xi_1)-Tf_{x_0,n}'(\xi_1-x_0)}{(n+1)(x-x_0)^n}=\cdots=\frac{f^{(n+1)}(\xi_{n+1})}{(n+1)!}
$$
皮亚诺余项的泰勒公式是函数的局部性质,常用于求渐近展开和极限;拉格朗日余项的泰勒公式是函数的整体性质,常用于误差分析(特别是在函数的任意阶导函数都有已知界的情况)。
## 10.7 凸函数 ## 10.7 凸函数
- **定义 10.7.1(凸函数)**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是函数。称 $f$ 是下凸的,当且仅当对任意 $x_1,x_2\in I \land x_1\neq x_2$ 和 $0<t<1$ $f((1-t)x_1+tx_2)\leq(1-t)f(x_1)+tf(x_2)$。若不等式中的 $\leq$ 从不取等那么称 $f$ 是严格下凸的 - **定义 10.7.1(凸函数)**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是函数。称 $f$ 是下凸的,当且仅当对任意 $x_1,x_2\in I$ 和 $0<t<1$ $f((1-t)x_1+tx_2)\leq(1-t)f(x_1)+tf(x_2)$。除非 $x_1=x_2$不等式中的 $\leq$ 从不取等那么称 $f$ 是严格下凸的
称 $f$ 是(严格)上凸的,当且仅当 $-f$ 是(严格)下凸的。 称 $f$ 是(严格)上凸的,当且仅当 $-f$ 是(严格)下凸的。
@ -290,6 +318,7 @@ $(1-t)A+tB=A+(B-A)t$,于是 $t$ 从 $0$ 到 $1$ 实际上是从 $A$ 匀速地
- **引理 10.7.2**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是下凸函数,$x_1,x_2,x_3\in I$ 且 $x_1<x_2<x_3$。对任意 $a,b\in I\land a\neq b$ 定义 $k(a,b):\frac{f(a)-f(b)}{a-b}$ 为这两点的斜率显然不可能为 $\infty$)。那么 $k(x_1,x_2)\leq k(x_1,x_3)\leq k(x_2,x_3)$。 $f$ 是严格下凸的那么等号永远取不到 - **引理 10.7.2**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是下凸函数,$x_1,x_2,x_3\in I$ 且 $x_1<x_2<x_3$。对任意 $a,b\in I\land a\neq b$ 定义 $k(a,b):\frac{f(a)-f(b)}{a-b}$ 为这两点的斜率显然不可能为 $\infty$)。那么 $k(x_1,x_2)\leq k(x_1,x_3)\leq k(x_2,x_3)$。 $f$ 是严格下凸的那么等号永远取不到
**证明**:只证明 $k(x_1,x_2)\leq k(x_1,x_3)$,另一侧类似。记 $t=\frac{x_2-x_1}{x_3-x_1}$,那么 $(1-t)x_1+tx_3=x_2$。 **证明**:只证明 $k(x_1,x_2)\leq k(x_1,x_3)$,另一侧类似。记 $t=\frac{x_2-x_1}{x_3-x_1}$,那么 $(1-t)x_1+tx_3=x_2$。
$$ $$
k(x_1,x_2)=\frac{f(x_2)-f(x_1)}{x_2-x_1}\leq \frac{\bigg(f(x_1)+t(f(x_3)-f(x_1))\bigg)-f(x_1)}{x_2-x_1}=\frac{f(x_3)-f(x_1)}{x_3-x_1}=k(x_1,x_3) k(x_1,x_2)=\frac{f(x_2)-f(x_1)}{x_2-x_1}\leq \frac{\bigg(f(x_1)+t(f(x_3)-f(x_1))\bigg)-f(x_1)}{x_2-x_1}=\frac{f(x_3)-f(x_1)}{x_3-x_1}=k(x_1,x_3)
$$ $$
@ -378,16 +407,117 @@ $(1-t)A+tB=A+(B-A)t$,于是 $t$ 从 $0$ 到 $1$ 实际上是从 $A$ 匀速地
$$ $$
这蕴含 $f(x^*)=0$。 这蕴含 $f(x^*)=0$。
凸函数在不等式方面也有很多应用。
- **定理 10.7.14(琴生不等式)**:设 $I\subseteq\mathbb R$ 是区间,$f:I\to\mathbb R$ 是下凸函数,$n$ 是正整数。那么对任意 $x_1,\cdots,x_n\in I$ 和实数 $t_1,\cdots,t_n>0$ 都有:
$$
f\left(\frac{t_1x_1+\cdots+t_nx_n}{t_1+\cdots+t_n}\right)\leq \frac{t_1f(x_1)+\cdots+t_nf(x_n)}{t_1+\cdots+t_n}
$$
若 $f$ 是严格下凸的,那么除非 $x_1=\cdots=x_n$,不等式中的 $\leq$ 永不取等。
**证明**:对 $n$ 归纳。归纳假设命题关于 $n-1$ 成立,那么:
$$
\begin{aligned}
f\left(\frac{t_1x_1+\cdots+t_{n}x_{n}}{t_1+\cdots+t_{n}}\right)&=f\left(\frac{(t_1+\cdots+t_{n-1})\frac{t_1x_1+\cdots+t_{n-1}x_{n-1}}{t_1+\cdots+t_{n-1}}+t_nx_n}{(t_1+\cdots+t_{n-1})+t_n}\right)\\
&\leq \frac{(t_1+\cdots+t_{n-1})f\left(\frac{t_1x_1+\cdots+t_{n-1}x_{n-1}}{t_1+\cdots+t_{n-1}}\right)+t_nf(x_n)}{(t_1+\cdots+t_{n-1})+t_n}\\
&\leq \frac{t_1f(x_1)+\cdots+t_{n-1}f(x_{n-1})+t_nf(x_n)}{t_1+\cdots+t_{n-1}+t_n}\\
\end{aligned}
$$
琴生不等式是凸函数定义的扩展,描述了多个位置的情况下平均值的函数值与函数值的平均值的关系。
- **定理 10.7.15(杨氏不等式)**:设实数 $p,q>0$ 满足 $\frac 1p+\frac 1q=1$,那么对于任意实数 $x,y>0$ 有:
$$
\frac {x^p}{p}+\frac{y^q}{q}\geq xy
$$
其中 $\geq$ 取等当且仅当 $x^p=y^q$。
**证明**:易知 $\ln x$ 是严格上凸函数,那么:
$$
\ln\left(\frac{x^p}{p}+\frac{y^q}{q}\right)\geq \frac{\ln x^p}{p}+\frac{\ln y^q}{q}=\ln x+\ln y=\ln (xy)
$$
- **定理 10.7.16(赫尔德不等式)**:设实数 $p,q>0$ 满足 $\frac 1p+\frac 1q=1$$n$ 是正整数,$a_1,\cdots,a_n,b_1,\cdots,b_n>0$ 是实数。那么:
$$
\sum_{i=1}^na_ib_i\leq\left(\sum_{i=1}^na_i^p\right)^{\frac 1p}\left(\sum_{i=1}^nb_i^q\right)^{\frac 1q}
$$
其中 $\leq$ 取等当且仅当 $\frac{a_1^p}{b_1^q}=\frac{a_2^p}{b_2^q}=\cdots=\frac{a_n^p}{b_n^q}$。
特别地,当 $p=q=2$ 时,即为柯西施瓦茨不等式。
**证明**:应用杨氏不等式:
$$
\sum_{i=1}^n\frac{a_i}{\left(\sum\limits_{j=1}^na_j^p\right)^{\frac 1p}}\frac{b_i}{\left(\sum\limits_{j=1}^nb_j^q\right)^{\frac 1q}}\leq \sum_{i=1}^n\frac 1p\frac{a_i^p}{\sum\limits_{j=1}^na_j^p}+\frac 1q\frac{b_i^q}{\sum\limits_{j=1}^nb_j^q}=\frac 1p+\frac 1q=1
$$
个人猜想对证明思路的一种感性启发是:注意到杨氏不等式不等式两侧的次数是不等的(一侧和 $p,q$ 有关而一侧是常数),而赫尔德不等式两侧的次数是一样的,那么如果要运用杨氏不等式,只有可能是杨氏不等式两侧的次数都为 $0$,所以要把赫尔德不等式的右边除到左边,变成次数为 $0$ 的形式。
- **定理 10.7.17(闵可夫斯基不等式)**:设实数 $p>1$ 和 $a_1,\cdots,a_n,b_1,\cdots,b_n>0$。那么:
$$
\left(\sum_{i=1}^n(a_i+b_i)^p\right)^{\frac 1p}\leq \left(\sum_{i=1}^na_i^p\right)^{\frac 1p}+\left(\sum_{i=1}^nb_i^p\right)^{\frac 1p}
$$
其中 $\leq$ 取等当且仅当
特别地,当 $p=2$ 时,即为欧几里得空间下的三角形不等式。
**证明**:记 $q$ 使得 $\frac 1p+\frac 1q=1$,那么 $p+q=pq$ 且 $p,q>1$。应用赫尔德不等式:
$$
\left(\sum_{i=1}^na_i^p\right)^{\frac 1p}+\left(\sum_{i=1}^nb_i^p\right)^{\frac 1p}\geq \frac{\sum\limits_{i=1}^n a_i(a_i+b_i)^{p-1}}{\left(\sum\limits_{i=1}^n\big((a_i+b_i)^{p-1}\big)^q\right)^{\frac 1q}}+\frac{\sum\limits_{i=1}^n b_i(a_i+b_i)^{p-1}}{\left(\sum\limits_{i=1}^n\big((a_i+b_i)^{p-1}\big)^q\right)^{\frac 1q}}=\left(\sum_{i=1}^n(a_i+b_i)^p\right)^{\frac 1p}
$$
赫尔德不等式和闵可夫斯基不等式的证明感觉都很具技巧性,似乎在泛函分析中有更直观的理解。
- **定理 10.7.18(幂平均不等式)**:设 $n\in\mathbb N^+$,实数 $x_1,\cdots,x_n>0$ 不全相等。由 $f(p):=\left(\frac{\sum_{i=1}^nx_i^p}{n}\right)^{\frac 1p}$ 定义函数 $f:\mathbb R\setminus\{0\}\to\mathbb R$。那么:
1. $f$ 是严格单调增函数。
**证明**:设 $p,q\in\mathbb R\land p<q$。由于 $f(-p)=\left(\frac{\sum_{i=1}^nx_i^{-p}}{n}\right)^{\frac 1{-p}}=\frac 1{\left(\frac{\sum_{i=1}^n(\frac{1}{x_i})^p}{n}\right)^{\frac 1p}}$所以不妨假设 $q>0$。那么 $\left(\frac{\sum_{i=1}^nx_i^p}{n}\right)^{\frac 1p}<\left(\frac{\sum_{i=1}^nx_i^q}{n}\right)^{\frac 1q}\iff \left(\frac{\sum_{i=1}^nx_i^p}{n}\right)^{\frac qp}<\frac{\sum_{i=1}^nx_i^q}{n}$。
可以证明 $p<q\land q>0\implies\frac{q}{p}(\frac qp-1)>0$,故 $x^{\frac qp}$ 是严格下凸函数。根据琴生不等式:
$$
\left(\frac{\sum_{i=1}^nx_i^p}{n}\right)^{\frac qp}<\frac{\sum_{i=1}^n(x_i^p)^{\frac qp}}{n}=\frac{\sum_{i=1}^nx_i^q}{n}
$$
故 $f$ 是严格单调增的。
2. $\lim\limits_{p\to-\infty}f(p)=\min\{x_1,\cdots,x_n\}$$\lim\limits_{p\to+\infty}f(p)=\max\{x_1,\cdots,x_n\}$。
**证明**:只证后者。不妨设 $x_1=\max\{x_1,\cdots,x_n\}$,那么:
$$
\lim_{p\to+\infty}f(p)=\lim_{p\to+\infty}\left(\frac{\sum_{i=1}^nx_i^p}{n}\right)^{\frac 1p}=x_1\lim_{p\to+\infty}\left(\frac{\sum_{i=1}^n(\frac{x_i}{x_1})^p}{n}\right)^{\frac 1p}=x_1
$$
最后一步是因为 $\frac{x_i}{x_1}\leq 1$,从而 $(\frac{x_i}{x_1})^p$ 将收敛到 $0$ 或 $1$,那么 $\frac{\sum_{i=1}^n(\frac{x_i}{x_1})^p}{n}$ 是有界的,从而它的 $\frac 1p$ 次幂最终会收敛到 $1$。
3. $\lim\limits_{p\to 0}f(p)=\sqrt[n]{\prod_{i=1}^nx_i}$。
**证明**:应用洛必达法则:
$$
\lim_{p\to 0}\ln f(p)=\lim_{p\to 0}\ln\left(\frac{\sum_{i=1}^nx_i^p}{n}\right)^{\frac 1p}=\lim_{p\to 0}\frac{\ln(\sum_{i=1}^nx_i^p)-\ln n}{p}=\lim_{p\to 0}\frac{\sum_{i=1}^nx_i^p\ln x_i}{\sum_{i=1}^nx_i^p}=\frac{\sum_{i=1}^n\ln x_i}{n}=\ln\sqrt[n]{\prod_{i=1}^nx_i}
$$
- **推论 10.7.19(均值不等式)**:设 $n\in\mathbb N^+$,实数 $x_1,\cdots,x_n>0$。那么:
$$
\frac{n}{\frac{1}{x_1}+\frac{1}{x_2}+\cdots+\frac{1}{x_n}}\leq\sqrt[n]{x_1x_2\cdots x_n}\leq\frac{x_1+x_2+\cdots+x_n}{n}\leq\sqrt{\frac{x_1^2+x_2^2+\cdots+x_n^2}{n}}
$$
其中 $\leq$ 取等当且仅当 $x_1=\cdots=x_n$。
最后,我们推广凸函数的定义。 最后,我们推广凸函数的定义。
- **定义 10.7.14(凸集)**:设 $n$ 是正整数,$C\subseteq\mathbb R^n$,称 $C$ 是凸集,当且仅当对任意 $x_1,x_2\in C$ 和 $t\in(0,1)$,有 $(1-t)x_1+tx_2\in C$。 - **定义 10.7.20(凸集)**:设 $n$ 是正整数,$C\subseteq\mathbb R^n$,称 $C$ 是凸集,当且仅当对任意 $x_1,x_2\in C$ 和 $t\in(0,1)$,有 $(1-t)x_1+tx_2\in C$。
凸集的几何直观解释是:凸集中任意两点为端点的线段也在 $C$ 中。$\mathbb R$ 中的凸集就是区间。 凸集的几何直观解释是:凸集中任意两点为端点的线段也在 $C$ 中。$\mathbb R$ 中的凸集就是区间。
- **定义 10.7.15(凸函数)**:设 $n$ 是正整数,$C\subseteq\mathbb R^n$ 是凸集,$f:C\to\mathbb R$ 是函数。称 $f$ 是下凸的,当且仅当对任意 $x_1,x_2\in C$ 和 $t\in(0,1)$,有 $f((1-t)x_1+tx_2)\leq(1-t)f(x_1)+tf(x_2)$。称 $f$ 是上凸的,当且仅当 $-f$ 是下凸的。 - **定义 10.7.21凸函数**:设 $n$ 是正整数,$C\subseteq\mathbb R^n$ 是凸集,$f:C\to\mathbb R$ 是函数。称 $f$ 是下凸的,当且仅当对任意 $x_1,x_2\in C$ 和 $t\in(0,1)$,有 $f((1-t)x_1+tx_2)\leq(1-t)f(x_1)+tf(x_2)$。称 $f$ 是上凸的,当且仅当 $-f$ 是下凸的。
那么定义 10.7.1 与上述定义是相容的。 那么定义 10.7.1 与上述定义是相容的。
- **引理 10.7.16**:设 $n$ 是正整数,$C\subseteq\mathbb R^n$ 是凸集,$f:C\to\mathbb R$ 是函数。那么 $f$ 是下凸的,当且仅当 $\{(x,y):x\in C,y\in \mathbb R,y\geq f(x)\}$ 是凸集。 - **引理 10.7.22**:设 $n$ 是正整数,$C\subseteq\mathbb R^n$ 是凸集,$f:C\to\mathbb R$ 是函数。那么 $f$ 是下凸的,当且仅当 $\{(x,y):x\in C,y\in \mathbb R,y\geq f(x)\}$ 是凸集。
引理 10.7.16 中所述的集合有时被称为 $f$ 的 “上镜图”。 引理 10.7.22 中所述的集合有时被称为 $f$ 的 “上镜图”。