人工智能数学基础之高等数学(持续更新)
函数与极限
函数
y=f(x)y = f(x)y=f(x) ,x是函数f的自变量,y是因变量
函数极限
limx→x0f(x)=A\lim\limits_{x \to x_0} f(x) = Ax→x0limf(x)=A 当xxx无限接近于x0x_0x0时,f(x)f(x)f(x)无限接近于常数A。
xxx趋于x0x_0x0有三种写法:
{x→x0x→x0+x→x0− \begin{cases} x \rightarrow x_0\\ x \rightarrow x_0^+\\ x \rightarrow x_0^- \end{cases} ⎩⎪⎨⎪⎧x→x0x→x0+x→x0−
第一种是xxx无限趋近于x0x_0x0,解释是它们相差的绝对值是无穷小的;
第二种是从大于x0x_0x0的方向趋近(从右侧);
第二种是从小于x0x_0x0的方向趋近(从左侧);
x→∞x \rightarrow \inftyx→∞也有三种写法:
{x→∞x→+∞x→−∞ \begin{cases} x \rightarrow \infty\\ x \rightarrow +\infty\\ x \rightarrow -\infty \end{cases} ⎩⎪⎨⎪⎧x→∞x→+∞x→−∞
第一种表示∣x∣|x|∣x∣是无穷大的,同样也可能是正数或负数;
第二种表示趋向于正无穷大;
第三种表示趋向于负无穷大;
函数极限的定义:
如果∀ϵ>0\forall \epsilon > 0∀ϵ>0(对于任意的ϵ\epsilonϵ大于0),∃δ>0\exist \delta > 0∃δ>0(存在δ\deltaδ大于0),当0<∣x−x0∣<δ0 < | x - x_0| < \delta0<∣x−x0∣<δ时,总有∣f(x)−A∣<ϵ|f(x) - A| < \epsilon∣f(x)−A∣<ϵ,则称limx→x0f(x)=A\lim\limits_{x \to x_0} f(x) = Ax→x0limf(x)=A
我们可以通过图形来理解极限,如上图,该函数的极限为0(x→−∞x \rightarrow -\inftyx→−∞ 和x→+∞x \rightarrow +\inftyx→+∞ ,都趋向于0,因此说x→∞x \rightarrow \inftyx→∞ 时极限为0 )
该图形对应的代码为:
import numpy as np import matplotlib.pyplot as plt fig = plt.figure() x = np.linspace(-100, 100, 100) y = 1/x ax = fig.add_subplot(111) ax.plot(x, y) ax.spines['left'].set_position('zero') ax.spines['right'].set_color('none') ax.spines['bottom'].set_position('zero') ax.spines['top'].set_color('none') # remove the ticks from the top and right edges ax.xaxis.set_ticks_position('bottom') ax.yaxis.set_ticks_position('left') plt.axhline(0,color = 'red',linestyle = '--',alpha = 0.5) plt.show()
无穷小与无穷大
无穷小
极限为零的变量称为无穷小。
若有f(x)f(x)f(x),当x→x0x \rightarrow x_0x→x0(或x→∞x \rightarrow \inftyx→∞) 极限为零,则称f(x)f(x)f(x)为x→x0x \rightarrow x_0x→x0(或x→∞x \rightarrow \inftyx→∞) 时的无穷小。
例如 limx→0sinx=0\lim\limits_{x \to 0} \sin x = 0x→0limsinx=0,函数sinx\sin xsinx是当x→0x \rightarrow 0x→0时的无穷小。
import numpy as np import matplotlib.pyplot as plt fig = plt.figure() x = np.linspace(-np.pi, np.pi, 100) y = np.sin(x) ax = fig.add_subplot(111) ax.plot(x, y) ax.spines['left'].set_position('zero') ax.spines['right'].set_color('none') ax.spines['bottom'].set_position('zero') ax.spines['top'].set_color('none') # remove the ticks from the top and right edges ax.xaxis.set_ticks_position('bottom') ax.yaxis.set_ticks_position('left') #plt.axhline(0,color = 'red',linestyle = '--',alpha = 0.5) plt.show()
无穷大
若有f(x)f(x)f(x),当x→x0x \rightarrow x_0x→x0(或x→∞x \rightarrow \inftyx→∞) f(x)f(x)f(x)无限增大,则称f(x)f(x)f(x)为x→x0x \rightarrow x_0x→x0(或x→∞x \rightarrow \inftyx→∞) 时的无穷大。
记作limx→x0f(x)=∞\lim\limits_{x \to x_0} f(x) = \inftyx→x0limf(x)=∞ 或limx→∞f(x)=∞\lim\limits_{x \to \infty} f(x) = \inftyx→∞limf(x)=∞
无穷大和无穷小都是有条件的,即趋于某一点或无穷大时。
同样是y=1xy = \frac{1}{x}y=x1这个函数,当x→0x \rightarrow 0x→0时(从两个方向),yyy都是无限增大的。
极限的四则运算
设limf(x)=A\lim f(x) =Alimf(x)=A,limg(x)=B\lim g(x) = Blimg(x)=B,则
- lim[f(x)±g(x)]=A±B\lim [f(x) \pm g(x)] = A \pm Blim[f(x)±g(x)]=A±B
- lim[f(x)⋅g(x)]=A⋅B\lim [f(x) \cdot g(x)] = A \cdot Blim[f(x)⋅g(x)]=A⋅B
- limf(x)g(x)=AB\lim \frac{f(x)}{g(x)} = \frac{A}{B}limg(x)f(x)=BA,其中BBB不等于000
- 两个无穷小的和是无穷小
- 有界函数和无穷小的乘积是无穷小
常见函数的极限
1.求 limx→1x2−1x−1\lim\limits_{x \to 1} \frac{x^2-1}{x-1}x→1limx−1x2−1
limx→1x2−1x−1=limx→1(x+1)(x−1)x−1=limx→1(x+1)=2\lim\limits_{x \to 1} \frac{x^2-1}{x-1} = \lim\limits_{x \to 1} \frac{(x+1)(x-1)}{x-1} = \lim\limits_{x \to 1} (x+1) = 2x→1limx−1x2−1=x→1limx−1(x+1)(x−1)=x→1lim(x+1)=2
由于分母的极限为0,不能用法则3,但是可以约分,因此先约分再求极限。
2.limx→∞1x=0\lim\limits_{x \to \infty} \frac{1}{x} = 0x→∞limx1=0
3.limx→0sinxx=1\lim\limits_{x \to 0} \frac{\sin x}{x}=1x→0limxsinx=1
4.limx→∞(1+1x)x=e\lim\limits_{x \to \infty} (1+ \frac{1}{x})^x=ex→∞lim(1+x1)x=e 或 limx→0(1+x)1x=e\lim\limits_{x \to 0} (1+ x)^{\frac{1}{x}}=ex→0lim(1+x)x1=e
函数连续
设函数y=f(x)y=f(x)y=f(x),在x0x_0x0的邻域内有定义,若limx→x0f(x)=f(x0)\lim\limits_{x \to x_0} f(x) = f(x_0)x→x0limf(x)=f(x0),则称f(x)f(x)f(x)在点x0x_0x0处连续。
上图左边的函数是连续的,而右边的函数不是连续的。
举例
讨论f(x)={x+2,x≥0x−2,x<0在x=0处的连续性 讨论 f(x) = \begin{cases} x + 2, x \geq 0\\ x - 2, x < 0 \end{cases} 在 x = 0处的连续性 讨论f(x)={x+2,x≥0x−2,x<0在x=0处的连续性
解:
函数在x=0x = 0x=0处有定义,
limx→0+f(x)=limx→0+(x+2)\lim\limits_{x \to 0^+} f(x) = \lim\limits_{x \to 0^+} (x+2)x→0+limf(x)=x→0+lim(x+2) = 2
≠
limx→0−f(x)=limx→0−(x−2)\lim\limits_{x \to 0^-} f(x) = \lim\limits_{x \to 0^-} (x-2)x→0−limf(x)=x→0−lim(x−2) = -2
因此极限不存在,该函数在0处不连续。
连续函数的和差积商也是连续的;连续函数的符合函数是连续的;基本初等函数在其定义域内都连续。
导数
设y=f(x)y = f(x)y=f(x), x0→x0+Δxx_0 \rightarrow x_0 + \Delta xx0→x0+Δx,则Δy=f(x0+Δx)−f(x0)\Delta y = f(x_0 + \Delta x) - f(x_0)Δy=f(x0+Δx)−f(x0),
若limΔx→0ΔyΔx\lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta x}Δx→0limΔxΔy 存在,则称y=f(x)y = f(x)y=f(x)在点x0x_0x0处可导。
在x0x_0x0处的导数值,简称为导数,记作 f′(x0)=limΔx→0ΔyΔx=limΔx→0f(x0+Δx)−f(x0)Δxf ^\prime (x_0) = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta x} = \lim\limits_{\Delta x \to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x}f′(x0)=Δx→0limΔxΔy=Δx→0limΔxf(x0+Δx)−f(x0)
导数的理解:
- 指的是该点的变化率,可能是变大(导数为正),也可能变小(导数为负)
- 从几何意义上,是该点切线的斜率
怎么理解导数是变化率:
- 就是如果自变量x继续增加,因变量y的变化。
- 如果导数大于0,则y变大;如果导数小于0,则y变小。
- 自变量x沿着导数地方向变化,就是沿着因变量y增加的方向变化
可导和连续
先来看一下连续和可导的几何意义
连续就是不间断,x0x_0x0点左极限等于右极限等于f(x0)f(x_0)f(x0)的值;如果自变量增量趋于0时,因变量增量不趋于0,那么也就是说 f(x)−limf(x0)(x→x0)f(x) - \lim f(x_0) (x \rightarrow x_0)f(x)−limf(x0)(x→x0)不等于0,那么也就是说在x0x_0x0点左极限或者右极限不等于f(x0)f(x_0)f(x0)那么这种情况只能是间断的,所以自变量趋于0时,因变量一定也要趋于0时,才连续。
连续几何上看就是函数的图形不间断;可导的几何意义是曲线在该点处有斜率且斜率存在。
那么可导和连续的关系,我们可以通过一个图形来理解:
由于在x2x_2x2和x4x_4x4处是断开的,不连续,无法做出切线,就没有切线的斜率一说了,因此不可导。
在x3x_3x3chu处是连续的,但是图形在x3x_3x3处不光滑,没有办法做出唯一的切线,因此该点是不可导的。
x5x_5x5处斜率不存在,不可导。
光滑函数:曲线不尖锐,必光滑。连续光滑的曲线,必然处处有切线,这点是必然的,没有切线(或没有唯一的切线)的地方,就不光滑。
由上可知,不连续一定不可导;可导则必然连续;连续不一定可导。
最后以一个图片作为总结:
导数的四则运算
设函数u=u(x)u = u(x)u=u(x)和v=v(x)v = v(x)v=v(x)在点xxx处可导,则其和、差、积、商在xxx处也可导,有以下法则和推论:
- (u±v)′=u′±v′(u \pm v)^\prime = u^\prime \pm v^\prime(u±v)′=u′±v′
- (uv)′=u′v+uv′(uv)^\prime = u^\prime v + uv^\prime(uv)′=u′v+uv′ (第一项求导乘第二项 加 第一项不动乘第二项的导数)
- (uv)′=u′v−uv′v2(\frac{u}{v})^\prime = \frac{u^\prime v - uv^\prime}{v^2}(vu)′=v2u′v−uv′ (vvv ≠ 0)
推论:
- (Cu)′=Cu′(Cu)^\prime = Cu^\prime(Cu)′=Cu′ (CCC个u′u\primeu′相加)
- (uvw)′=u′vw+uv′w+uvw′(uvw)^\prime = u^\prime vw + uv^\prime w + uvw^\prime(uvw)′=u′vw+uv′w+uvw′ (第一个函数求导二三函数不动 加第二个函数求导一三不动 加 一二不动第三个函数求导)
我们来利用这些法则求导(tanx)′(\tan x) ^\prime(tanx)′
(tanx)′=(sinxcosx)′=(sinx)′cosx−sinx(cosx)′cos2x(\tan x)^\prime = \Big( \frac{\sin x}{\cos x} \Big)^\prime = \frac{(\sin x)^\prime \cos x - \sin x (\cos x)^\prime}{\cos ^2 x}(tanx)′=(cosxsinx)′=cos2x(sinx)′cosx−sinx(cosx)′
=cos2x+sin2xcos2x=1cos2x=sec2x\quad\quad\quad = \frac{\cos ^2 x + \sin ^2 x}{\cos ^2 x} = \frac{1}{\cos^2 x} = \sec^2 x=cos2xcos2x+sin2x=cos2x1=sec2x
复合函数求导法
设函数y=f(u),u=φ(x)y = f(u),u = \varphi (x)y=f(u),u=φ(x)均可导,则复合函数y=f(φ(x))y = f(\varphi (x))y=f(φ(x))的导数
dydx=limΔx→0ΔyΔx=limΔx→0ΔyΔu⋅ΔuΔx \frac{dy}{dx} = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta x} = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta u} \cdot \frac{\Delta u}{\Delta x} dxdy=Δx→0limΔxΔy=Δx→0limΔuΔy⋅ΔxΔu
由y=f(x)y = f(x)y=f(x) 可导,则f(x)f(x)f(x)连续,则有 limΔx→0Δy=0\lim\limits_{\Delta x \to 0} \Delta y = 0Δx→0limΔy=0 ,可推出 limΔx→0Δu=0\lim\limits_{\Delta x \to 0} \Delta u= 0Δx→0limΔu=0
那么Δx→0\Delta x \rightarrow 0Δx→0 和Δu→0\Delta u \rightarrow 0Δu→0是等效的,上式有:
dydx=limΔx→0ΔyΔx=limΔx→0ΔyΔu⋅ΔuΔx=limΔu→0ΔyΔu⋅limΔx→0ΔuΔx=dydu⋅dudx \frac{dy}{dx} = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta x} = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta u} \cdot \frac{\Delta u}{\Delta x} = \lim\limits_{\Delta u \to 0} \frac{\Delta y}{\Delta u} \cdot \lim\limits_{\Delta x \to 0} \frac{\Delta u}{\Delta x} = \frac{dy}{du} \cdot \frac{du}{dx} dxdy=Δx→0limΔxΔy=Δx→0limΔuΔy⋅ΔxΔu=Δu→0limΔuΔy⋅Δx→0limΔxΔu=dudy⋅dxdu
由上可得复合函数求导法则:
设函数y=f(u),u=φ(x)y = f(u),u = \varphi (x)y=f(u),u=φ(x)均可导,则复合函数y=f(φ(x))y = f(\varphi (x))y=f(φ(x))也可导,且dydx=dydu⋅dudx\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}dxdy=dudy⋅dxdu 或写成 yx′=yu′⋅ux′y^\prime _x = y^\prime _u \cdot u^\prime _xyx′=yu′⋅ux′
高阶导数
定义:如果函数f(x)f(x)f(x)的导数f′(x)f ^\prime (x)f′(x)在xxx点处可导,则称(f′(x))′(f ^\prime (x))^\prime(f′(x))′为函数f(x)f(x)f(x)在xxx处的二阶导数,记为:y′′,f′′(x),d2ydx2y {^\prime}{^\prime},f {^\prime}{^\prime}(x),\frac{d^2y}{dx^2}y′′,f′′(x),dx2d2y。
同理,二阶导数的导数称为函数f(x)f(x)f(x)的三阶导数,记为:y′′′,f′′′(x),d3ydx3y {^\prime}{^\prime}{^\prime},f {^\prime}{^\prime}{^\prime}(x),\frac{d^3y}{dx^3}y′′′,f′′′(x),dx3d3y。
n−1n-1n−1阶导数的导数称为函数f(x)f(x)f(x)的nnn阶导数,记作:y(n),f(n)(x),dnydxny^{(n)},f^{(n)}(x),\frac{d^ny}{dx^n}y(n),f(n)(x),dxndny。
二阶及二阶以上的导数称为高阶导数。
记法说明:
- d2ydx2=ddx(dydx)\frac{d^2y}{dx^2} = \frac{d}{dx}(\frac{dy}{dx})dx2d2y=dxd(dxdy)
- y′′,y′′′,y(4),...,y(n)y{^\prime}{^\prime},y{^\prime}{^\prime}{^\prime},y^{(4)},...,y^{(n)}y′′,y′′′,y(4),...,y(n)
偏导数
要学习偏导数,先要了解二元函数的概念
二元函数
所谓二元函数,即因变量有两个的函数。例如圆柱体体积计算公式为 V=πr2h,{(r,h)∣r>0,h>0}V = \pi r^2h,\{(r,h)|r > 0, h > 0\}V=πr2h,{(r,h)∣r>0,h>0}
相应的,n元函数就是有n个因变量的函数。
偏导数的概念
设函数z=f(x,y)z = f(x,y)z=f(x,y)在点(x0,y0)(x_0,y_0)(x0,y0)的某一邻域内有定义,当yyy固定在y0y_0y0而xxx在x0x_0x0处有增量Δx\Delta xΔx时,相应地函数有偏增量
Δxz=f(x0+Δx,y0)−f(x0,y0)\Delta_x z = f(x_0 + \Delta x,y_0) - f(x_0,y_0)Δxz=f(x0+Δx,y0)−f(x0,y0),
如果limΔx→0f(x0+Δx,y0)−f(x0,y0)Δx\lim\limits_{\Delta x \to 0} \frac{ f(x_0 + \Delta x,y_0) - f(x_0,y_0)}{\Delta x}Δx→0limΔxf(x0+Δx,y0)−f(x0,y0)存在,则称此极限为函数z=f(x,y)z = f(x,y)z=f(x,y)在点(x0,y0)(x_0,y_0)(x0,y0)处对xxx的偏导数,
记为
即 zx∣y=y0x=x0=limΔx→0f(x0+Δx,y0)−f(x0,y0)Δx\left.z_x\right|_{y = y_0}^{x = x_0} = \lim\limits_{\Delta x \to 0} \frac{ f(x_0 + \Delta x,y_0) - f(x_0,y_0)}{\Delta x}zx∣y=y0x=x0=Δx→0limΔxf(x0+Δx,y0)−f(x0,y0)
对yyy的偏导数同理。
要注意的是, 函数在一点处偏导存在,则函数在这点不一定连续
偏导数的几何意义
练习一下,我们来求z=x2+3xy+y2z = x^2 + 3xy + y^2z=x2+3xy+y2 在点(1,2)处的偏导数.
解 ∂z∂x=2x+3y\frac{\partial z}{\partial x} = 2x + 3y∂x∂z=2x+3y,∂z∂y=3x+2y\frac{\partial z}{\partial y} = 3x + 2y∂y∂z=3x+2y
∂z∂x=2⋅1+3⋅2=8\frac{\partial z}{\partial x} = 2 \cdot 1 + 3\cdot 2 = 8∂x∂z=2⋅1+3⋅2=8
∂z∂y=3⋅1+2⋅2=7\frac{\partial z}{\partial y} = 3 \cdot 1 + 2\cdot 2 = 7∂y∂z=3⋅1+2⋅2=7
注意,求偏导的时候,把其他因变量看成常量
微分
对于函数y=f(x),x→x+Δxy = f(x),x \rightarrow x +\Delta xy=f(x),x→x+Δx,
因变量增量为Δy=f(x+Δx)−f(x)\Delta y = f(x + \Delta x) - f(x)Δy=f(x+Δx)−f(x)
导数(变化率)有 f′(x)=limΔx→0ΔyΔx⟹Δx→0,ΔyΔx→f′(x)⟹∣Δx∣f^\prime (x) = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta x} \Longrightarrow \Delta x \rightarrow 0,\frac{\Delta y}{\Delta x} \rightarrow f^\prime (x) \Longrightarrow |\Delta x|f′(x)=Δx→0limΔxΔy⟹Δx→0,ΔxΔy→f′(x)⟹∣Δx∣充分小时,ΔyΔx≈f′(x)\frac{\Delta y}{\Delta x} \approx f^\prime (x)ΔxΔy≈f′(x)
也就是说,∣Δx∣|\Delta x|∣Δx∣充分小时,Δy≈f′(x)Δx\Delta y \approx f^\prime (x) \Delta xΔy≈f′(x)Δx
我们称f′(x)Δxf^\prime (x) \Delta xf′(x)Δx为函数的微分,记为dy=f′(x)Δxdy = f^\prime (x) \Delta xdy=f′(x)Δx
微分的意义是因变量增量的近似值(函数变化的程度)
当∣Δx∣|\Delta x|∣Δx∣充分小时,Δy≈dy\Delta y \approx dyΔy≈dy
微分 dy=f′(x)Δxdy = f^\prime (x) \Delta xdy=f′(x)Δx,dx=(x)′⋅Δx=Δxdx = (x)^\prime \cdot \Delta x = \Delta xdx=(x)′⋅Δx=Δx
因此,微分也可以表示为 dy=f′(x)dxdy = f^\prime (x) dxdy=f′(x)dx
将两边同除dxdxdx得:
dy=f′(x)dx⟺dydx=f′(x)dy = f^\prime (x) dx \Longleftrightarrow \frac{dy}{dx} = f^\prime(x)dy=f′(x)dx⟺dxdy=f′(x)
导数从微分的角度看可以表示成因变量的微分比上自变量的微分,所以导数还有个别名叫微商。
由此也可以看出可微和可导是等价的,因此求微分时可以先求导数,再改写为微分。
中值定理
罗尔定理
如果函数y=f(x)y = f(x)y=f(x)满足条件
- 在[a,b]上连续;
- 在(a,b)内可导;
- f(a)=f(b)f(a) = f(b)f(a)=f(b);
则那么至少存在一点ξ(a<ξ<b)\xi (a < \xi < b)ξ(a<ξ<b),使得 f′(ξ)=0f^\prime (\xi) = 0f′(ξ)=0
(找不到高清图,只有这种了,ccc就是ξ\xiξ)
几何意义:如果连续曲线除端点外处处具有不垂直于x轴的切线,且两个端点处的纵坐标相等,那么其上至少有一点处的切线平行于x轴。
其应用是判断方程根的存在性。
拉格朗日中值定理
该定理反反映了可导函数在闭区间上整体的平均变化率与区间内某点的局部变化率的关系。
从这个函数图形来看,是不是很像罗尔定理的图形旋转了一下。并且可以看出,ccc点处的切线虽然不再平行于x轴,但是平行于AB两点的连线。即它们的斜率是相等的,有:
f′(ξ)=kAB=f(b)−f(a)b−af^\prime (\xi) = k_{AB} = \frac{f(b) - f(a)}{b -a}f′(ξ)=kAB=b−af(b)−f(a)
得到拉格朗日中值定理:
如果函数y=f(x)y = f(x)y=f(x)满足条件
- 在[a,b]上连续;
- 在(a,b)内可导;
则那么至少存在一点ξ(a<ξ<b)\xi (a < \xi < b)ξ(a<ξ<b),使得
f′(ξ)=f(b)−f(a)b−af^\prime (\xi) = \frac{f(b) - f(a)}{b -a}f′(ξ)=b−af(b)−f(a) 或 f(b)−f(a)=f′(ξ)(b−a)f(b) - f(a) = f^\prime (\xi) (b - a)f(b)−f(a)=f′(ξ)(b−a)
几何意义:如果连续曲线除端点外处处具有不垂直于ox轴的切线,那么其上至少有这样一点存在,在该点处曲线的切线平行于连接两端点的直线,即两者斜率相同。
我们来应用一下吧,用拉格朗日中值定理证明,当x>0x > 0x>0时,x1+x<ln(1+x)<x\frac{x}{1+x} < \ln(1+x) < x1+xx<ln(1+x)<x
证明 构造辅助函数f(t)=ln(1+t)f(t) = \ln(1+t)f(t)=ln(1+t)
f(t)f(t)f(t)在[0,x]上满足朗格朗日中值定理的条件,那么根据定理,存在点ξ(0<ξ<x)\xi(0 < \xi <x)ξ(0<ξ<x),满足
f(x)−f(0)=f′(ξ)(x−0)f(x) - f(0) = f^\prime(\xi)(x - 0)f(x)−f(0)=f′(ξ)(x−0) ①
由于 f(x)=ln(1+x)f(x) = \ln(1 + x)f(x)=ln(1+x),f(0)=0f(0) = 0f(0)=0
f′(t)=11+tf^\prime(t) = \frac{1}{1+t}f′(t)=1+t1
因此,①式可化为 ln(1+x)−0=x1+ξ\ln(1+x) - 0 = \frac{x}{1 + \xi}ln(1+x)−0=1+ξx
又因为 (0<ξ<x)(0 < \xi <x)(0<ξ<x)
x1+x<x1+ξ<x1+0\frac{x}{1+x} < \frac{x}{1+ \xi} < \frac{x}{1+0}1+xx<1+ξx<1+0x (分母越大,分数值越小)
即 x1+x<ln(1+x)<x\frac{x}{1+x} < \ln(1+x) < x1+xx<ln(1+x)<x
柯西中值定理
是拉格朗日中值定理的推广
在拉格朗日中值定理中,若函数由参数方程:
{X=F(x)Y=f(x)(a≤x≤b,x为参数) \begin{cases} X = F(x)\\ Y = f(x) \end{cases} (a \leq x \leq b,x为参数) {X=F(x)Y=f(x)(a≤x≤b,x为参数)
表示,如图所示
则连接两个端点A,B的直线斜率为
f(b)−f(a)F(b)−F(a)\frac{f(b) - f(a)}{F(b) - F(a)}F(b)−F(a)f(b)−f(a)
而曲线在点P(x=ξ)P(x=\xi)P(x=ξ)处的切线T斜率为
dYdX=f′(ξ)F′(ξ)\frac{dY}{dX} = \frac{f^\prime(\xi)}{F^\prime(\xi)}dXdY=F′(ξ)f′(ξ)
则由曲线在点P的切线T与直线L平行可知:
f(b)−f(a)F(b)−F(a)=f′(ξ)F′(ξ)\frac{f(b) - f(a)}{F(b) - F(a)} = \frac{f^\prime(\xi)}{F^\prime(\xi)}F(b)−F(a)f(b)−f(a)=F′(ξ)f′(ξ)
得到柯西中值定理:
如果函数f(x)f(x)f(x)和F(x)F(x)F(x)满足
- 在[a,b]上连续;
- 在(a,b)内可导,且F′(x)F^\prime(x)F′(x) ≠ 000;
则至少存在一点ξ(a<ξ<b)\xi(a < \xi < b)ξ(a<ξ<b),使得
f(b)−f(a)F(b)−F(a)=f′(ξ)F′(ξ) \frac{f(b) - f(a)}{F(b) - F(a)} = \frac{f^\prime(\xi)}{F^\prime(\xi)} F(b)−F(a)f(b)−f(a)=F′(ξ)f′(ξ)
几何意义:曲线弧AB上至少有一点P(F(ξ),f(ξ))P(F(\xi),f(\xi))P(F(ξ),f(ξ)),在该点处的切线平行于弦AB.
洛必达法则
设函数f(x)f(x)f(x),g(x)g(x)g(x)满足:
- limΔx→af(x)=limΔx→ag(x)=0(或∞)\lim\limits_{\Delta x \to a} f(x) = \lim\limits_{\Delta x \to a} g(x) = 0 (或\infty)Δx→alimf(x)=Δx→alimg(x)=0(或∞); (极限无穷小或无穷大)
- 在U˚(a)\mathring{U}(a)U˚(a)内,f′(x)f^\prime(x)f′(x)和g′(x)g^\prime(x)g′(x)都存在,且g′(x)g^\prime(x)g′(x) ≠ 000;
- limΔx→af′(x)g′(x)=A(A可为实数,也可以是∞)\lim\limits_{\Delta x \to a} \frac{f^\prime(x)}{g^\prime(x)} = A(A可为实数,也可以是\infty)Δx→alimg′(x)f′(x)=A(A可为实数,也可以是∞),(求导之后的极限存在)
则
limΔx→af(x)g(x)=limΔx→af′(x)g′(x)=A
\lim\limits_{\Delta x \to a} \frac{f(x)}{g(x)} =\lim\limits_{\Delta x \to a} \frac{f^\prime(x)}{g^\prime(x)} = A
Δx→alimg(x)f(x)=Δx→alimg′(x)f′(x)=A
我们称00\frac{0}{0}00、∞∞\frac{\infty}{\infty}∞∞为未定式,而洛必达法则可用于求这种未定式的极限。
泰勒展开式
推荐看这篇文章怎样更好地理解并记忆泰勒展开式?
如果两个连续的曲线想要相同,那么它们在某一点的一阶导数要相同,二阶导数也要相同,…,n阶导数也要相同,这是泰勒展开的核心思想。(曲线的变化率的变化率的变化率…都相同)
假设给定函数f(x)=exf(x) = e^xf(x)=ex,我们想用一个多项式函数g(x)g(x)g(x)去拟合它。
因为f(x)f(x)f(x)能无限求导 (ex)′=ex(e^x)^\prime = e^x(ex)′=ex,所以我们的拟合函数也要能无限求导,
所以必须要是一个无限多项的多项式:
g(x)=a0+a1x+a2x2+...+anxng(x) = a_0 + a_1x + a_2x^2 + ... + a_nx^ng(x)=a0+a1x+a2x2+...+anxn ①
假设f(x)=g(x)f(x) = g(x)f(x)=g(x),我们取x=0x=0x=0点,
f(0)=g(0)=e0=1f(0)=g(0) = e^0 = 1f(0)=g(0)=e0=1 得到 a0=1a_0 = 1a0=1
f′(0)=g′(0)=1f^\prime(0) = g^\prime(0) = 1f′(0)=g′(0)=1
f′′(0)=g′′(0)=1f^{\prime\prime}(0) = g^{\prime\prime}(0) = 1f′′(0)=g′′(0)=1
…
fn(0)=gn(0)f^n(0) = g^n(0)fn(0)=gn(0)
我们再来看gn(0)g^n(0)gn(0),它的n阶导数是和它的最高项n有关,前面的小于n项的n阶导数都会变为0。
而(anxn)(a_nx^n)(anxn)的n阶导数为:n!ann!a_nn!an
也就是gn(0)=n!ang^n(0) = n!a_ngn(0)=n!an得到an=fn(0)n!a_n = \frac{f^n(0)}{n!}an=n!fn(0)
我们将ana_nan带入 ①式:
g(x)=f(0)+f′(0)1!x+f′′(0)2!x2+f3(0)3!x3+...+fn(0)n!xn
g(x) = f(0) + \frac{f^\prime(0)}{1!}x + \frac{f^{\prime\prime}(0)}{2!}x^2 + \frac{f^3(0)}{3!}x^3 + ... + \frac{f^n(0)}{n!}x^n
g(x)=f(0)+1!f′(0)x+2!f′′(0)x2+3!f3(0)x3+...+n!fn(0)xn
以上是选取x=0x=0x=0点时的泰勒展开,一般的,我们选取x=ax=ax=a点的泰勒展开即为:
g(x)=f(a)+f′(a)1!(x−a)+f′′(a)2!(x−a)2+f3(a)3!(x−a)3+...+fn(a)n!(x−a)n
g(x) = f(a) + \frac{f^\prime(a)}{1!}(x-a) + \frac{f^{\prime\prime}(a)}{2!}(x-a)^2 + \frac{f^3(a)}{3!}(x-a)^3 + ... + \frac{f^n(a)}{n!}(x-a)^n
g(x)=f(a)+1!f′(a)(x−a)+2!f′′(a)(x−a)2+3!f3(a)(x−a)3+...+n!fn(a)(x−a)n
如何理解xxx变成了x−ax-ax−a了呢?从000点改到aaa点,相当于函数图像向右平移aaa个单位,即变成了x−ax-ax−a (左右平移是X加或减)
得到泰勒展开式为:
如果想要等式左右两边相等,光到nnn项是不够的,后面还有n+1,n+2,...n+1,n+2,...n+1,n+2,...无穷多项,
nnn后的无穷多项通过Rn(x)R_n(x)Rn(x)来表示。
不定积分
原函数:在区间III上函数F(x)F(x)F(x)可导,F′(x)=f(x)F^\prime(x) = f(x)F′(x)=f(x)或dF(x)=f(x)dxdF(x) = f(x)dxdF(x)=f(x)dx,那么F(x)F(x)F(x)就是f(x)f(x)f(x)在这个区间上的一个原函数。
连续函数一定有原函数
在区间III上函数f(x)f(x)f(x)的全体原函数F(x)+CF(x) + CF(x)+C称为f(x)f(x)f(x)的不定积分,记为∫f(x)dx=F(x)+C\int f(x)dx = F(x) + C∫f(x)dx=F(x)+C
不定积分是全体原函数(常数CCC的导数为0)
∫\int∫积分号,f(x)f(x)f(x)被积函数,f(x)dxf(x)dxf(x)dx被积表达式,xxx积分变量
微分运算与不定积分运算互为逆运算。
不定积分的性质:
- ∫[f(x)±g(x)]dx=∫f(x)dx±∫g(x)dx\int [f(x) \pm g(x)]dx = \int f(x)dx \pm \int g(x)dx∫[f(x)±g(x)]dx=∫f(x)dx±∫g(x)dx
- ∫kf(x)dx=k∫f(x)dx\int kf(x)dx = k\int f(x)dx∫kf(x)dx=k∫f(x)dx (kkk为常数,且不为零)
定积分
定义:∫baf(x)dx=limλ→0∑i=1nf(ξi)Δxi\int ^a_b f(x)dx = \lim\limits_{\lambda \to 0} \sum_{i=1}^nf(\xi_i)\Delta x_i∫baf(x)dx=λ→0lim∑i=1nf(ξi)Δxi
几何意义:曲边图形的面积S=∫baf(x)dxS=\int ^a_b f(x)dxS=∫baf(x)dx
当f(x)≥0f(x) \geq 0f(x)≥0时,积分∫baf(x)dx\int ^a_b f(x)dx∫baf(x)dx在集合上表示由y=f(x)y=f(x)y=f(x)、x=ax=ax=a、x=bx=bx=b及xxx轴所围成的曲边梯形的面积;
当f(x)≤0f(x) \leq 0f(x)≤0时,由y=f(x)y=f(x)y=f(x)、x=ax=ax=a、x=bx=bx=b及xxx轴所围成的曲边梯形位于xxx轴下方,积分∫baf(x)dx\int ^a_b f(x)dx∫baf(x)dx在几何上表示上述曲边梯形面积的负值;
如果f(x)f(x)f(x)是[a,b][a,b][a,b]上的连续函数,并且有F′(x)=f(x)F^′(x)=f(x)F′(x)=f(x),那么
∫baf(x)dx=F(b)−F(a)
\int ^a_b f(x)dx = F(b) - F(a)
∫baf(x)dx=F(b)−F(a)
也就是说,一个定积分式的值,就是原函数在上限的值与原函数在下限的值的差。
函数单调性与极值
函数单调性
设函数y=f(x)y=f(x)y=f(x)在(a,b)(a,b)(a,b)内可导,对∀x∈(a,b)\forall x \in (a,b)∀x∈(a,b)
- 若f′(x)>0⟹f(x)f^\prime(x) > 0 \Longrightarrow f(x)f′(x)>0⟹f(x)在(a,b)(a,b)(a,b)内单调递增;
- 若f′(x)<0⟹f(x)f^\prime(x) < 0 \Longrightarrow f(x)f′(x)<0⟹f(x)在(a,b)(a,b)(a,b)内单调递减;
我们来证明第一条:
已知f′(x)>0,x∈(a,b)f^\prime(x) > 0,x \in (a,b)f′(x)>0,x∈(a,b)
取∀x1,x2∈(a,b)\forall x_1,x_2 \in (a,b)∀x1,x2∈(a,b),设x1<x2x_1 < x_2x1<x2,
由拉格朗日中值定理可知,存在ξ∈(a,b)\xi \in (a,b)ξ∈(a,b),使得 f(x2)−f(x1)=f′(ξ)(x2−x1)f(x_2) - f(x_1) = f^\prime(\xi) (x_2 - x_1)f(x2)−f(x1)=f′(ξ)(x2−x1)
由已知f′(x)>0,x2−x1>0f^\prime(x) > 0,x_2 - x_1 > 0f′(x)>0,x2−x1>0
可得 f(x2)>f(x1)f(x_2) > f(x_1)f(x2)>f(x1)
由x1,x2x_1,x_2x1,x2的任意性,所以f(x)f(x)f(x)在(a,b)(a,b)(a,b)内单调递增
函数极值
设函数y=f(x)y=f(x)y=f(x)在x0x_0x0的某一邻域U(x0)U(x_0)U(x0)内有定义,对于∀x∈U(x0)\forall x \in U(x_0)∀x∈U(x0),且xxx ≠ x0x_0x0,均有
- f(x)<f(x0)f(x) < f(x_0)f(x)<f(x0),称f(x0)f(x_0)f(x0)为极大值,x0x_0x0为极大值点
- f(x)>f(x0)f(x) > f(x_0)f(x)>f(x0),称f(x0)f(x_0)f(x0)为极小值,x0x_0x0为极小值点
极大值和极小值统称为极值;极大值点和极小值点统称为极值点。
要注意是:
- 极值是局部性概念
- 可以有多个极大值或极小值
- 端点不是极值点(极值只在区间内部取得)
极值点处若f′(x)=0f^\prime(x) = 0f′(x)=0,这样的点称为驻点,若导数不存在,则称为尖点
我们可以注意到,极值点两侧单调性不同,也就是导数符号不同,
根据这点,我们可以得到极值判定第一充分条件:
极值判定(极值判定第一充分条件):
若函数f(x)f(x)f(x)可导,f′(x)=0f^\prime(x) = 0f′(x)=0 ,且 ∃σ>0\exists \sigma > 0∃σ>0,∀x∈(x0−σ,x0)\forall x \in (x_0 - \sigma , x_0)∀x∈(x0−σ,x0) 有 f′(x)>0f^\prime(x) > 0f′(x)>0(或 f′(x)<0f^\prime(x) < 0f′(x)<0)同时, ∀x∈(x0,x0+σ)\forall x \in (x_0 , x_0 + \sigma )∀x∈(x0,x0+σ) 有 f′(x)<0f^\prime(x) < 0f′(x)<0(或 f′(x)>0f^\prime(x) > 0f′(x)>0 ),则x0x_0x0 是函数f(x)f(x)f(x) 的极大点(或极小点)。
我们看上图,大概xxx取-3点处的函数值是极大值,该点出的切线斜率(导数)为0,左则切线斜率大于0,右侧切线斜率小于0。
也就是说,一阶导数在单调递减,因此二阶导数小于0。得出极值判定第二充分条件:
极值判定(极值判定第二充分条件):
设函数f(x)f(x)f(x)在U(x0)U(x_0)U(x0)内二阶可导,且f′(x)=0f^\prime(x) = 0f′(x)=0
- 若f′′(x)<0⟹f(x0)f^{\prime\prime}(x) < 0 \Longrightarrow f(x_0)f′′(x)<0⟹f(x0)是极大值;
- 若f′′(x)>0⟹f(x0)f^{\prime\prime}(x) > 0 \Longrightarrow f(x_0)f′′(x)>0⟹f(x0)是极小值;
- 若f′′(x)=0f^{\prime\prime}(x) = 0f′′(x)=0,无法判定
曲线的凹凸与拐点
凹凸
设函数f(x)f(x)f(x)在(a,b)(a,b)(a,b)内可导:
- 若曲线f(x)f(x)f(x)上任一点切线位于曲线的下方,则称曲线在(a,b)(a,b)(a,b)内是凹的,区间(a,b)(a,b)(a,b)称为凹区间;
- 若曲线f(x)f(x)f(x)上任一点切线位于曲线的上方,则称曲线在(a,b)(a,b)(a,b)内是凸的,区间(a,b)(a,b)(a,b)称为凸区间;
但是这是在给定了函数图像的情况下,若没有函数图像,我们该如何通过函数表达式来判断呢?
我们在曲线上去取三个点x1,x2,x3x_1,x_2,x_3x1,x2,x3,过这三个点做切线,这些曲线与xxx轴的夹角依次为α1,α2,α3\alpha_1,\alpha_2,\alpha_3α1,α2,α3
可以看到,导函数f′(x)f^\prime(x)f′(x)是单调递增的,也就是f′′(x)≥0f^{\prime\prime}(x) \geq 0f′′(x)≥0
同理,凸函数的二阶导数f′′(x)≤0f^{\prime\prime}(x) \leq 0f′′(x)≤0
函数的凹凸性判断
如果函数f(x)f(x)f(x)在(a,b)(a,b)(a,b)具有二阶导数f′′(x)f^{\prime\prime}(x)f′′(x):
- 若在(a,b)(a,b)(a,b)内f′′(x)>0f^{\prime\prime}(x) > 0f′′(x)>0,则f(x)f(x)f(x)在(a,b)(a,b)(a,b)内是凹的;
- 若在(a,b)(a,b)(a,b)内f′′(x)<0f^{\prime\prime}(x) < 0f′′(x)<0,则f(x)f(x)f(x)在(a,b)(a,b)(a,b)内是凸的;
拐点
定义:连续曲线上凹弧与凸弧的分界点称为曲线的拐点。
历经一个月,这篇文章终于更新完了,高数知识暂时告一段落了,后面的学习过程中如果碰到了相关知识会在本文中补充
在人工智能中,向量、矩阵也很重要。这些知识点尽在线性代数中
- 点赞 3
- 收藏
- 分享
- 文章举报
- 人工智能数学基础之线性代数(持续更新)
- 2019最新网易云课堂人工智能数学基础(同步更新)
- houdini数学基础(持续更新)
- 深度学习数学基础学习笔记——线性代数(持续更新中)
- 考研高等数学公式(更新中)
- Pig基础学习【持续更新中】
- 面试基础题集锦-持续更新
- python基础系列——字符串知识点,函数及操作(持续更新中)
- linux基础学习笔记(持续更新ING)
- angularjs基础知识。持续更新。。。
- (四)从零开始学人工智能—数学基础:导数
- 人工智能、机器学习及数学基础经典著作24本PDF下载地址(个别无链接请购买)
- java基础知识汇总(持续更新中....)
- [NOTE]linux常用基础命令(持续更新)
- 好用的数学公式(持续更新中)
- 00-Linux基础入门-命令总结(持续更新)
- 人工智能数学基础--极大似然估计
- [数据库基础]——编码标准之编码注意事项(持续更新)
- 向AI转行——人工智能工程师必学的数学基础
- MySQL数据库基础(一)(启动-停止、登录-退出、语法规范及最基础操作)(持续更新中)