Konvexnost funkce
φ
{\displaystyle \varphi }
na
[
a
,
b
]
{\displaystyle \left[a,b\right]}
je ekvivalentní s výrokem:
(
∀
x
,
y
∈
[
a
,
b
]
,
x
<
y
)
(
∀
λ
∈
[
0
,
1
]
)
(
φ
(
λ
y
+
(
1
−
λ
)
x
)
≤
λ
φ
(
y
)
+
(
1
−
λ
)
φ
(
x
)
)
{\displaystyle \left(\forall x,y\in \left[a,b\right],x<y\right)\left(\forall \lambda \in \left[0,1\right]\right)\left(\varphi \left(\lambda y+(1-\lambda )x\right)\leq \lambda \varphi (y)+(1-\lambda )\varphi (x)\right)}
.
Vlastní důkaz proběhne matematickou indukcí podle
n
{\displaystyle n}
.
n
=
1
{\displaystyle n=1}
: případ je triviální,
n
=
2
{\displaystyle n=2}
: tvrzení vyplývá přímo z výše uvedené definice konvexnosti,
n
→
n
+
1
{\displaystyle n\to n+1}
:
Indukční předpoklad:
φ
(
∑
i
=
1
n
λ
i
x
i
)
≤
∑
i
=
1
n
λ
i
φ
(
x
i
)
{\displaystyle \varphi \left(\sum _{i=1}^{n}\lambda _{i}x_{i}\right)\leq \sum _{i=1}^{n}\lambda _{i}\varphi \left(x_{i}\right)}
.
Dokážeme tuto nerovnost pro
n
+
1
{\displaystyle n+1}
, tedy:
φ
(
∑
i
=
1
n
+
1
λ
i
x
i
)
≤
∑
i
=
1
n
+
1
λ
i
φ
(
x
i
)
{\displaystyle \varphi \left(\sum _{i=1}^{n+1}\lambda _{i}x_{i}\right)\leq \sum _{i=1}^{n+1}\lambda _{i}\varphi \left(x_{i}\right)}
.
Sporem lze ukázat:
(
∃
i
0
∈
n
+
1
^
)
(
λ
i
0
≠
1
)
{\displaystyle \left(\exists i_{0}\in {\widehat {n+1}}\right)\left(\lambda _{i_{0}}\neq 1\right)}
. Kdyby totiž platil opak, tedy
(
∀
i
0
∈
n
+
1
^
)
(
λ
i
0
=
1
)
{\displaystyle \left(\forall i_{0}\in {\widehat {n+1}}\right)\left(\lambda _{i_{0}}=1\right)}
, pak
∑
i
=
1
n
+
1
λ
i
=
n
+
1
≥
2
{\displaystyle \sum _{i=1}^{n+1}\lambda _{i}=n+1\geq 2}
, což je spor s předpoklady.
Protože platí:
∑
i
=
1
n
+
1
λ
i
=
1
{\displaystyle \sum _{i=1}^{n+1}\lambda _{i}=1}
, platí také
∑
i
=
1
,
i
≠
i
0
n
+
1
λ
i
=
λ
{\displaystyle \sum _{i=1,i\neq i_{0}}^{n+1}\lambda _{i}=\lambda }
, kde
λ
:=
1
−
λ
i
0
{\displaystyle \lambda :=1-\lambda _{i_{0}}}
, a tedy:
∑
i
=
1
,
i
≠
i
0
n
+
1
λ
i
λ
=
1
{\displaystyle \sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}=1}
.
Snadno lze také ukázat:
(
∀
i
∈
n
+
1
^
,
i
≠
i
0
)
(
λ
i
λ
∈
[
0
,
1
]
)
{\displaystyle \left(\forall i\in {\widehat {n+1}},i\neq i_{0}\right)\left({\frac {\lambda _{i}}{\lambda }}\in \left[0,1\right]\right)}
, protože
(
∀
i
∈
n
+
1
^
,
i
≠
i
0
)
(
λ
i
∈
[
0
,
λ
]
)
{\displaystyle \left(\forall i\in {\widehat {n+1}},i\neq i_{0}\right)\left(\lambda _{i}\in \left[0,\lambda \right]\right)}
.
Pak lze zřejmě psát:
φ
(
∑
i
=
1
n
+
1
λ
i
x
i
)
=
φ
(
∑
i
=
1
,
i
≠
i
0
n
+
1
λ
i
x
i
+
λ
i
0
x
i
0
)
=
φ
(
λ
∑
i
=
1
,
i
≠
i
0
n
+
1
λ
i
λ
x
i
+
(
1
−
λ
)
x
i
0
)
{\displaystyle \varphi \left(\sum _{i=1}^{n+1}\lambda _{i}x_{i}\right)=\varphi \left(\sum _{i=1,i\neq i_{0}}^{n+1}\lambda _{i}x_{i}+\lambda _{i_{0}}x_{i_{0}}\right)=\varphi \left(\lambda \sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}x_{i}+(1-\lambda )x_{i_{0}}\right)}
.
Označme:
y
:=
∑
i
=
1
,
i
≠
i
0
n
+
1
λ
i
λ
x
i
{\displaystyle y:=\sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}x_{i}}
a dokažme, že
y
∈
[
a
,
b
]
{\displaystyle y\in \left[a,b\right]}
. Protože
(
∀
i
∈
n
+
1
^
)
(
x
i
∈
[
a
,
b
]
)
{\displaystyle \left(\forall i\in {\widehat {n+1}}\right)\left(x_{i}\in \left[a,b\right]\right)}
, můžeme
y
{\displaystyle y}
odhadnout shora, resp. zdola, když za
x
i
{\displaystyle x_{i}}
, pro všechna
i
{\displaystyle i}
dosadíme
b
{\displaystyle b}
, resp.
a
{\displaystyle a}
(zřejmě totiž platí:
b
=
∑
i
=
1
,
i
≠
i
0
n
+
1
λ
i
λ
b
{\displaystyle b=\sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}b}
, pro
a
{\displaystyle a}
analogicky).
Potom lze napsat:
φ
(
λ
∑
i
=
1
,
i
≠
i
0
n
+
1
λ
i
λ
x
i
+
(
1
−
λ
)
x
i
0
)
=
φ
(
λ
y
+
(
1
−
λ
)
x
i
0
)
{\displaystyle \varphi \left(\lambda \sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}x_{i}+(1-\lambda )x_{i_{0}}\right)=\varphi \left(\lambda y+(1-\lambda )x_{i_{0}}\right)}
.
Z uvedené definice konvexnosti plyne:
φ
(
λ
y
+
(
1
−
λ
)
x
i
0
)
≤
λ
φ
(
y
)
+
(
1
−
λ
)
φ
(
x
i
0
)
{\displaystyle \varphi \left(\lambda y+(1-\lambda )x_{i_{0}}\right)\leq \lambda \varphi (y)+(1-\lambda )\varphi (x_{i_{0}})}
.
Podle indukčního předpokladu lze psát:
λ
φ
(
y
)
+
(
1
−
λ
)
φ
(
x
i
0
)
=
λ
φ
(
∑
i
=
1
,
i
≠
i
0
n
+
1
λ
i
λ
x
i
)
+
(
1
−
λ
)
φ
(
x
i
0
)
≤
λ
∑
i
=
1
,
i
≠
i
0
n
+
1
λ
i
λ
φ
(
x
i
)
+
(
1
−
λ
)
φ
(
x
i
0
)
=
∑
i
=
1
n
+
1
λ
i
φ
(
x
i
)
{\displaystyle \lambda \varphi (y)+(1-\lambda )\varphi (x_{i_{0}})=\lambda \varphi (\sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}x_{i})+(1-\lambda )\varphi (x_{i_{0}})\leq \lambda \sum _{i=1,i\neq i_{0}}^{n+1}{\frac {\lambda _{i}}{\lambda }}\varphi (x_{i})+(1-\lambda )\varphi (x_{i_{0}})=\sum _{i=1}^{n+1}\lambda _{i}\varphi \left(x_{i}\right)}
.
Důsledkem tedy je:
φ
(
∑
i
=
1
n
+
1
λ
i
x
i
)
≤
∑
i
=
1
n
+
1
λ
i
φ
(
x
i
)
{\displaystyle \varphi \left(\sum _{i=1}^{n+1}\lambda _{i}x_{i}\right)\leq \sum _{i=1}^{n+1}\lambda _{i}\varphi \left(x_{i}\right)}
, což je dokazovaná nerovnost.