Nechť X θ je rodina rozdělení pravděpodobnosti na reálné ose indexované reálným parametrem θ vyhovující určitým podmínkám regularity . Pak
lim
h
→
0
D
K
L
(
X
θ
+
h
‖
X
θ
)
h
2
≥
lim
h
→
0
Ψ
θ
∗
(
μ
θ
+
h
)
h
2
,
{\displaystyle \lim _{h\rightarrow 0}{\frac {D_{KL}(X_{\theta +h}\|X_{\theta })}{h^{2}}}\geq \lim _{h\rightarrow 0}{\frac {\Psi _{\theta }^{*}(\mu _{\theta +h})}{h^{2}}},}
kde
Ψ
θ
∗
{\displaystyle \Psi _{\theta }^{*}}
je konvexní transformace kumulantové vytvořující funkce rozdělení
X
θ
{\displaystyle X_{\theta }}
a
μ
θ
+
h
{\displaystyle \mu _{\theta +h}}
je prvním momentem
X
θ
+
h
.
{\displaystyle X_{\theta +h}.}
Postupnými úpravami levé strany dostáváme:
lim
h
→
0
D
K
L
(
X
θ
+
h
‖
X
θ
)
h
2
=
lim
h
→
0
1
h
2
∫
−
∞
∞
log
(
d
X
θ
+
h
d
X
θ
)
d
X
θ
+
h
=
lim
h
→
0
1
h
2
∫
−
∞
∞
log
(
1
−
(
1
−
d
X
θ
+
h
d
X
θ
)
)
d
X
θ
+
h
... funkci
log
(
1
−
t
)
vyjádříme Taylorovým rozvojem
=
lim
h
→
0
1
h
2
∫
−
∞
∞
[
(
1
−
d
X
θ
d
X
θ
+
h
)
+
1
2
(
1
−
d
X
θ
d
X
θ
+
h
)
2
+
o
(
(
1
−
d
X
θ
d
X
θ
+
h
)
2
)
]
d
X
θ
+
h
=
lim
h
→
0
1
h
2
∫
−
∞
∞
[
1
2
(
1
−
d
X
θ
d
X
θ
+
h
)
2
]
d
X
θ
+
h
=
lim
h
→
0
1
h
2
∫
−
∞
∞
[
1
2
(
d
X
θ
+
h
−
d
X
θ
d
X
θ
+
h
)
2
]
d
X
θ
+
h
=
1
2
I
X
(
θ
)
{\displaystyle {\begin{aligned}\lim _{h\to 0}{\frac {D_{KL}(X_{\theta +h}\|X_{\theta })}{h^{2}}}&=\lim _{h\to 0}{\frac {1}{h^{2}}}\int _{-\infty }^{\infty }\log \left({\frac {\mathrm {d} X_{\theta +h}}{\mathrm {d} X_{\theta }}}\right)\mathrm {d} X_{\theta +h}\\&=\lim _{h\to 0}{\frac {1}{h^{2}}}\int _{-\infty }^{\infty }\log \left(1-\left(1-{\frac {\mathrm {d} X_{\theta +h}}{\mathrm {d} X_{\theta }}}\right)\right)\mathrm {d} X_{\theta +h}{\text{... funkci }}\log(1-t){\text{ vyjádříme Taylorovým rozvojem }}\\&=\lim _{h\to 0}{\frac {1}{h^{2}}}\int _{-\infty }^{\infty }\left[\left(1-{\frac {\mathrm {d} X_{\theta }}{\mathrm {d} X_{\theta +h}}}\right)+{\frac {1}{2}}\left(1-{\frac {\mathrm {d} X_{\theta }}{\mathrm {d} X_{\theta +h}}}\right)^{2}+o\left(\left(1-{\frac {\mathrm {d} X_{\theta }}{\mathrm {d} X_{\theta +h}}}\right)^{2}\right)\right]\mathrm {d} X_{\theta +h}\\&=\lim _{h\to 0}{\frac {1}{h^{2}}}\int _{-\infty }^{\infty }\left[{\frac {1}{2}}\left(1-{\frac {\mathrm {d} X_{\theta }}{\mathrm {d} X_{\theta +h}}}\right)^{2}\right]\mathrm {d} X_{\theta +h}\\&=\lim _{h\to 0}{\frac {1}{h^{2}}}\int _{-\infty }^{\infty }\left[{\frac {1}{2}}\left({\frac {\mathrm {d} X_{\theta +h}-\mathrm {d} X_{\theta }}{\mathrm {d} X_{\theta +h}}}\right)^{2}\right]\mathrm {d} X_{\theta +h}\\&={\frac {1}{2}}{\mathcal {I}}_{X}(\theta )\end{aligned}}}
což je polovina Fisherovy informace parametru θ.
Pravou stranu nerovnosti lze upravit takto:
lim
h
→
0
Ψ
θ
∗
(
μ
θ
+
h
)
h
2
=
lim
h
→
0
1
h
2
sup
t
{
μ
θ
+
h
t
−
Ψ
θ
(
t
)
}
.
{\displaystyle \lim _{h\rightarrow 0}{\frac {\Psi _{\theta }^{*}(\mu _{\theta +h})}{h^{2}}}=\lim _{h\rightarrow 0}{\frac {1}{h^{2}}}{\sup _{t}\{\mu _{\theta +h}t-\Psi _{\theta }(t)\}}.}
Tohoto suprema je dosaženo pro t =τ, kde první derivace kumulantové vytvořující funkce je
Ψ
θ
′
(
τ
)
=
μ
θ
+
h
,
{\displaystyle \Psi '_{\theta }(\tau )=\mu _{\theta +h},}
přičemž
Ψ
θ
′
(
0
)
=
μ
θ
,
{\displaystyle \Psi '_{\theta }(0)=\mu _{\theta },}
, takže
Ψ
θ
″
(
0
)
=
d
μ
θ
d
θ
lim
h
→
0
h
τ
.
{\displaystyle \Psi ''_{\theta }(0)={\frac {d\mu _{\theta }}{d\theta }}\lim _{h\rightarrow 0}{\frac {h}{\tau }}.}
Navíc
lim
h
→
0
Ψ
θ
∗
(
μ
θ
+
h
)
h
2
=
1
2
Ψ
θ
″
(
0
)
(
d
μ
θ
d
θ
)
2
=
1
2
V
a
r
(
X
θ
)
(
d
μ
θ
d
θ
)
2
.
{\displaystyle \lim _{h\rightarrow 0}{\frac {\Psi _{\theta }^{*}(\mu _{\theta +h})}{h^{2}}}={\frac {1}{2\Psi ''_{\theta }(0)}}\left({\frac {d\mu _{\theta }}{d\theta }}\right)^{2}={\frac {1}{2\mathrm {Var} (X_{\theta })}}\left({\frac {d\mu _{\theta }}{d\theta }}\right)^{2}.}
Máme:
1
2
I
X
(
θ
)
≥
1
2
V
a
r
(
X
θ
)
(
d
μ
θ
d
θ
)
2
,
{\displaystyle {\frac {1}{2}}{\mathcal {I}}_{X}(\theta )\geq {\frac {1}{2\mathrm {Var} (X_{\theta })}}\left({\frac {d\mu _{\theta }}{d\theta }}\right)^{2},}
což lze upravit na
V
a
r
(
X
θ
)
≥
(
d
μ
θ
/
d
θ
)
2
I
X
(
θ
)
.
{\displaystyle \mathrm {Var} (X_{\theta })\geq {\frac {(d\mu _{\theta }/d\theta )^{2}}{{\mathcal {I}}_{X}(\theta )}}.}
V tomto článku byl použit překlad textu z článku Kullback's inequality na anglické Wikipedii.
↑ FUCHS, Aimé; LETTA, Giorgio. L'inégalité de Kullback. Application à la théorie de l'estimation . Svazek 4. Strasbourg: [s.n.], 1970. (Séminaire de probabilités). Dostupné online .