Ponieważ
C
{\displaystyle C}
jest niepusta i wypukła jako podprzestrzeń liniowa
H
{\displaystyle H}
oraz zupełna jako domknięta podprzestrzeń przestrzeni zupełnej[a] , to spełnione są założenia twierdzenia o zbiorze wypukłym , które dla dowolnego elementu
h
∈
H
{\displaystyle h\in H}
gwarantuje istnienie jedynego elementu
a
∈
C
,
{\displaystyle a\in C,}
który leży najbliżej
h
.
{\displaystyle h.}
Wówczas:
h
=
c
+
(
h
−
c
)
.
{\displaystyle h=c+(h-c).}
Z kolei poniższy lemat zapewnia, że element
(
h
−
c
)
⊥
C
,
{\displaystyle (h-c)\perp C,}
tj.
h
−
c
∈
C
⊥
,
{\displaystyle h-c\in C^{\perp },}
a co za tym idzie
H
=
C
+
C
⊥
{\displaystyle H=C+C^{\perp }}
(przestrzeń
H
{\displaystyle H}
jest generowana przez
C
,
C
⊥
{\displaystyle C,C^{\perp }}
); ponadto jeżeli
x
∈
C
∩
C
⊥
,
{\displaystyle x\in C\cap C^{\perp },}
to
x
⊥
x
,
{\displaystyle x\perp x,}
co zachodzi tylko dla
x
=
0
{\displaystyle x=0}
[b] , a zatem
C
∩
C
⊥
=
{
0
}
;
{\displaystyle C\cap C^{\perp }=\{0\};}
stąd też
H
=
C
⊕
C
⊥
{\displaystyle H=C\oplus C^{\perp }}
jest ortogonalną sumą prostą podprzestrzeni
C
{\displaystyle C}
i jej dopełnienia ortogonalnego
C
⊥
.
{\displaystyle C^{\perp }.}
Element
c
{\displaystyle c}
nazywany też bywa elementem najlepiej aproksymującym
h
{\displaystyle h}
ew. rzutem
h
{\displaystyle h}
na
C
{\displaystyle C}
i oznaczany bywa
P
C
(
h
)
{\displaystyle P_{C}(h)}
ew.
Π
C
(
h
)
.
{\displaystyle \Pi _{C}(h).}
Lemat
Niech
X
{\displaystyle X}
będzie przestrzenią unitarną z normą
‖
⋅
‖
{\displaystyle \|\cdot \|}
indukowaną z iloczynu skalarnego
⟨
⋅
,
⋅
⟩
,
{\displaystyle \langle \cdot ,\cdot \rangle ,}
zaś
Y
{\displaystyle Y}
będzie zupełną podprzestrzenią liniową w
X
.
{\displaystyle X.}
Wówczas
a
{\displaystyle a}
jest rzutem
x
{\displaystyle x}
na
Y
{\displaystyle Y}
wtedy i tylko wtedy, gdy
a
∈
Y
{\displaystyle a\in Y}
oraz
(
x
−
a
)
⊥
Y
{\displaystyle (x-a)\perp Y}
[c] .
↑ Niech
(
x
n
)
{\displaystyle (x_{n})}
będzie ciągiem w
C
,
{\displaystyle C,}
wtedy z definicji
x
n
→
x
∈
H
,
{\displaystyle x_{n}\to x\in H,}
skąd
x
∈
c
l
C
,
{\displaystyle x\in \mathrm {cl} \;C,}
z domkniętości
c
l
C
=
C
,
{\displaystyle \mathrm {cl} \;C=C,}
zatem
C
{\displaystyle C}
jest zupełna.
↑ Z definicji
C
⊥
{\displaystyle C^{\bot }}
jest zbiorem tych elementów
x
∈
H
,
{\displaystyle x\in H,}
które są ortogonalne do każdego elementu zbioru
C
;
{\displaystyle C;}
jeżeli
x
∈
C
{\displaystyle x\in C}
należy również do
C
⊥
,
{\displaystyle C^{\perp },}
to znaczy, że jest do siebie ortogonalny, tj.
x
⊥
x
.
{\displaystyle x\perp x.}
Warunek ten można zapisać w postaci
⟨
x
,
x
⟩
=
0
,
{\displaystyle \langle x,x\rangle =0,}
gdzie
⟨
⋅
,
⋅
⟩
{\displaystyle \langle \cdot ,\cdot \rangle }
oznacza iloczyn skalarny przestrzeni
H
,
{\displaystyle H,}
co z jego niezdegenerowania ma miejsce wyłącznie dla
x
=
0.
{\displaystyle x=0.}
↑ Konieczność . Niech
a
{\displaystyle a}
będzie rzutem
x
{\displaystyle x}
na
Y
{\displaystyle Y}
i niech
b
∈
Y
∖
{
0
}
=
Y
0
.
{\displaystyle b\in Y\smallsetminus \{0\}=Y_{0}.}
Niech teraz
λ
=
⟨
x
−
a
,
b
‖
b
‖
⟩
{\displaystyle \lambda =\langle x-a,{\frac {b}{\|b\|}}\rangle }
oraz
c
=
a
+
λ
b
‖
b
‖
∈
Y
.
{\displaystyle c=a+\lambda {\frac {b}{\|b\|}}\in Y.}
Skoro
a
{\displaystyle a}
jest najlepszym przybliżeniem
x
{\displaystyle x}
należącym do
Y
,
{\displaystyle Y,}
to
‖
x
−
a
‖
2
⩽
‖
x
−
c
‖
2
=
⟨
x
−
c
,
x
−
c
⟩
=
⟨
x
−
a
−
λ
b
‖
b
‖
,
x
−
a
−
λ
b
‖
b
‖
⟩
=
{\displaystyle \|x-a\|^{2}\leqslant \|x-c\|^{2}=\langle x-c,x-c\rangle =\langle x-a-\lambda {\frac {b}{\|b\|}},x-a-\lambda {\frac {b}{\|b\|}}\rangle =}
=
‖
x
−
a
‖
2
−
2
ℜ
(
λ
¯
⋅
⟨
x
−
a
,
b
‖
b
‖
⟩
)
+
|
λ
|
2
=
‖
x
−
a
‖
2
−
2
ℜ
(
λ
¯
⋅
λ
⟩
)
+
|
λ
|
2
=
{\displaystyle =\|x-a\|^{2}-2\Re \left({\overline {\lambda }}\cdot \langle x-a,{\frac {b}{\|b\|}}\rangle \right)+|\lambda |^{2}=\|x-a\|^{2}-2\Re \left({\overline {\lambda }}\cdot \lambda \rangle \right)+|\lambda |^{2}=}
=
‖
x
−
a
‖
2
−
2
|
λ
|
2
+
|
λ
|
2
=
‖
x
−
a
‖
2
−
‖
λ
‖
2
,
{\displaystyle =\|x-a\|^{2}-2|\lambda |^{2}+|\lambda |^{2}=\|x-a\|^{2}-\|\lambda \|^{2},}
gdzie
ℜ
z
{\displaystyle \Re \;z}
oznacza część rzeczywistą liczby zespolonej
z
,
{\displaystyle z,}
zaś
z
¯
{\displaystyle {\overline {z}}}
to jej sprzężenie zespolone .
Otrzymana nierówność oznacza, iż
λ
=
0
,
{\displaystyle \lambda =0,}
a stąd także
0
=
λ
⋅
‖
b
‖
=
⟨
x
−
a
,
b
⟩
.
{\displaystyle 0=\lambda \cdot \|b\|=\langle x-a,b\rangle .}
Tzn.
(
x
−
a
)
⊥
b
.
{\displaystyle (x-a)\perp b.}
Dostateczność . Niech
a
∈
Y
{\displaystyle a\in Y}
oraz
(
x
−
a
)
⊥
Y
.
{\displaystyle (x-a)\perp Y.}
Niech dalej
b
∈
Y
.
{\displaystyle b\in Y.}
Ponieważ
Y
{\displaystyle Y}
jest podprzestrzenią liniową, to
a
−
b
∈
Y
,
{\displaystyle a-b\in Y,}
skąd
(
x
−
a
)
⊥
(
a
−
b
)
.
{\displaystyle (x-a)\perp (a-b).}
Wobec tego:
‖
x
−
b
‖
2
=
‖
(
x
−
a
)
+
(
a
−
b
)
‖
2
=
⟨
(
x
−
a
)
+
(
a
−
b
)
,
(
x
−
a
)
+
(
a
−
b
)
⟩
=
{\displaystyle \|x-b\|^{2}={\big \|}(x-a)+(a-b){\big \|}^{2}=\langle (x-a)+(a-b),(x-a)+(a-b)\rangle =}
=
‖
x
−
a
‖
2
+
‖
a
−
b
‖
2
−
2
⋅
ℜ
⟨
(
x
−
a
)
,
(
a
−
b
)
⟩
=
‖
x
−
a
‖
2
+
‖
a
−
b
‖
2
⩾
‖
x
−
a
‖
2
,
{\displaystyle =\|x-a\|^{2}+\|a-b\|^{2}-2\cdot \Re \langle (x-a),(a-b)\rangle =\|x-a\|^{2}+\|a-b\|^{2}\geqslant \|x-a\|^{2},}
co oznacza, że
a
{\displaystyle a}
jest najbliżej położonym punktem przestrzeni
Y
{\displaystyle Y}
punktu
x
.
{\displaystyle x.}