Teorema Hahn-Banach

În matematică și mai ales în analiză și geometrie , teorema Hahn-Banach , datorată celor doi matematicieni Hans Hahn și Stefan Banach , este o teoremă a existenței extensiilor formelor liniare care îndeplinesc anumite condiții.

Permițând dovada abstractă a existenței multor funcții continue, este un instrument fundamental de analiză funcțională .

Prin interpretarea sa geometrică în ceea ce privește hiperplanurile care evită un convex fix, joacă, de asemenea, un rol primordial în studiul geometriei convexelor și dincolo de acesta în analiza convexă .

Forma analitică și forma geometrică

Afirmațiile numite „Teorema Hahn-Banach” din literatura științifică sunt numeroase, diferă unele de altele uneori prin detalii simple și alteori semnificativ. Cu toate acestea, acestea sunt clar împărțite în două clase: unele garantează posibilitatea de a extinde o formă liniară , sub anumite cerințe de creștere (formele „analitice” ale teoremei); alții asigură că se pot separa două seturi convexe printr-un hiperplan afin (formele „geometrice” ale teoremei).

Să începem cu un exemplu de enunț pentru fiecare dintre aceste două categorii.

O afirmație a formei analitice a teoremei

Teorema - Fie $V$ un spațiu vectorial real și $p$ o funcție convexă a lui $V$ în . $\ mathbb {R}$

Fie $G$ un subspațiu vectorial al lui $V$ și $f$ o formă liniară pe $G$ care îndeplinește în orice punct $x$ al $G$ condiția limită superioară . $f (x) \ leq p (x)$

Apoi , există o extensie liniară $g$ de $f$ pe $V$ chiar și în condițiile în orice punct $x$ din $V$ . $g (x) \ leq p (x)$

O afirmație a formei geometrice a teoremei

Teorema - Într - un spațiu vectorial topologic $E$ , sunt $C$ o convex deschis nevid și $L$ o subspațiul afin , disjuncte de la $C$ .

Există apoi un hiperplan afin care conține $L$ și, prin urmare , disjunct de la $C$ este închis.

Forma analitică a teoremei se datorează faptului că Banach (1932) generalizează un rezultat al lui Hahn care este interesat din 1920 de spațiile vectoriale normalizate. Există o generalizare a teoremei Hahn-Banach la spații vectoriale pe câmpul complexelor datorită lui H. Frederic Bohnenblust și Andrew F. Sobczyk (1938). Dificultățile generalizării teoremei Hahn-Banach apar chiar și pentru spațiile vectoriale cu dimensiuni finite.

Relațiile dintre cele două afirmații și dovada formei „geometrice”

Forma geometrică a teoremei - din care putem deduce apoi o succesiune de diferite variante legate de separarea convexelor - este retranscrierea formei analitice pentru cazul particular în care funcția convexă care intervine este gabaritul unui convex deschis spațiul unui spațiu standardizat. Acesta este și cazul celor mai simple și fundamentale utilizări ale teoremei în analiza funcțională pe care le putem citi dintr-o versiune sau alta în funcție de gusturile noastre (vom vedea un exemplu mai jos).

Să aruncăm o privire mai atentă asupra modului în care forma geometrică este dedusă din forma analitică:

Demonstrarea formei geometrice din forma analitică

Chiar dacă , înainte de o traducere, se presupune că originea este în $C$ . Prin urmare, deoarece $L$ nu îndeplinește $C$ , este, prin urmare, un subspatiu afin care evită originea.

Notă $p$ dipstick convex $C$ . Este subliniar și, prin urmare, convex; prin definiție un ecartament, este clar că pentru toți $x$ în $C$ , . Deoarece am presupus că $C este$ deschis, putem merge puțin mai departe: pe de o parte $C$ este un vecinătate de 0 și orice jumătate de linie deschisă rezultată din 0 conține, prin urmare, puncte de $C$ , din care deducem că $p$ nu ia valoarea ; pe de altă parte, putem îmbunătăți inegalitatea largă și putem specifica cu ușurință că punctele lui $C$ sunt caracterizate prin inegalitatea strictă $p$ $($ $x$ $) <1$ . Atât de mult pentru funcția subliniară. $p (x) \ leq 1$ $+ \ infty$ $p (x) \ leq 1$

Notă $G$ subspațiul vectorial generat de $L$ . Deoarece , subvariația afină $L$ are codimensiunea 1 în $G$ și există o singură (și o singură) formă liniară $f$ pe $G$ astfel încât $L$ este partea lui $G$ cu ecuația $f$ $($ $x$ $) = 1$ . Atât de mult ca forma liniară să fie extinsă. $0 \ not \ în L$

În cele din urmă, pentru $x$ în $L$ , (din moment ce) în timp ce $f$ $($ $x$ $) = 1$ . Condiția este verificată pe $L$ . Jucând pe omogenitatea pozitivă a lui $f$ și $p$ , îi extindem domeniul de validitate la un spațiu strict jumătate al lui $G$ ; pe cealaltă jumătate de spațiu $f$ ia valori negative sau zero, în timp ce, ca peste tot, $p$ are valori pozitive sau zero. Inegalitatea este valabil peste tot în $G$ . $1 \ leq p (x)$ $x \ not \ în C$ $f (x) \ leq p (x)$ $f (x) \ leq p (x)$

Toate ipotezele așa-numitei versiuni „analitice” a teoremei sunt în vigoare. Deci, să o aplicăm. Ne oferă o nouă formă liniară încă notată $f$ , de această dată definită peste $E$ în ansamblu. Nota $H$ afină ecuatia hiperplan $f ( x ) = 1$ : prin construcție, este un hiperplan care conține $L$ .

Fie acum un punct $x$ al lui $C$ : pentru acest punct, (deoarece $f a$ fost produs de forma analitică a lui Hahn-Banach) și $p$ $($ $x$ $) <1$ (deoarece suntem în $C$ deschis convex ). Deci , și $x$ nu este în $H$ . Am verificat că $C$ și $H$ nu se întâlnesc. $f (x) \ leq p (x)$ $f (x) \ neq 1$

În cele din urmă, hiperplanele unui spațiu vector topologic sunt neapărat închise sau dense . Cu toate acestea, $H$ nu este dens deoarece nu îndeplinește vecinătatea $C$ de 0. Prin urmare, este închis.

Ne-ar putea surprinde faptul că forma geometrică implică o topologie în timp ce forma analitică privește un spațiu vectorial fără structură suplimentară. De fapt, este destul de posibil să se afirme o formă geometrică în orice spațiu vectorial: va fi necesar să presupunem că orice traducere a convexului $C$ care conține originea este absorbantă , nereușind să poată da un sens „deschisului”; desigur, nu mai avem complementul pe caracterul închis al hiperplanului obținut. Demonstrația este aceeași.

Dovada formei „analitice”

Două tipuri de idei foarte distincte trebuie puse cap la cap pentru a ajunge la o dovadă în cadrul generalității în care a fost enunțată teorema. Inițial, câteva calcule simple sunt folosite pentru a justifica extinderea formei liniare $f$ în cazul particular în care $G$ este codimensiune 1 în $V$ . Odată ce acest pas a fost făcut, avem deja teorema cu dimensiuni finite (este suficient să creștem pas cu pas subspaiul în care am reușit să extindem $f$ , cu o dimensiune la fiecare pas și până la atingerea dimensiunii lui $V$ ). Pe de altă parte, pentru utilizările în dimensiune infinită, este necesar să se adapteze această metodă foarte simplă de avans metodic și să se numească unele tehnici destul de standardizate ale teoriei mulțimilor : astfel se realizează o recurență transfinită , cel mai adesea scrisă sub forma o chemare la teoria seturilor.Lema lui Zorn .

Demonstrație

Prima parte: câștigați dimensiunea

În primul rând, vom extinde forma liniară $f$ la un spațiu mai mare decât $G$ câștigând o dimensiune. Să reparăm un element $v$ al lui $V \ G$ (dacă nu există nici unul, $G = V$ și am terminat înainte de a începe chiar).

O prelungire liniară a lui $f$ la subspațiul vector este o aplicație a formei: $G \ oplus \ mathbb {R} v$

\ forall x \ in G \ quad \ forall \ lambda \ in \ mathbb {R} \ quad f (x + \ lambda v): = f (x) + \ lambda \ alpha

unde $α$ este un real arbitrar.

O astfel de prelungire $f$ este delimitată de $p$ nu numai pe $G,$ ci dacă și numai dacă acest $α$ real este ales în așa fel încât: $G \ oplus \ mathbb {R} v$

\ forall x \ in G \ quad \ forall \ lambda \ neq 0 \ quad f (x) + \ lambda \ alpha \ leq p (x + \ lambda v).

Prin setarea $s = λ$ dacă $λ> 0$ și $s = -λ$ dacă $λ <0$ , condiția de pe $α$ este deci scrisă:

\ forall x \ in G \ quad \ forall s> 0 \ quad f (x) + s \ alpha \ leq p (x + sv) {\ text {and}} f (x) -s \ alpha \ leq p ( x-sv),

care este egal cu:

\ forall x \ in G \ quad \ forall s> 0 \ quad a_ {x, s} \ leq \ alpha \ leq b_ {x, s} {\ text {with}} a_ {x, s}: = {f (x) -p (x-sv) \ over s} {\ text {și}} b_ {x, s}: = {p (x + sv) -f (x) \ over s}.

Condiția existenței unui astfel de $α$ este deci:

\ sup _ {x \ in G, s> 0} a_ {x, s} \ leq \ inf _ {x \ in G, s> 0} b_ {x, s}

\ forall x, y \ in G \ quad \ forall s, t> 0 \ quad a_ {x, s} \ leq b_ {y, t}.

Această condiție este bine realizată, conform convexității lui $p$ , creșterii lui $f$ pe $G$ și liniarității sale:

{f (x) -p (x-sv) \ over s} \ leq {p (y + tv) -f (y) \ over t}

deoarece

tf (x) + sf (y) \ leq tp (x-sv) + sp (y + tv)

deoarece

{\ frac {tp (x-sv) + sp (y + tv)} {s + t}} \ geq p \ left ({\ frac {t (x-sv) + s (y + tv)} {s + t}} \ right) = p \ left ({\ frac {tx + sy} {s + t}} \ right) \ geq f \ left ({\ frac {tx + sy} {s + t}} \ dreapta) = {\ frac {tf (x) + sf (y)} {s + t}}.

A doua parte: executarea unei recidive transfinite

Raționând pas cu pas, vedem că putem extinde $f$ la spații din ce în ce mai mari. Dacă $G$ are codimensiune finită în $V$ , atunci procesul astfel definit se oprește. În caz contrar, folosim axioma de alegere .

Pentru aceasta, luăm în considerare setul de cupluri $( M , g )$ în care $M$ este un subspațiu vectorial al lui $V$ conținând $G$ și $g$ este o formă liniară pe $M$ care se extinde $f$ (respectând constrângerea creșterii cu $p$ ) și este parțial ordonată de:

(M_ {1}, g_ {1}) \ leq (M_ {2}, g_ {2}) \ Longleftrightarrow M_ {1} \ subset M_ {2}

și

\ forall x \ în M_ {1}, g_ {1} (x) = g_ {2} (x).

Setul de cupluri este inductiv . Într-adevăr, este non-gol (perechea $( G , f )$ este cel mai mic element al său) și dacă este un șir ne-gol, stabilim: $(M_ {i}, g_ {i}) _ {i \ în I}$

M = \ bigcup _ {i \ in I} M_ {i}.

M este un subspatiu vectorial. (În general, o uniune de spații vectoriale nu este un spațiu vectorial, pe de altă parte, aici este pentru că familia lui este neocupată și total ordonată). $Mijloc}$

Definim forma liniară $g$ pe spațiul $M$ prin:

g (x) = g_ {i} (x)

dacă

x \ în M_ {i}.

Putem verifica cu ușurință dacă această definiție a lui $g$ este corectă. $( M , g )$ este apoi o margine superioară a lanțului . Se aplică lema lui Zorn și putem găsi apoi un subspatiu $N$ maxim pe care se extinde $f$ . $(M_ {i}, g_ {i}) _ {i \ în I}$

Acum , dacă $N$ nu este egal cu $V$ , apoi prima parte arată dovada că putem extinde $f$ (definite pe $N$ ) într - un spațiu strict mai mare decât $N$ , care este în contradicție cu maximalitate de $N$ .

Un exemplu de aplicare în analiza funcțională

Următorul corolar ilustrează modul în care teorema Hahn-Banach poate produce foarte ușor rezultate esențiale ale analizei funcționale.

Corolarul - Fie $E$ un spațiu normat $G$ un subspațiu al $E$ și $f$ o formă liniară continuă pe $G$ . Putem apoi extinde $f$ într-o formă liniară continuă peste $E$ , cu aceeași normă ca $f$ .

Demonstrație

Notăm și aplicăm teorema funcției convexe . $c = \ | f \ |$ $p (x) = c \ | x \ |$

Este inutil de lung, dar instructiv pentru a rezolva întrebarea folosind forma geometrică a teoremei lui Hahn-Banach: în loc să ne gândim la funcția convexă $p$ , ne putem gândi și la convexa deschisă a cărei este ecartament, și anume centrul deschis al bilei și raza . Dacă vrem să pornim pe această cale, trebuie să introducem subspaiul afin $L$ , set de puncte x ale lui $G$ astfel încât $f$ $($ $x$ $) = 1$ . Îl extindem într-un hiperplan închis aplicând Hahn-Banach; forma liniară continuă $g$ pentru care acest hiperplan este ansamblul ecuației $g$ $($ $x$ $) = 1$ îndeplinește apoi specificațiile. $VS$ ${\ displaystyle 0}$ $1 C$

Câteva alte versiuni ale teoremei

Se vor găsi mai jos două variante ale „formei analitice” care sunt ușor deduse din cea evidențiată. Primul oferă o variantă a rezultatului pentru spații vectoriale complexe; al doilea specifică că sub o bună ipoteză de simetrie a lui $p$ , în special verificată când $p$ este o semi-normă , se poate obține o creștere a valorii absolute (sau a modulului în cazul complex) a formei liniare prelungite.

Teorema - Fie $V$ un spațiu vectorial pe și $p$ o funcție convexă definită pe $V$ , care nu ia valoarea . $\ mathbb {C}$ $+ \ infty$

Fie $G$ un sub spațiu al vectorului $V$ , și $f$ o formă liniară pe $G$ care sunt în orice moment verifică creșterea condiției . $\ mathrm {Re} \, f (x) \ leq p (x)$

Apoi , există o extensie a $f$ într - o formă liniară pe spațiul $V$ în întregime, chiar și în condițiile: la fiecare punct al $V$ . $\ mathrm {Re} f (x) \ leq p (x)$

Teorema - Fie $V$ un spațiu vectorial pe sau și $p$ o funcție convexă definită pe $V$ , care nu ia valoarea . $\ mathbb {R}$ $\ mathbb {C}$ $+ \ infty$

Se presupune în continuare că $p$ are următoarea proprietate simetrie: pentru orice scalar cu și orice vector $x$ din $V$ , . $\ theta$ $| \ theta | = 1$ $p (x) = p (\ theta x)$

Fie $G$ un sub spațiu al vectorului $V$ , și $f$ o formă liniară pe $G$ care sunt în orice moment verifică creșterea condiției . $| f (x) | \ leq p (x)$

Apoi , există o extensie a $f$ într - o formă liniară pe spațiul $V$ în întregime, chiar și în condițiile: la fiecare punct al $V$ . $| f (x) | \ leq p (x)$

Variante ale formei geometrice pot fi găsite în articolul Separarea convexelor .

Rolul axiomei alegerii

După cum am văzut, în teoria axiomatică a lui Zermelo-Fraenkel , lema lui Zorn (echivalentă cu axioma de alegere ) conduce la teorema Hahn-Banach. De fapt, lema ultrafiltrelor , care este o propoziție mai slabă decât axioma de alegere, este suficientă pentru a demonstra teorema Hahn-Banach. Dar, invers, știm din lucrarea lui David Pincus din 1972 că teorema Hahn-Banach nu este suficientă pentru a demonstra lema ultrafiltrelor. Astfel, teorema Hahn-Banach nu este echivalentă cu axioma de alegere din ZF . Trebuie să adăugăm la aceasta că ZF singur nu este suficient în sine pentru a demonstra Hahn-Banach, a cărui dovadă trebuie să se bazeze, așadar, inevitabil pe o variantă sau alta a lemei ultrafiltrelor sau a axiomei de alegere, de exemplu, pe scurt, pe o axiomă cel puțin o consecință a lemei ultrafiltrelor din ZF.

Referințe

(De) Hans Hahn, "Über lineare Gleichungssysteme in linearen Räumen", în Journal für die Reine und angewandte Mathematik 157 (1927), p. 214-229 .
Stefan Banach, „Despre funcționalități liniare”, în Studia Mathematica 1 (1929), p. 211-216 .
Afirmația analitică este teorema III-5 (în) Mr. Reed (în) și B. Simon , Analiza funcțională , San Diego, Academic Press ,1980( ISBN 978-0-12585050-6 ) , p. 75, secțiunea III.3. Forma geometrică este Teorema 1, p. II-39 în spații vectoriale topologice de N. Bourbaki , Masson, 1981 ( ISBN 2225684103 ) , unde apare și remarca care urmează afirmației.
Teoria operațiilor liniare , Varșovia.
(în) HF Bohnenblust și A. Sobczyk, „ Extensiile funcționalității sunt spații liniare complexe ” , Bull. Amar. Matematica. Soc. , vol. 44,1938, p. 91-93 ( citește online ).
Exemplul dat aici este corolarul 1-2 în Haïm Brezis , Analiza funcțională: teorie și aplicații [ detaliul edițiilor ], p. 3 .
Aceste două versiuni sunt preluate dintr-un curs susținut de Gabriel Nagy la Universitatea din Kansas , ale cărui note sunt disponibile online .
Toate aceste informații sunt disponibile (în) Paul Howard și Jean Rubin , Consequences of the Axiom of Choice , Providence (RI), AMS , al. „Sondaje și monografii matematice” ( nr . 59)1998, 432 p. ( ISBN 0-8218-0977-6 , citit online ), care se referă în special la articolele lui D. Pincus, „Independența teoremei idealului principal față de teorema Hahn-Banach”, Bull. Amar. Matematica. Soc. , zbor. 78, 1972, p. 203-248 și „Puterea teoremei Hahn-Banach”, în Proceedings of the Victoria Symposium on Nonstandard Analysis , col. „Note de curs în matematică”, vol. 369, Springer, Heidelberg, 1973. Pincus oferă două modele în care Hahn-Banach este adevărat în timp ce unele forme ale axiomei de alegere (lema ultrafiltrelor, axioma de alegere numărabilă) nu sunt, una construită pentru mâna a doua, cealaltă fiind o model deja cunoscut construit de Azriel Lévy în 1962 în alte scopuri în care dovedește că Hahn-Banach este verificat. El demonstrează, de asemenea, că există contraexemple în Hahn-Banach în celebrul model Solovay al lui Zermelo-Fraenkel (cel în care orice set de realuri este măsurabil Lebesgue).

Vezi și tu

Articole similare

Bibliografie

( fr ) Lawrence Narici și Edward Beckenstein, „The Hahn - Banach Theorem: The Life and Times”, în Topologie și aplicațiile sale , vol. 77, ediția a II- a , 1997, p. 193-211 , preimprimare .
Walter Rudin , Analiza funcțională [ detaliile edițiilor ]