În matematică și mai ales în analiză și geometrie , teorema Hahn-Banach , datorată celor doi matematicieni Hans Hahn și Stefan Banach , este o teoremă a existenței extensiilor formelor liniare care îndeplinesc anumite condiții.
Permițând dovada abstractă a existenței multor funcții continue, este un instrument fundamental de analiză funcțională .
Prin interpretarea sa geometrică în ceea ce privește hiperplanurile care evită un convex fix, joacă, de asemenea, un rol primordial în studiul geometriei convexelor și dincolo de acesta în analiza convexă .
Afirmațiile numite „Teorema Hahn-Banach” din literatura științifică sunt numeroase, diferă unele de altele uneori prin detalii simple și alteori semnificativ. Cu toate acestea, acestea sunt clar împărțite în două clase: unele garantează posibilitatea de a extinde o formă liniară , sub anumite cerințe de creștere (formele „analitice” ale teoremei); alții asigură că se pot separa două seturi convexe printr-un hiperplan afin (formele „geometrice” ale teoremei).
Să începem cu un exemplu de enunț pentru fiecare dintre aceste două categorii.
Teorema - Fie V un spațiu vectorial real și p o funcție convexă a lui V în .
Fie G un subspațiu vectorial al lui V și f o formă liniară pe G care îndeplinește în orice punct x al G condiția limită superioară .
Apoi , există o extensie liniară g de f pe V chiar și în condițiile în orice punct x din V .
Teorema - Într - un spațiu vectorial topologic E , sunt C o convex deschis nevid și L o subspațiul afin , disjuncte de la C .
Există apoi un hiperplan afin care conține L și, prin urmare , disjunct de la C este închis.
Forma analitică a teoremei se datorează faptului că Banach (1932) generalizează un rezultat al lui Hahn care este interesat din 1920 de spațiile vectoriale normalizate. Există o generalizare a teoremei Hahn-Banach la spații vectoriale pe câmpul complexelor datorită lui H. Frederic Bohnenblust și Andrew F. Sobczyk (1938). Dificultățile generalizării teoremei Hahn-Banach apar chiar și pentru spațiile vectoriale cu dimensiuni finite.
Forma geometrică a teoremei - din care putem deduce apoi o succesiune de diferite variante legate de separarea convexelor - este retranscrierea formei analitice pentru cazul particular în care funcția convexă care intervine este gabaritul unui convex deschis spațiul unui spațiu standardizat. Acesta este și cazul celor mai simple și fundamentale utilizări ale teoremei în analiza funcțională pe care le putem citi dintr-o versiune sau alta în funcție de gusturile noastre (vom vedea un exemplu mai jos).
Să aruncăm o privire mai atentă asupra modului în care forma geometrică este dedusă din forma analitică:
Demonstrarea formei geometrice din forma analiticăChiar dacă , înainte de o traducere, se presupune că originea este în C . Prin urmare, deoarece L nu îndeplinește C , este, prin urmare, un subspatiu afin care evită originea.
Notă p dipstick convex C . Este subliniar și, prin urmare, convex; prin definiție un ecartament, este clar că pentru toți x în C , . Deoarece am presupus că C este deschis, putem merge puțin mai departe: pe de o parte C este un vecinătate de 0 și orice jumătate de linie deschisă rezultată din 0 conține, prin urmare, puncte de C , din care deducem că p nu ia valoarea ; pe de altă parte, putem îmbunătăți inegalitatea largă și putem specifica cu ușurință că punctele lui C sunt caracterizate prin inegalitatea strictă p ( x ) <1 . Atât de mult pentru funcția subliniară.
Notă G subspațiul vectorial generat de L . Deoarece , subvariația afină L are codimensiunea 1 în G și există o singură (și o singură) formă liniară f pe G astfel încât L este partea lui G cu ecuația f ( x ) = 1 . Atât de mult ca forma liniară să fie extinsă.
În cele din urmă, pentru x în L , (din moment ce) în timp ce f ( x ) = 1 . Condiția este verificată pe L . Jucând pe omogenitatea pozitivă a lui f și p , îi extindem domeniul de validitate la un spațiu strict jumătate al lui G ; pe cealaltă jumătate de spațiu f ia valori negative sau zero, în timp ce, ca peste tot, p are valori pozitive sau zero. Inegalitatea este valabil peste tot în G .
Toate ipotezele așa-numitei versiuni „analitice” a teoremei sunt în vigoare. Deci, să o aplicăm. Ne oferă o nouă formă liniară încă notată f , de această dată definită peste E în ansamblu. Nota H afină ecuatia hiperplan f ( x ) = 1 : prin construcție, este un hiperplan care conține L .
Fie acum un punct x al lui C : pentru acest punct, (deoarece f a fost produs de forma analitică a lui Hahn-Banach) și p ( x ) <1 (deoarece suntem în C deschis convex ). Deci , și x nu este în H . Am verificat că C și H nu se întâlnesc.
În cele din urmă, hiperplanele unui spațiu vector topologic sunt neapărat închise sau dense . Cu toate acestea, H nu este dens deoarece nu îndeplinește vecinătatea C de 0. Prin urmare, este închis.
Ne-ar putea surprinde faptul că forma geometrică implică o topologie în timp ce forma analitică privește un spațiu vectorial fără structură suplimentară. De fapt, este destul de posibil să se afirme o formă geometrică în orice spațiu vectorial: va fi necesar să presupunem că orice traducere a convexului C care conține originea este absorbantă , nereușind să poată da un sens „deschisului”; desigur, nu mai avem complementul pe caracterul închis al hiperplanului obținut. Demonstrația este aceeași.
Două tipuri de idei foarte distincte trebuie puse cap la cap pentru a ajunge la o dovadă în cadrul generalității în care a fost enunțată teorema. Inițial, câteva calcule simple sunt folosite pentru a justifica extinderea formei liniare f în cazul particular în care G este codimensiune 1 în V . Odată ce acest pas a fost făcut, avem deja teorema cu dimensiuni finite (este suficient să creștem pas cu pas subspaiul în care am reușit să extindem f , cu o dimensiune la fiecare pas și până la atingerea dimensiunii lui V ). Pe de altă parte, pentru utilizările în dimensiune infinită, este necesar să se adapteze această metodă foarte simplă de avans metodic și să se numească unele tehnici destul de standardizate ale teoriei mulțimilor : astfel se realizează o recurență transfinită , cel mai adesea scrisă sub forma o chemare la teoria seturilor.Lema lui Zorn .
DemonstrațiePrima parte: câștigați dimensiunea
În primul rând, vom extinde forma liniară f la un spațiu mai mare decât G câștigând o dimensiune. Să reparăm un element v al lui V \ G (dacă nu există nici unul, G = V și am terminat înainte de a începe chiar).
O prelungire liniară a lui f la subspațiul vector este o aplicație a formei:
unde α este un real arbitrar.
O astfel de prelungire f este delimitată de p nu numai pe G, ci dacă și numai dacă acest α real este ales în așa fel încât:
Prin setarea s = λ dacă λ> 0 și s = –λ dacă λ <0 , condiția de pe α este deci scrisă:
care este egal cu:
Condiția existenței unui astfel de α este deci:
sau:
Această condiție este bine realizată, conform convexității lui p , creșterii lui f pe G și liniarității sale:
deoarece
deoarece
A doua parte: executarea unei recidive transfinite
Raționând pas cu pas, vedem că putem extinde f la spații din ce în ce mai mari. Dacă G are codimensiune finită în V , atunci procesul astfel definit se oprește. În caz contrar, folosim axioma de alegere .
Pentru aceasta, luăm în considerare setul de cupluri ( M , g ) în care M este un subspațiu vectorial al lui V conținând G și g este o formă liniară pe M care se extinde f (respectând constrângerea creșterii cu p ) și este parțial ordonată de:
șiSetul de cupluri este inductiv . Într-adevăr, este non-gol (perechea ( G , f ) este cel mai mic element al său) și dacă este un șir ne-gol, stabilim:
M este un subspatiu vectorial. (În general, o uniune de spații vectoriale nu este un spațiu vectorial, pe de altă parte, aici este pentru că familia lui este neocupată și total ordonată).
Definim forma liniară g pe spațiul M prin:
dacăPutem verifica cu ușurință dacă această definiție a lui g este corectă. ( M , g ) este apoi o margine superioară a lanțului . Se aplică lema lui Zorn și putem găsi apoi un subspatiu N maxim pe care se extinde f .
Acum , dacă N nu este egal cu V , apoi prima parte arată dovada că putem extinde f (definite pe N ) într - un spațiu strict mai mare decât N , care este în contradicție cu maximalitate de N .
Următorul corolar ilustrează modul în care teorema Hahn-Banach poate produce foarte ușor rezultate esențiale ale analizei funcționale.
Corolarul - Fie E un spațiu normat G un subspațiu al E și f o formă liniară continuă pe G . Putem apoi extinde f într-o formă liniară continuă peste E , cu aceeași normă ca f .
DemonstrațieNotăm și aplicăm teorema funcției convexe .
Este inutil de lung, dar instructiv pentru a rezolva întrebarea folosind forma geometrică a teoremei lui Hahn-Banach: în loc să ne gândim la funcția convexă p , ne putem gândi și la convexa deschisă a cărei este ecartament, și anume centrul deschis al bilei și raza . Dacă vrem să pornim pe această cale, trebuie să introducem subspaiul afin L , set de puncte x ale lui G astfel încât f ( x ) = 1 . Îl extindem într-un hiperplan închis aplicând Hahn-Banach; forma liniară continuă g pentru care acest hiperplan este ansamblul ecuației g ( x ) = 1 îndeplinește apoi specificațiile.
Se vor găsi mai jos două variante ale „formei analitice” care sunt ușor deduse din cea evidențiată. Primul oferă o variantă a rezultatului pentru spații vectoriale complexe; al doilea specifică că sub o bună ipoteză de simetrie a lui p , în special verificată când p este o semi-normă , se poate obține o creștere a valorii absolute (sau a modulului în cazul complex) a formei liniare prelungite.
Teorema - Fie V un spațiu vectorial pe și p o funcție convexă definită pe V , care nu ia valoarea .
Fie G un sub spațiu al vectorului V , și f o formă liniară pe G care sunt în orice moment verifică creșterea condiției .
Apoi , există o extensie a f într - o formă liniară pe spațiul V în întregime, chiar și în condițiile: la fiecare punct al V .
Teorema - Fie V un spațiu vectorial pe sau și p o funcție convexă definită pe V , care nu ia valoarea .
Se presupune în continuare că p are următoarea proprietate simetrie: pentru orice scalar cu și orice vector x din V , .
Fie G un sub spațiu al vectorului V , și f o formă liniară pe G care sunt în orice moment verifică creșterea condiției .
Apoi , există o extensie a f într - o formă liniară pe spațiul V în întregime, chiar și în condițiile: la fiecare punct al V .
Variante ale formei geometrice pot fi găsite în articolul Separarea convexelor .
După cum am văzut, în teoria axiomatică a lui Zermelo-Fraenkel , lema lui Zorn (echivalentă cu axioma de alegere ) conduce la teorema Hahn-Banach. De fapt, lema ultrafiltrelor , care este o propoziție mai slabă decât axioma de alegere, este suficientă pentru a demonstra teorema Hahn-Banach. Dar, invers, știm din lucrarea lui David Pincus din 1972 că teorema Hahn-Banach nu este suficientă pentru a demonstra lema ultrafiltrelor. Astfel, teorema Hahn-Banach nu este echivalentă cu axioma de alegere din ZF . Trebuie să adăugăm la aceasta că ZF singur nu este suficient în sine pentru a demonstra Hahn-Banach, a cărui dovadă trebuie să se bazeze, așadar, inevitabil pe o variantă sau alta a lemei ultrafiltrelor sau a axiomei de alegere, de exemplu, pe scurt, pe o axiomă cel puțin o consecință a lemei ultrafiltrelor din ZF.