Báze (lineární algebra)

(přesměrováno z Ortogonální báze)

Práci s vektorovými prostory i samotnými vektory lze velmi ulehčit zavedením pojmu báze vektorového prostoru (krátce jen báze, angl. basis, pl. bases). Jedná se o množinu jistým způsobem výjimečných vektorů z daného vektorového prostoru, pomocí níž jsme schopni vyjádřit libovolný vektor tohoto prostoru. Pojem báze úzce souvisí s pojmem dimenze vektorového prostoru. Zatímco dimenze nám říká, kolik parametrů potřebujeme na popsání libovolného vektoru v daném prostoru, báze je množina vektorů, ze kterých jsme schopni tento vektor sestrojit, známe-li tyto parametry.

Motivace

editovat
 
Obr. 1.: Vektor   v rovině s vyznačenou souřadnou soustavou. Číslo   představuje x-ovou souřadnici vektoru   a číslo   jeho y-ovou souřadnici.
 
Obr. 2.: Vektor   z obrázku výše. Tento vektor lze vyjádřit jako součet vektoru   a vektoru  , z nichž první míří ve směru osy x a druhý míří ve směru osy y.
 
Obr. 3.: Vektor   vzniklý pootočením vektoru  . Složky vektoru   do směrů x a y mají jinou velikost, než složky pro vektor  . V tomto případě konkrétně   a  .

Nejsnáze je pojem báze vektorového prostoru nahlédnutelný v případě prostoru šipek, fyzikálních vektorů. Pro jednoduchost uvažujme množinu všech šipek v rovině. Tato množina se dá vyjádřit jako vektorový prostor  , kde součtu dvou vektorů odpovídá složení dvou šipek, více viz oddíl Fyzikální vektory v článku Vektorový prostor či oddíl Geometrická interpretace v článku Lineární kombinace.

Mějme pro začátek jednu (nenulovou) šipku v rovině, kterou si označme jako  . Aniž bychom cokoli věděli o vektorových prostorech, můžeme se na celou věc dívat čistě geometricky a v rovině zakreslit dvě přímky, které jsou na sebe kolmé a které procházejí bodem, z něhož vychází naše šipka  . Těmto dvěma přímkám budeme říkat osy, jejich průniku počátek a celému celku dvou přímek pak souřadnicová soustava. Pro přehlednost si přitom jednu z os označme písmenem x a druhou písmenem y. Souřadnicová soustava nám umožňuje zavést jednoduchý způsob, jak naši šipku popsat pomocí dvou čísel. Konkrétně, nejprve si vykresleme kolmici na osu x tak, aby protínala konec šipky. Vzdálenost paty této kolmice od počátku soustavy souřadnic pak chápeme jako x-ovou souřadnici šipky, viz Obr. 1. Stejně postupujeme i pro osu y. Obdrželi jsme tak pro naši šipku dvojici čísel, kterým říkáme souřadnice šipky (v dané souřadnicové soustavě). Když si teď do roviny přikreslíme libovolnou další šipku, tak jsme jí stejným způsobem schopni popsat pomocí dvou čísel.

Tento způsob popisu šipek pomocí dvojic čísel je velmi názorný a jednoduchý. Rádi bychom ho proto přesunuli i do oblasti obecných vektorových prostorů. Zde ale nevíme, co znamená vzdálenost paty kolmice od počátku souřadnic, protože na vektorovém prostoru není nic jako vzdálenost definováno. (Nehledě na to, že tam není definována ani přímka, ani průsečík, ani pata kolmice.) Abychom uspěli, tak musíme naši představu souřadnicových os vystavět s pomocí pojmů, které jsou nám v obecném vektorovém prostoru k dispozici. Vraťme se k našemu příkladu šipek v rovině. Dosud jsme zde měli zavedeny dvě souřadnicové osy a každý vektor jsme popsali pomocí dvou souřadnic, viz Obr. 1. Víme navíc, že složením dvou šipek dostaneme jejich výslednici, kteroužto přitom můžeme chápat jako jejich součet. (Souřadnice výslednice totiž obdržíme tak, že sečteme souřadnice původních dvou šipek, více viz oddíl Fyzikální vektory v článku Vektorový prostor.) Vektor   z příkladu výše tedy můžeme chápat i jako součet dvou jistých vektorů,   a  . Vektor   přitom leží na ose x a podobně vektor   leží na ose y, viz Obr. 2. Platí tedy rovnost

 

Pokud nyní vektor   dvakrát prodloužíme, obdržíme vektor  , jenž lze vyjádřit jako součet vektorů   a  . Analogicky bychom postupovali i pro libovolný násobek vektoru   dostávajíce

 

kde  . Když bychom nyní vektor   pootočili a obdrželi tak vektor  , jak je znázorněno na Obr. 3, tak se odpovídajícím způsobem změní i oba vektory   a   do tvaru   a  , tedy

 

Je tak vidět, že ať vektor   zkrátíme, prodloužíme či natočíme, tak lze výsledný vektor vždy vyjádřit pomocí původních vektorů   a   jako jejich lineární kombinaci. V rovině jsme ale schopni jakýkoliv vektor vyjádřit pomocí vhodného natočení či prodloužení/zkrácení vektoru  . Dostáváme tak, že libovolný vektor   v rovině lze popsat jako jistou lineární kombinaci vektorů   a   způsobem

 

pro jisté koeficienty  .

V tuto chvíli tedy můžeme nadobro opustit náš pomocný pojem souřadnicových os, souřadnicové soustavy a souřadnic vektoru v této soustavě. Místo toho si hned od počátku můžeme v rovině zavést dva pevně dané vektory, které si označíme   a  . Jak jsme právě viděli, pomocí těchto vektorů jsme schopni vyjádřit libovolný vektor roviny jako jejich lineární kombinaci. Koeficienty této lineární kombinace přitom nazveme našimi novými souřadnicemi. Souřadnicemi, kterými lze popisovat vektory v obecném vektorovém prostoru, protože k jejich zavedení nebylo potřeba nic kromě pojmu lineární kombinace. Tyto souřadnice neudávají vzdálenost od počátku soustavy souřadnic jako ve výše zmíněném případě, ale jedná se o čísla, kterými když vynásobíme naše dva pevně zadané vektory a tyto pak sečteme, tak dostaneme žádaný vektor. Tyto pevně zadané vektory, zde tedy   a  , pak nazýváme báze prostoru šipek v rovině.

Jak vidno, vektory   a   můžeme zvolit vícero možnými způsoby, a přitom lze jimi stále popsat libovolný vektor v rovině. Jedná se o obecnou vlastnost báze – za bázi můžeme zvolit vícero sad vektorů. Zde se ale může vyskytnout obtíž, když vektor   zvolíme tak, že je roven násobku vektoru   a oba tak směřují tímtéž směrem (popřípadě až na znaménko). Není těžké si uvědomit, že v takovémto případě nejsme schopni popsat vektor v rovině, který se od jejich směru odchyluje. Abychom předešli podobným situacím, musíme naložit na definici báze podmínku, že žádný vektor báze nesmí jít vyjádřit pomocí ostatních vektorů báze. Matematicky je tento požadavek vyjádřen slovy, že báze musí být lineárně nezávislá množina vektorů. V obecném vektorovém prostoru bychom také mohli být na pochybách, kolik vektorů vlastně potřebujeme k popisu celého prostoru. Neboli, kolik vektorů tvoří bázi. I v případě vektorů v rovině jsme totiž mohli každý vektor vyjádřit ne jako lineární kombinaci dvou vektorů, ale třeba tří, čtyř, pěti. Požadujeme tedy ještě, abychom do báze nevybírali zbytečně mnoho vektorů. Chceme tedy vybrat jen tolik vektorů, kolik je k popisu vektorového prostoru nezbytně potřeba. Tento požadavek lze vyjádřit opět pomocí lineární nezávislosti. Pokud máme lineárně závislý soubor vektorů, kterými popisujeme vektorový prostor, tak z tohoto souboru můžeme nejméně jeden vektor vyjmout a přitom budeme stále schopni popsat celý prostor. Pokud máme lineárně nezávislý soubor, pak z něho už nelze žádný vektor vyjmout, aniž bychom se neochudili o možnost popisu celého prostoru.

Shrňme si nakonec základní vlastnosti, které musí námi vybrané vektory z vektorového prostoru mít, aby mohli dohromady tvořit bázi. Jak jsme viděli výše, tak chceme, aby šel každý vektor z vektorového prostoru vyjádřit jako lineární kombinaci námi vybraných vektorů. Množina všech lineárních kombinací daných vektorů se přitom nazývá jejich lineární obal. Jinými slovy tedy chceme, aby lineární obal námi vybraných vektorů byl roven celému vektorovému prostoru. Dále ale ještě požadujeme, aby tyto vektory byly lineárně nezávislé. Dospíváme tak k obecné definici báze níže.

Definice

editovat

Báze vektorového prostoru   je taková množina vektorů z  , která je lineárně nezávislá a jejíž lineární obal je roven celému prostoru  . Prvky množiny   pak nazýváme bazickými vektory nebo vektory báze. V symbolech lze definici přepsat jako

 

Tuto definici lze použít v případech, kdy má množina   konečný, ale i nekonečný počet prvků. Pokud je počet jejích prvků nekonečný, tak je nutno mít na paměti, že lineární nezávislost takovéto množiny znamená, že každý konečný soubor vektorů vybraný z   je lineárně nezávislý. Podobně, v definici lineárního obalu jsou vždy uvažovány jen lineární kombinace konečně mnoha vektorů z  . Tímto způsobem je definována tzv. Hamelova báze, viz níže. Existují však zobecnění, viz Schauderova či ortonormální báze níže, kde jsou uvažovány "lineární kombinace nekonečně mnoha vektorů". Pokud se omezíme jen na konečnou množinu  , lze výše uvedenou definici přepsat do podoby:

Báze vektorového prostoru   je takový lineárně nezávislý soubor vektorů  , pro který platí rovnost  . Vektory   pak nazýváme bazické vektory. V symbolech tedy

 

V právě uvedených formulacích nebyla požadována uspořádanost množiny či souboru vektorů, nezáleželo tedy na pořadí jejich prvků, a přesto jsme je nazývali bází. V některých případech je ale výhodné za bázi označovat množinu vektorů, v níž je pořadí těchto vektorů konkrétně zadané. Důležité to je např. pokud chceme sestrojit matici přechodu mezi dvěma bázemi. Pro různá uspořádání těchže vektorů pak dostáváme různé matice.

V definici výše není množina  , popř. soubor vektorů  , určena jednoznačně. V jednom vektorovém prostoru lze tedy nalézt více bází. Lze však dokázat, viz oddíl Vztah dimenze a báze níže, že všechny báze daného vektorového prostoru mají stejný počet prvků. Ač tedy můžeme za bázi zvolit obecně vícero souborů vektorů, dimenze daného vektorového prostoru je dána pevně.

Uvažujme nyní vektorový prostor   (konečné dimenze  ), jehož báze je  . Z definice plyne, viz níže, že lze libovolný vektor   z prostoru   vyjádřit pomocí jednoznačně určených koeficientů   ve tvaru

 

přičemž  , kde   je těleso, nad nímž je vektorový prostor   definován. Obyčejně tedy   nebo  . Koeficientům  , kde  , pak říkáme souřadnice vektoru   v bázi  .

Jak bylo naznačeno v úvodu článku, pojem báze je úzce spojen s pojmem dimenze vektorového prostoru. Tu lze definovat buď nezávisle na definici báze, anebo druhým způsobem jako počet prvků libovolné báze daného vektorového prostoru, viz definice dimenze vektorového prostoru. Vyjděme nyní z prvního způsobu definice dimenze, který nám umožňuje definovat nekonečnou dimenzi prostoru, aniž bychom jakkoli specifikovali jeho bázi. Je vidět, že definice báze, která bere v úvahu jen konečné množiny  , není schopna přiřadit bázi nekonečněrozměrnému vektorovému prostoru. Dosti často si s touto omezenější podobou definice vystačíme, její obecnější formulace výše pak v nekonečněrozměrném případě definuje tzv. Hamelovu bázi.

Kromě dvou právě uvedených formulací se objevují i další definice báze vektorového prostoru, jako Schauderova báze, ortonormální báze či trigonometrická báze, z nichž některé jsou rozebrány níže.

Generátory vektorového prostoru

editovat

S pojmem báze vektorového prostoru souvisí pojem generátoru vektorového prostoru. Mějme vektorový prostor   a dále jeho jistou neprázdnou podmnožinu  . Pak říkáme, že množina   generuje vektorový prostor  , právě když lze každý vektor z prostoru   vyjádřit jako lineární kombinaci vektorů z množiny  . Prvky množiny   pak nazýváme generátory vektorového prostoru  .[pozn. 1] Jinými slovy, množina   generuje vektorový prostor  , právě když je   jejím lineárním obalem. Neboli

 

Oproti bázi zde tedy nepožadujeme lineární nezávislost. Definici báze vektorového prostoru lze pak vyjádřit slovy:

Mějme vektorový prostor  . Pak každou množinu vektorů, která je lineárně nezávislá a generuje prostor  , nazýváme báze vektorového prostoru  .

Je-li vektorů v množině   konečně mnoho, pak lze výše uvedenou definici generátorů přeformulovat takto: Mějme vektorový prostor   a dále jeho jistou neprázdnou podmnožinu   pro jisté přirozené číslo  . Pak říkáme, že množina   generuje vektorový prostor  , právě když

 

Vektory   pak nazýváme generátory vektorového prostoru  . Definice generátorů vektorového prostoru se tak shoduje s definicí generátorů lineárního obalu.

Standardní báze

editovat

V případě nejčastěji užívaných vektorových prostorů se definují jisté báze, který mají velmi jednoduchý tvar a s nimiž se snadno pracuje. Těmto bázím říkáme standardní báze. Nejedná se však o obecný pojem, standardní báze je ve svém konkrétním tvaru zavedena jen pro prostory aritmetických vektorů, posloupností (čísel), (číselných) matic a polynomů. Obecně by se místo číselných těles dala uvažovat tělesa libovolná. Tvary standardních bází pro právě uvedené prostory jsou vypsány v Příkladu 1 níže.

Hamelova báze

editovat

Zaměřme se nyní na definici báze podanou v úvodu sekce, kde za   bereme i nekonečné množiny. Pokud použijeme tuto definici na konečněrozměrný prostor, tak nic nového nezískáme. Opět bychom dospěli ke konečné bázi, jejíž počet prvků by byl roven dimenzi vektorového prostoru. V případě nekonečněrozměrných vektorových prostorů se ale situace liší. Zde bychom bázi o konečně mnoha prvcích nenašli. Připustíme-li však platnost axiomu výběru, lze ukázat, že každý vektorový prostor, tedy i ten nekonečněrozměrný, má bázi (viz oddíl Existence báze níže). U nekonečněrozměrných prostorů této bázi říkáme Hamelova báze. Je pojmenována po německém matematikovi Georgu Hamelovi a občas se lze setkat i s nesprávným označením Hammelova báze. Připomeňme, že v definici lineárního obalu a lineárně nezávislé množiny vždy uvažujeme jen konečné lineární kombinace. V případě konečněrozměrných prostorů se Hamelova báze redukuje na běžnou bázi vektorového prostoru a je tedy přímým zobecněním báze konečněrozměrného vektorového prostoru na nekonečněrozměrný případ.

Jako příklad Hamelovy báze můžeme uvést standardní bázi prostoru posloupností či standardní bázi prostoru polynomů, viz Příklad 1.

Schauderova báze

editovat

Při práci s nekonečněrozměrnými prostory není pojem Hamelovy báze dostačující. Definují se tak jiné báze. Máme-li vektorový prostor vybaven normou, který je navíc v dané normě úplný, můžeme jako nejpřímější zobecnění Hamelovy báze zavést Schauderovu bázi, která je pojmenována po svém tvůrci, polském matematikovi J. Schauderovi. Příkladem úplného vektorového prostoru s normou jsou Hilbertovy či obecněji Banachovy prostory. Občas se přízvisko v kontextu těchto prostorů vynechává a hovoří se pouze o bázi. Schauderova báze je v těchto prostorech definována následovně[1] [2]:

Nechť   je Banachův prostor definovaný nad tělesem  , označme si jeho normu jako  . Pak posloupnost   prvků z   nazveme (Schauderovou) bází tohoto prostoru, jestliže pro každý vektor   existuje právě jedna posloupnost   prvků z   tak, že platí

 

Rovnost výše je přitom chápána ve smyslu

 

Schauderova báze je oproti té Hamelově tedy obecnější v tom, že uvažuje i lineární kombinace "nekonečně" mnoha prvků. Není to však už báze vektorového prostoru (v algebraicekém smyslu). Můžeme říci, že zatímco je Hamelova báze množina, jejíž lineární obal je roven celému vektorovému prostoru, tak Schauderova báze je množina, pro niž uzávěr jejího lineárního obalu je roven celému Banachovu prostoru. V případě konečněrozměrných prostorů se pojem Schauderovy báze redukuje na běžnou definici báze vektorového prostoru.

Ortogonální báze, ortonormální báze

editovat
Podrobnější informace naleznete v článcích Ortogonální báze a Ortonormální báze.

Důležitou roli v prostorech se skalárním součinem, tedy např. v Hilbertových prostorech, hrají báze ortonormální, resp. ortogonální. Na prostorech konečné dimenze je ortogonální báze speciálním případem klasické báze, jejíž prvky navíc splňují vlastnost, že jsou na sebe kolmé. Ortogonální báze konečněrozměrného prostoru se skalárním součinem je tedy množina  , která generuje celý prostor a pro jejíž prvky platí

 

kde závorka značí skalární součin v daném prostoru a  . Ortogonalita vektorů totiž už zajišťuje jejich lineární nezávislost. Častěji užívaná je ale ortonormální báze, která má oproti ortogonální bázi ještě ten požadavek, že mají všechny její prvky jednotkovou velikost. Jinými slovy, ortonormální báze je množina   generující celý prostor, pro jejíž prvky platí

 

kde závorka opět značí skalární součin v daném prostoru,   značí Kroneckerovo delta a  .

V prostorech nekonečněrozměrných se pak ortogonální báze definuje jako ortogonální množina, která je v daném Hilbertově prostoru totální. Podobně, ortonormální báze je taková podmnožina nekonečněrozměrného Hilbertova prostoru, která je ortonormální a totální v tomto prostoru. [3] Ortogonální množina je přitom taková množina nenulových vektorů z Hilbertova prostoru, jejíž každé dva prvky jsou ortogonální. Ortonormální množina je pak taková ortogonální množina, jejíž každý prvek má jednotkovou velikost, tj. pro každý její prvek   platí  . To, že je nějaká množina totální ve své nadmnožině, znamená, že uzávěr jejího lineárního obalu je roven této nadmnožině. Neboli, ortonormální báze   Hilbertova prostoru   je ortonormální podmnožina z   taková, že  , kde pruh nad označením množiny symbolizuje její uzávěr.

Z vlastností ortonormálních bází lze odvodit velmi užitečné vztahy, jako např. Parsevalovu rovnost, Besselovu nerovnost či rozklad vektoru za pomoci Fourierových koeficientů.

Vlastnosti

editovat

Vztah dimenze a báze

editovat

Omezme se v tomto oddíle jen na konečněrozměrné vektorové prostory. Jak bylo předesláno výše, ač lze za bázi volit různé soubory vektorů, počet prvků báze je vždy tentýž, jak vyplývá z následujícího tvrzení.

  • Každé dvě různé báze daného vektorového prostoru mají stejný počet prvků.
Důkaz: Mějme dvě báze   a   téhož vektorového prostoru. Bez újmy na obecnosti nechť  . Protože je   báze, lze s její pomocí vyjádřit všechny vektory  , které tak leží v lineárním obalu  . Použijeme-li nyní Steinitzovy věty o výměně, dospíváme ihned ke sporu.

Na dalších třech tvrzeních si nyní ukažme vztah báze konečněrozměrného vektorového prostoru a jeho dimenze. Předpokládáme přitom, že dimenze vektorového prostoru byla definována nezávisle na jeho bázi, jak je to podáno v oddíle Definice článku Dimenze vektorového prostoru. Dohromady by šla trojice následujících tvrzení shrnout slovy: Každý vektorový prostor konečné dimenze má počet bazických vektorů roven své dimenzi.

  • Nechť je  . Pak ve   existuje n-členná báze.
Důkaz: Z předpokladů ve   existuje n-členný lineárně nezávislý soubor vektorů  . Aby tento soubor splňoval definiční podmínky báze, musíme ještě ukázat, že lze libovolný vektor   z prostoru   vyjádřit jako jistou lineární kombinaci tohoto souboru. Předpokládejme, že existuje vektor  , který takto vyjádřit nelze. Pak ale z definice lineární nezávislosti plyne, že (n+1)-členný soubor   je lineárně nezávislý. To je ale ve sporu s definicí dimenze, která říká, že každý (n+1)-členný soubor je lineárně závislý.
  • Nechť   a nechť ve   existuje n-členná báze. Potom  .
Důkaz: Báze je soubor lineárně nezávislých vektorů generujících vektorový prostor, označme si ji jako  . Z definice dimenze tedy plyne, že  , neboť n je počet prvků báze. Zároveň ale z definice báze a Steinitzovy věty o výměně také vyplývá, že každý (n+1)-členný soubor vektorů   je nutně lineárně závislý. Z definice dimenze tedy dále   a celkově pak  .
  • Nulový vektorový prostor, tj.  , nemá bázi.
Důkaz: Nulový vektorový prostor obsahuje jen nulový vektor a každý soubor obsahující jen nulový vektor je lineárně závislý, viz první tvrzení v oddílu Ostatní článku Lineární nezávislost. Není tak splněn jeden z definičních požadavků báze.

Konstrukce báze

editovat

Opět se omezme na případy konečněrozměrných vektorových prostorů. V případě nekonečné dimenze je situace složitější.

  • Z každého souboru generátorů daného vektorového prostoru lze vybrat jeho bázi. Přesněji: Nechť   je nenulový vektorový prostor tvaru   pro jisté vektory  , kde   značí lineární obal. Potom   a v případě   existují navzájem různé indexy   takové, že   je báze  .
Důkaz: Buď jsou vektory   lineárně nezávislé, a v tom případě tvoří bázi, anebo jsou lineárně závislé. V takovém případě lze z jejich souboru vyjmout jeden vektor, aniž bychom změnili jejich lineární obal, viz druhé tvrzení v oddílu Ostatní článku Lineární obal. Takto vzniklý soubor vektorů buď už je lineárně nezávislý, anebo z něj můžeme opět vyjmout jeden vektor, aniž bychom změnili lineární obal souboru. Takto můžeme pokračovat dál. Určitě se pak zastavíme přinejhorším na souboru obsahujícím jediný nenulový vektor. Nenulový proto, že předpokládáme nenulový vektorový prostor. Jeden proto, že soubor obsahující jediný nenulový vektor je vždy lineárně nezávislý. Vztah   lze dokázat přímo z definice dimenze vektorového prostoru, nebo viz tvrzení o dimenzi lineárního obalu v oddíle Vektorové podprostory článku Dimenze vektorového prostoru. Dokázali jsme tak tvrzení věty.
  • Každý lineárně nezávislý soubor ve vektorovém prostoru lze doplnit na jeho bázi. Přesněji: Nechť   je lineárně nezávislý soubor vektorů z vektorového prostoru   a nechť  . Pak existují vektory   tak, že soubor   je báze prostoru  .
Důkaz: Protože  , najdeme ve   bázi  . Jejím lineárním obalem je celý prostor  , platí tak  , tj. lineární obal vektorů   je podprostorem lineárního obalu vektorů  . Tvrzení věty pak ihned dostáváme užitím Steinitzovy věty o výměně.
  • V konečnědimenzionálním prostoru dimenze n je bází každá množina obsahující n lineárně nezávislých vektorů.
Důkaz: Mějme n lineárně nezávislých vektorů   v prostoru dimenze n. Chceme ukázat, že generují celý vektorový prostor. Kdyby to nebyla pravda, tak by existoval vektor  , který by nešlo vyjádřit jako lineární kombinaci těchto vektorů. Neboli soubor   by byl lineárně nezávislý. Máme tedy lineárně nezávislý soubor délky n+1 v prostoru dimenze n, což je ve sporu s definicí dimenze. S použitím tvrzení dokázaných výše též můžeme říci, že v prostoru dimenze n existuje n-členná báze. Předchozí tvrzení nám navíc říká, že každý lineárně nezávislý soubor lze doplnit na bázi. Dostáváme tak rovnou tvrzení věty.

Závislost na tělese

editovat

Ukažme si na příkladu konečněrozměrných vektorových prostorů rozdíly v hodnotě jejich dimenze, chápeme-li daný vektorový prostor jako množinu definovanou nad rozdílnými tělesy. Přesněji řečeno, vektorový prostor je uspořádaná čtveřice  . Pokud ponecháme množinu   a změníme množinu  , můžeme dostat vektorový prostor odlišné dimenze. Jiná hodnota dimenze se odrazí i na tvaru báze takového vektorového prostoru. Konkrétně si dokažme následující tvrzení.

  • Nechť   je komplexní vektorový prostor o dimenzi  , nechť dále   je jeho báze. Potom soubor   délky 2n je báze prostoru  , tj.  . Symbol   zde přitom značí imaginární jednotku a   označuje množinu   coby vektorový prostor nad tělesem reálných čísel.
Důkaz: Libovolný vektor   z   lze zapsat ve tvaru  , kde  . Tento vztah lze přepsat do podoby  . Pokud nyní za těleso bereme jen reálná čísla, stávají se vektory   lineárně nezávislými na vektorech  , protože imaginární jednotka už není součástí tělesa a výraz   tak už nelze chápat jako násobek vektoru  . Soubor   je tedy lineárně nezávislý a ze vzorce výše i generuje celý prostor. Je to tedy báze prostoru   a dimenze tohoto prostoru je tedy 2n.

Pro jednoduchou ilustraci tohoto jevu viz Příklad 4 níže.

Existence báze

editovat

Dokažme si v tomto oddíle důležité tvrzení: Každý nenulový vektorový prostor má bázi. Pro konečněrozměrné prostory jsme tuto větu už v podstatě dokázali v oddíle Vztah dimenze a báze. Bude nás tedy hlavně zajímat případ nekonečněrozměrných vektorových prostorů. Poznamenejme ještě, že nulový vektorový prostor,  , žádnou bázi nemá. K důkazu věty budeme potřebovat axiom výběru, konkrétně jeho formulaci ve tvaru Zornova lemmatu.

Uvažujme nenulový vektorový prostor   a systém všech jeho lineárně nezávislých podmnožin  . Neboť množiny obsahující jediný nenulový vektor jsou lineárně nezávislé, je   neprázdný. Díky relaci inkluze je tento systém navíc částečně uspořádaná množina. Máme-li dvě lineárně nezávislé množiny  ,   ze systému  , tak můžeme totiž definovat  , právě když  . Uvažujme nyní lineárně uspořádaný podsystém   z  . Sjednotíme-li všechny prvky podsystému  , dostaneme množinu  , o níž není těžké dokázat, že je jednak prvkem systému  , jednak že je navíc nadmnožinou všech prvků podsystému  . Množina   je tedy horní závorou podsystému  . Dokázali jsme tak, že každý lineárně uspořádaný podsystém systému   je shora omezený. Aplikujeme-li Zornovo lemma, okamžitě dostáváme, že systém   musí mít maximální prvek, označme si ho  . O tomto maximálním prvku se nyní budeme snažit dokázat, že je bází vektorového prostoru  . Protože   leží v  , tak musí být lineárně nezávislá, navíc je to určitě podmnožina prostoru  . Zbývá tedy ukázat, že   generuje  . Kdyby tomu tak nebylo, tak najdeme vektor   z   tak, že ho nelze vyjádřit jako lineární kombinaci prvků z  . Množina   by tak byla lineárně nezávislá. Tato množina tedy patří do   a přitom je větší (podle relace definované pomocí inkluze výše) než množina  . To je ale spor s tím, že   je maximální prvek v  . Dokázali jsme tak, že každý nenulový vektorový prostor má bázi.

Jednoznačnost vyjádření

editovat

Dokažme si v tomto oddíle jednoduchý, avšak důležitý, důsledek definice báze. A sice, že rozklad libovolného vektoru konečněrozměrného prostoru do vektorů báze je jednoznačný. (Nyní v definici báze předpokládáme, že báze je navíc uspořádaný soubor vektorů.) Neboli

  • Nechť   je vektorový prostor konečné dimenze   definovaný nad tělesem  . Dále nechť   je jeho báze. Pak pro libovolný vektor   existuje právě jedna uspořádaná n-tice   prvků z tělesa   taková, že platí
 
Důkaz: Existence nějaké n-tice prvků z tělesa splňující rovnost výše je zajištěna z definice báze. Je tedy nutné jen ověřit její jednoznačnost. Pro spor tedy předpokládejme existenci ještě jiné n-tice prvků  , splňující tentýž vztah. Platí tedy  . Neboli  . Protože je ale soubor   lineárně nezávislý, musí být všechny koeficienty   rovny nule. To jest   pro všechna  , což je spor s předpokladem.

Souřadnicová zobrazení

editovat

Souřadnicový izomorfizmus

editovat

Jak jsme viděli v oddíle Jednoznačnost vyjádření, tak pro každý vektor konečněrozměrného vektorového prostoru   s danou n-člennou bází existuje právě jedna n-tice prvků z tělesa  , jeho souřadnice. Máme tak definováno zobrazení z vektorového prostoru   do množiny  , které každému vektoru z   přiřadí jeho souřadnice v dané bázi. Toto zobrazení se nazývá souřadnicový izomorfizmus (přidružený k dané bázi), označme si ho jako  . Platí tedy, že  , a explicitně vyjádřeno

 

Izomorfizmus je v kontextu lineární algebry přitom lineární bijektivní zobrazení. Měli bychom tedy nejdříve ověřit, že dané zobrazení tyto vlastnosti skutečně splňuje. Pro libovolné vektory

 

zjevně platí, že jejich součet má souřadnice rovné součtům souřadnic a podobně jejich násobek má souřadnice rovné násobku souřadnic. Neboli

 

kde  . Platí tedy vztahy   a   a můžeme tak uzavřít, že   je lineární zobrazení. Je též snadné nahlédnout, že pro každou n-tici prvků z   najdeme vektor z  , jehož souřadnice jsou rovny právě této n-tici. Navíc je tento vektor zřejmě určen jednoznačně. Zobrazení   je tak prosté a na a my jsme dokázali, že se jedná o izomorfizmus.

Souřadnicový funkcionál

editovat

Pokud nás zajímá jen souřadnice odpovídající jednomu konkrétnímu bazickému vektoru, můžeme si definovat zobrazení, které vektoru přiřazuje právě jen tuto souřadnici. Řekněme, že ve vektorovém prostoru   konečné dimenze definovaném nad tělesem   máme bázi   a zajímá nás nyní j-tá souřadnice vektorů z   ve zmíněné bázi, kde  . Pak lze definovat zobrazení  , které každému vektoru   přiřadí jeho j-tou souřadnici. Tomuto zobrazení se říká (j-tý) souřadnicový funkcionál v bázi  . Platí tedy

 

Funkcionál je obecně zobrazení zobrazující z vektorového prostoru do jeho tělesa. Naprosto analogicky případu pro souřadnicový izomorfizmus bychom ukázali, že souřadnicový funkcionál je lineární zobrazení. Platí i pěkný vztah

 

kde   je j-tý souřadnicový funkcionál pro bázi  , vektor   je k-tý bazický vektor a   je Kroneckerovo delta. Tento vztah plyne ihned z definice souřadnicového funkcionálu, uvědomíme-li si, že platí  .

Souřadnicové funkcionály mají i tu vlastnost, že tvoří bázi duálního prostoru k vektorovému prostoru  . Každý vektor z   lze totiž psát ve tvaru

 

Máme-li nyní libovolný lineární funkcionál   z duálního prostoru  , tak jeho působení na libovolný vektor   můžeme vyjádřit ve tvaru

 

Nezajímá-li nás nyní konkrétní vektor  , ale tvar samotného zobrazení, tak můžeme shrnout

 

Výrazy   jsou totiž nyní prvky z tělesa a máme tak funkcionál   vyjádřen jako lineární kombinaci souřadnicových funkcionálů. Lineární funkcionály tedy generují duální prostor. Dokažme si ještě jejich lineární nezávislost. Za tím účelem uvažujme jejich obecnou lineární kombinaci dávající nulový vektor, nulový funkcionál

 

Na pravé straně rovnosti je zobrazení, které každému vektoru přiřadí nulový prvek z tělesa. Abychom dokázali lineární nezávislost souboru lineárních funkcionálů, musíme ukázat, že každý koeficient   je nulový. To ale není těžké dokázat, pokud do vztahu výše dosadíme bazické vektory. Pro j-tý bazický vektor je pravá strana nulová, zatímco na levé straně dostaneme

 

Vidíme tak, že koeficient   je nulový. Stejně bychom postupovali i pro zbylé koeficienty. Dokázali jsme tak lineární nezávislost a můžeme shrnout, že soubor lineárních funkcionálů je bází duálního prostoru k prostoru  .

Přechod mezi bázemi

editovat

Jak již bylo zmíněno, v nenulovém vektorovém prostoru lze nalézt více bází. V nenulových komplexních vektorových prostorech konečné dimenze je těchto bází dokonce nekonečně mnoho. Vždy totiž můžu libovolný vektor báze vynásobit nějakým nenulovým číslem. Lineární nezávislost ani schopnost souboru generovat prostor to nezmění, dostávám tak jinou, lehce odlišnou bázi. Protože je čísel nekonečně mnoho, mohu takto obdržet nekonečně mnoho bází. Pro práci s vektory se hodí různé báze v závislosti na úloze, je tedy velmi užitečné najít jednoduchý způsob, jak vektory vyjádřené souřadnicemi v jedné bázi vyjádřit pomocí souřadnic v bázi druhé. Za tímto účelem se zavádí matice přechodu mezi bázemi. Pokud si souřadnice daného vektoru narovnáme do sloupce, tak souřadnice téhož vektoru v nové bázi získáme tak, že tento sloupec zleva vynásobíme maticí přechodu.

Matice přechodu – úvod

editovat

Ukažme si nejprve, jak se k matici přechodu dospěje a pak si uveďme formální definici. Pro konkrétnost nechť   a   jsou dvě různé báze prostoru  . Vektory jedné báze tak lze vyjádřit jako lineární kombinace vektorů druhé báze jako

 

Máme-li tedy libovolný vektor   z prostoru  , lze tento napsat jednak v bázi   ve tvaru  , jednak v bázi   ve tvaru  . Platí tedy, že

 

Protože je vyjádření vektoru   v libovolné bázi jednoznačné, viz oddíl Jednoznačnost vyjádření, musí se rovnat koeficienty v posledních dvou výrazech a dostáváme tak

 

Tento vztah lze zapsat maticově ve tvaru

 

kde  ,   a   je tzv. matice přechodu, jejíž prvky jsou  .

Matice přechodu – definice

editovat

Uveďme si nyní definici matice přechodu. Nechť   je vektorový prostor konečné dimenze   definovaný nad tělesem  . Nechť   a   jsou dvě různé báze tohoto prostoru. Pak matice přechodu   od báze   k bázi   je matice z   splňující

 

kde   jsou souřadnicové funkcionály přidružené k bázi  . V matici přechodu je tedy v i-tém řádku a j-tém sloupci i-tá souřadnice bazického vektoru  , když ho popisujeme v bázi  . Alternativně můžeme matici přechodu od báze X k bázi Y definovat jako matici zobrazení pro izomorfizmus, která je vyjádřena v bázích X a Y.

Mějme nyní vektor   z vektorového prostoru   výše. Nechť   jsou jeho souřadnice v bázi   a   jsou jeho souřadnice v bázi  . Pak platí

 

Dokažme si nyní tento vztah. Důkaz bude v podstatě totožný s postupem, který jsme použili v předchozím oddíle. Víme, že platí  . Protože stále pracujeme s tímtéž vektorovým prostorem, můžeme si vektory báze  , jako kterékoli jiné vektory, vyjádřit v bázi  . Pro tyto vektory pak platí vztahy

 

kde výraz   je poněkud komplikovanější způsob zápisu j-té souřadnice vektoru   v bázi  . Když tento vztah dosadíme do vyjádření vektoru  , dostáváme

 

Protože jsou indexy i a j sčítací, můžeme je bez následků přejmenovat. Přejmenujme tedy index i v sumě, která se nachází úplně vpravo ve výrazu výše, na k. Navíc přejmenujme ve stejném výrazu index j na i. Výraz za posledním rovnítkem výše tedy přejde do tvaru

 

Při pohledu zpět na předchozí rovnosti vidíme, že tento poslední výraz je roven vektoru   a tedy i platí rovnost

 

odkud je hned vidět, že  . Tento vztah ale není nic jiného, než definice násobení i-tého řádku matice s prvky   sloupcovým vektorem se složkami  . Dokázali jsme tak vztah pro převod souřadnic vektoru z jedné báze do druhé.

Jednoduchý příklad na sestrojení matice přechodu pro vektorový prostor dimenze tři lze nalézt v oddíle Příklad 3 – Matice přechodu níže.

Příklady

editovat

Příklad 1 – Standardní báze

editovat

Jak bylo výše v oddíle Standardní báze uvedeno, vypišme si tvary standardních bází pro různé vektorové prostory.

Aritmetické vektory

editovat

V prostoru aritmetických vektorů, tj. uspořádaných n-tic čísel, se za standardní bázi označuje množina tvaru

 

Není těžké ukázat, že tato množina skutečně tvoří bázi. Například v prostoru uspořádaných trojic čísel je možné každý vektor rozepsat způsobem

 

Lineární nezávislost by šla ověřit stejným způsobem. Místo trojic jsme samozřejmě mohli vzít libovolný rozměr n-tic.

Posloupnosti

editovat

Přímým zobecněním standardní báze prostorů uspořádaných n-tic čísel je standardní báze prostoru číselných posloupností, která je tvořena posloupnostmi tvaru

 

V kompaktnějším tvaru pak lze libovolnou posloupnost ze standardní báze zapsat jako

 

kde symbol   označuje Kroneckerovo delta.

Podobně jako pro aritmetické vektory je možné definovat standardní bázi i pro matice (čísel), tj.  , kde  . Například prostor   má standardní bázi tvořenou vektory

 

Analogicky bychom obdrželi standardní báze i pro matice jiných rozměrů.

Polynomy

editovat

V prostoru polynomů   se za standardní bázi označuje množina funkcí tvaru

 

kde symbol 1 je nutno chápat jako funkci, která nezávisle proměnné přiřadí jedničku. Pokud uvažujeme vektorový prostor polynomů stupně nejvýše n-1, pak je standardní báze takovéhoto prostoru rovna množině

 

Tento prostor má dimenzi n a označuje se obvykle jako  .

Příklad 2 – Aritmetické vektory

editovat

V předchozím příkladě jsme ukázali jeden z příkladů báze aritmetických vektorových prostorů. V každém nenulovém (komplexním) vektorovém prostoru (konečné dimenze) ale můžeme zavést bází nekonečně mnoho. Mějme příklad vektorového prostoru  . Jednou z jeho bází je i množina tvořená vektory

 

Tato báze je dokonce ortogonální, když v prostoru   uvažujeme skalární součin   Pokud všechny tři vektory znormalizujeme, tj. vydělíme jejich (Euklidovou) normou, tak dostáváme jednu z možných ortonormálních bází prostoru   tvaru

 

Příklad 3 – Matice přechodu

editovat

Uvažujme vektorový prostor   z předchozího příkladu, jeho standardní bázi, kterou si označíme  , a jeho ortonormální bázi z předchozího příkladu, kterou si označíme jako  . Sestrojíme nyní matici přechodu z jedné báze do druhé. Uvažujme proto obecný vektor  , který má ve standardní bázi souřadnice  . Platí tedy

 

Zároveň ale chceme vektor   nakombinovat z vektorů druhé báze, tj. chceme najít koeficienty   takové, aby platilo

 

Jsme-li trochu zběhlí v násobení matice sloupcovým vektorem, můžeme si hned všimnout, že lze poslední výraz přepsat do tvaru

 

kde sloupcový vektor vpravo představuje souřadnice vektoru   v bázi  . Spočetli jsme tak, že matice přechodu od báze   k bázi   je rovna

 

Pokud nejsme tak zběhlí v násobení matic, můžeme při hledání matice přechodu vyjít z její definice. Vyjádříme si tedy vektory z báze   pomocí vektorů z báze  . Dostaneme

 
 
 

kde jsme jako   označili vektory báze   a jako   jsme označili vektory báze  . Platí tedy následující vztahy, kde   označuje i-tou souřadnici vektoru   v bázi  

 
 
 

Když tyto hodnoty uspořádáme do matice dle definice, obdržíme matici přechodu vyobrazenou výše. (Pozor na indexy řádků a sloupců.)

Příklad 4 – Závislost na tělese

editovat

Podobně jako v příkladu 2 článku Dimenze vektorového prostoru si nyní ilustrujme závislost báze vektorového prostoru na zvoleném tělese, jak je diskutováno výše v oddíle Závislost na tělese. Berme nejprve množinu komplexních čísel   jako vektorový prostor nad tělesem komplexních čísel. V takovém případě je zjevně dimenze tohoto prostoru rovna jedničce a za jeho bázi si můžu vzít libovolné nenulové komplexní číslo. Pokud však chápeme tutéž množinu vektorů   jako vektorový prostor nad tělesem reálných čísel, tak dimenze tohoto prostoru je   a situace začíná být lehce komplikovanější. Obecné komplexní číslo totiž můžeme zapisovat ve tvaru  , kde   a   jsou reálná čísla. Z tohoto pohledu tedy lze komplexní čísla chápat jako uspořádané dvojice reálných čísel. Za bazické vektory vektorového prostoru   nad tělesem   pak můžeme vzít například číslo 1 a imaginární jednotku i. V jazyce uspořádaných dvojic by tato volba odpovídala dvojici vektorů (1,0) a (0,1). Nyní už totiž číslo i není součástí tělesa (reálných čísel) a kvůli němu nám dimenze vzrostla z jedničky na dvojku.

Příklad 5 – L2

editovat

Krom obyčejných bází ve vektorových prostorech můžeme brát v úvahu i báze ortonormální. Tyto báze přitom mohou v nekonečněrozměrných prostorech nabývat poněkud komplikovaných forem. Jako příklad nekonečněrozměrného Hilbertova prostoru uvažujme Hilbertův prostor   kvadraticky integrabilních funkcí definovaných na intervalu  . Lze ukázat, že množina funkcí tvaru[3]

 

kde index   probíhá množinu celých čísel  , je ortonormální báze tohoto prostoru. Této bázi se říká trigonometrická báze prostoru  .

Jako další příklad si uveďme Hilbertův prostor   kvadraticky integrabilních funkcí definovaných na intervalu (-1,1). O něm lze zase ukázat, že jedna z jeho ortonormálních bází je množina tvořená funkcemi tvaru[3]

 

jsou Legendrovy polynomy a kde  .

Poznámky

editovat
  1. Poznámka k angličtině: Generátory (angl. generators) generují (angl. generate nebo span) vektorový prostor.

Reference

editovat
  1. FUČÍK, Svatopluk; FUFNER, Alois. O Schauderových bázích a jejich aplikacích. S. 11–21. Pokroky matematiky, fyziky a astronomie [online]. 1974 [cit. 2014]. Roč. 19, čís. 1, s. 11–21. Dostupné online. ISSN 0032-2423. 
  2. http://www.karlin.mff.cuni.cz/~zeleny/mff/MA2B/MA2b_Kap_18_tisk.pdf
  3. a b c BLANK, Jiří; EXNER, Pavel; HAVLÍČEK, Miloslav. Lineární operátory v kvantové fyzice. Praha: Karolinum, 1993. ISBN 80-7066-586-6. 

Literatura

editovat
  • PYTLÍČEK, Jiří. Lineární algebra a geometrie. Praha: Česká technika - nakladatelství ČVUT, 2008. ISBN 978-80-01-04063-8.  – skripta FJFI ČVUT
  • BALKOVÁ, Ľubomíra. Lineární algebra 1. Praha: Česká technika - nakladatelství ČVUT, 2013. ISBN 978-80-01-05346-1.  – skripta FJFI ČVUT
  • BLANK, Jiří; EXNER, Pavel; HAVLÍČEK, Miloslav. Lineární operátory v kvantové fyzice. Praha: Karolinum, 1993. ISBN 80-7066-586-6. 

Související články

editovat

Externí odkazy

editovat