Polynomická regrese

Polynomická či polynomiální regrese představuje proložení (aproximaci) zadaných hodnot polynomem. Koeficienty hledaného polynomu jsou metodou nejmenších čtverců vypočteny tak, aby součet druhých mocnin odchylek původních hodnot od získaného polynomu byl minimální.[1]

Ukázka aproximace zadaných bodů polynomem libovolného řádu.

Odvození

editovat

Cílem je proložit hodnotami  ,   polynom  -tého stupně  . Koeficienty   jsou přitom voleny tak, aby součet druhých mocnin odchylek

 

byl minimální, tj.

 

Úloha vede na problém nejmenších čtverců.

Problém nejmenších čtverců

editovat

Dosazením hodnot   do polynomiálního modelu   přímo dostaneme aproximační problém. Z definice odchylky   zřejmě platí  . (Uvědomme si, že   tak vlastně reprezentuje chybu vzniklou při měření veličiny   přičemž předpokládáme, že veličiny   jsou známy přesně.) V maticovém zápisu

 

kde

 

  jsou neznámé koeficienty hledaného polynomu a cílem je dosáhnout takového řešení, aby norma vektoru   byla minimální. Úloha se řeší metodou nejmenších čtverců.

Minimum funkcionálu  

editovat

Minimum (pozitivně semidefinitního) funkcionálu   můžeme hledat klasicky pomocí derivací. Protože veličiny  ,   jsou předem známy, odchylka   je funkcí koeficientů polynomu  , tj.  . Minimalizace součtu kvadrátů odchylek   vede na hledání minima funkcionálu

 

Funkcionál tvoří součet druhých mocnin, je tedy zřejmě nezáporný a nemůže obsahovat žádná lokální maxima ani sedlové body. Bod splňující podmínky

 

je tedy vždy lokálním minimem, které je zároveň minimem globálním. Vyjádříme-li jednotlivé parciální derivace, dostáváme soustavu lineárních algebraických rovnic, kterou můžeme maticově zapsat ve tvaru

 

Řešením této soustavy jsou hledané koeficienty  . Pokud má matice   lineárně nezávislé sloupce, koeficienty polynomu jsou dány jednoznačně a lze je formálně vypočítat podle vztahu

 

Jak vidíme, soustava získaná z parciálních derivací funkcionálu   není nic jiného než soustava normálních rovnic odpovídající problému nejmenších čtverců z předchozího odstavce. Poznamenejme, že se úloha zpravidla (z numerických důvodů) neřeší pomocí soustavy normálních rovnic  , ale například QR faktorizací rozšířené matice   původního problému nejmenších čtverců.

Kvadratická regrese

editovat
 
Graf, na kterém byla experimentální data zjištěna s obrovskou chybou, přičemž daná závislost (nalezená metodou nejmenších čtverců) proměnné y na x je kvadratická.

Kvadratická regrese je případ polynomické regrese, kdy stupeň polynomu   je roven dvěma. Jako taková je tedy speciálním případem lineární regrese. Soubor daných hodnot je proložen (aproximován) kvadratickou funkcí (parabolou). Koeficienty polynomu (paraboly) jsou opět vypočteny metodou nejmenších čtverců.

Odvození problému nejmenších čtverců i nalezení minima funkcionálu je zcela analogické předchozímu případu. Místo obecným polynomem   prokládáme data parabolou, tedy polynomem druhého řádu  . Součet čtverců odchylek   (funkcionál  ) závisí na parametrech  , konkrétně

 

Minimum funkcionálu   opět nalezneme pomocí parciálních derivací (v místě lokálního extrému jsou rovny nule),

 

Spočtením derivací dostaneme soustavu normálních rovnic

 

ze které již formálně není problém (za předpokladu regularity matice soustavy) vypočítat koeficienty  .

Reference

editovat
  1. Jiří Likeš, Josef Machek, Matematická statistika, SNTL Praha 1988, s. 165-169

Související články

editovat