tichy tichy
658
BLOG

o dewiacji (nie klikaj, bo się rozczarujesz)

tichy tichy Nauka Obserwuj temat Obserwuj notkę 58

Pod poprzednią notką pojawiły się pytania nie na temat (na ile inicjatywie charytatywnej można ufać)  Sam temat wyczerpał mnie strasznie, wyssał wszelkie soki. By nie zostać wiórem, zaniedbuję go. Gadać mozna w kółko, ale gdy przyjdzie co do czego - zawsze, ale też i teraz - tragedia Haiti -  to trzeba i tak albo sięgnąć do kieszeni, albo odwrócić wzrok.

Więc, komentatora dręczy wariancja, i czemuś ja miałbym coś na ten temat wiedzieć.

Trzeba po kolei. Rzeczywiście, trudno z wikipedii, bo tam nie po kolei.

Zgadzamy się, że byle garść liczb, czy to z obserwacji, czy rachunków, czy ot tak sobie sprokurowane - są rozrzucone, tzn., nie-stałe. Żadne tam 1, 1, 1, 1, 1,.. albo 7, 7, 7, 7,....

Zgadamy się, że jedne kolekcje liczbowe są rozrzucone bardziej, a drugie mniej?

Teraz, jak te różnicę w rozrzuceniu mierzyć?

Idea jest taka: wybieramy jedną liczbę "c", którą uważamy za najlepszą reprezentację całej kolekcji. Dla każdej liczby x1, x2,x3, ...z kolekcji, liczymy odchyłkę-dewiację

d1=|x1--c| , d2=|x2--c| , d3=|x3--c|  ,...

Czemu tak?

A mamy lepszy pomysł?

No, ale trzeba to jakoś łącznie - by dostać łączną dewiację. Np., zsumujmy te dewiacje:

D=d1 + d2 + d3 + ...

i uroczyście zadeklarujmy - tak właśnie daleko jest cała chmara od tej jednej liczby "c".

Zaraz, zaraz - a niby co to jest to "c"? Przecież widać, że jak głupio wybrać, to łączna dewiacja D będzie wielka. Nawet dowolnie wielka. A przecież nie powinna dobra miara zależeć od złych wyborów! Przy tym, błędne koło - łączna dewiacja zależy od wyboru "c", zaś "c" zależy od dewiacji...

Ano, zgoda. Zatem, ta liczba-reprezentant powinna być wybrana jak najlepiej, jak najoszczędniej, tak by D było najmniejsze możliwie. 

Wiec, jak wybrać "c"?

To tzw. problem komiwojażera. lub roznosiciela. Wyobraź sobie, że masz doręczyć kilka paczek do kilku domów na prostej ulicy. Podjeżdżasz samochodem, twój pracodawca, z uwagi na kryzys, żąda od ciebie, byś zaparkował raz, i wszystkie paczki pieszo rozniósł po adresach. Paczki nie są cięzkie, ale na tyle nieporęczne, że możesz wziąc tylką jedną na raz.

Jesteś oczywiście leniwy, i nie chce ci się chodzić, ot, tyle - co musisz. Więc, gdzie zaparkujesz?

Łatwo rozwiązać problem dla dwóch adresów, dla trzech... A dla 17 lub 18? No, proszę, rozwiąż (wskazówka - to łatwe).

No dobra, to jeden problem, gdy paczki sa w miarę lekkie, i nie pada, i śniegu nie nawiało. Bo wtedy masz prostą proporcję do rozważenia. Dwa razy więcej krroków - dwa razy bardziej się namęczysz. Trzy razy dalej, trzy razy trudniej, etc.

Ale jak paczki ciężkie, jak śnieg po kolana, jak zacina wiatrem i deszczem w oczy, to kazdy następny krok trudniejszy od poprzedniego. Dwa razy dalej - może być cztery razy trudniej. Trzykroć kroków więcej, dziewięćkroć zmęczenie dobija. Zadanie - gdzie zaparkować - się komplikuje. Co robić?

Ano, mierzymy swoje zmęczenie (widoczny ten kwadrat wzrostu wraz z odległością, prawda?):

D2 = d1² + d2² + d3²+...

I po drobnych algebraicznych manipulacjach, i korzystając ze wzoru na minimum funkcji kwadratowej ze szkoły średniej, znajdujemy, iż ten najlepszy punkt parkowania "c" jest dokładnie średnią odległości.

No tak, wciąż da się policzyć i rozwiązać, ponieważ założyliśmy wzrost zmęczenia z kwadratem odległości. A co będzie, gdy zmęczenie rośnie inaczej, wg. innej reguły? Niechby z potęgą, ale różną od 2? Np. z potęgą 3/2?

Na to mam odpowiedź, ale pewnie nie spodoba ci się, czytelniku. Zadanie niby to samo, tylko rozwiązanie - za przeproszeniem - syf. Więc, nie marudź - trzymaj się albo kwadratu, albo prostej proporcji zmęczenia i odległości. Nawiasem mówiąc, ta prosta proporcja w rachunkach dalszych (gdy skomplkujemy zadanie - różne paczki, różni klienci, rózne napiwki, różne pogody) - prowadzi do wcale nieprostych rachunków, które, jak wyżej, określamy tak samo - s.y.f.

Pozostaje więc jedno - kwadrat. Możemy wiec uważać, że jest to dar, i  że musi być dlań wyższy powód. Dlatego liczyć trzeba rzeczy z kwadratem, i wyciągać z rachunków wnioski. I z tej przesłanki wynika nie tylko cała statystyka i mechanika, ale też i mechanika kwantowa.

I tak zrodziła się metoda najmniejszych kwadratów. Jak zawsze, pytanie - kto jest ojcem? Ano, Gauss - pierwszy podejrzany.

Ta najmniejsza dewiacja wględem rozrzutu mierzonego kwadratem nosi w statyce miano wariancji. By zachować jednostki fizyczne, dobrze jest - wstępnie podniósłszy do kwadratu, po zakończeniu rachunków, przywrócić oryginały jednostek - przez wzięcie pierwiastka. Ludziska umówili się nazywać toto "standardowym odchyleniem".

Pytania? Ontologia, epistemiologia, ekologia?
 

tichy
O mnie tichy

tichy jaki jest każdy widzi

Nowości od blogera

Komentarze

Pokaż komentarze (58)

Inne tematy w dziale Technologie