Podziel korelację

Anonim

Ten artykuł jest przydatny dla algorytmicznych handlowców i tych, którzy są zainteresowani w ilościowych metod oceny i obrocie instrumentami finansowymi, ale radzę wszystkim czytać to przynajmniej nie zaszkodzi!

Krótki teoretyczne informacje na temat korelacji Pearsona

Korelacja - miarą uzależnienia dwóch lub więcej zmiennych. Niektóre rodzaje zależności od numerycznej i szeregu czasowym jest wiele, ale wśród handlowców, termin „korelacja” często oznacza współczynnik korelacji liniowej Pearsona. Będzie i omówimy w tym artykule. Liniowy współczynnik korelacji i powiązany współczynnik korelacji pokazuje nam siłę liniową zależność dwóch szeregów czasowych, z którymi są wykresy instrumentów finansowych. Innymi słowy, korelacja pokazuje nam trend pojedynczego składnika aktywów przy zmianie drugiego. Wzór do obliczania współczynnika korelacji Pearsona Wartości otrzymuje współczynnik korelacji mieści się w zakresie od -1 do 1. Jeżeli stosunek jest jednością, a następnie serii x i y są identyczne, czy równa jedności minus - ruchome zwierciadło.

Współczynnik korelacji jest tylko dla stacjonarnych szeregów czasowych!

Często widzę ludzi mówiących o jakiejś wysokiej korelacji (ponad 95%) z tych dwóch aktywów finansowych, a ich korelacja wynosi nie więcej niż 60%. Jaki jest ich problem? Ale fakt, że jest to błędne obliczenie współczynnika korelacji dla niestacjonarnych szeregów czasowych. Ci, którzy mają pytania dotyczące stacjonarnego szeregów czasowych, są tu dwie ilustracje: W stacjonarnych BP cech statystycznych (oczekiwanie i wariancji) jest stała (stała), a także w nieustalonych BP - zmienne. Dlaczego współczynnik korelacji jest ważny tylko podczas pracy z nieruchomym BP? Aby odpowiedzieć na to pytanie, zwróćmy się do samej formuły obliczania ceny. Licznik wzorze oblicza sumę iloczynów odchyleń od maty. Wartości oczekiwanie x i y, a mianownik produkt sum bezwzględnych odchyleń kwadratu. wiemy z matematyki szkolnej oczywiście, że im większy licznik tym większa jego wartość, ale im większa tym mniejszy mianownik ułamka. Duck tutaj, mianownik naszego wzoru jest całkowicie niewrażliwe na postaci szeregów czasowych, ponieważ absolutne odchylenie do kwadratu, co gwarantuje ich pozytywnie, podczas gdy licznik jest bardzo wrażliwy na postaci szeregów czasowych, ponieważ odchyleń są kwadratowe, a więc objawy niedopasowanie mnożników w produkcie (Xi-MX) * (Yi-My) wytwarzają wartość ujemną, co powoduje zmniejszenie całkowitej ilości w liczniku, a zatem zmniejszenie współczynnika korelacji. Ale jeśli objawy są te same czynniki, korelacja tych aktywów będzie dążyć do 100%, a takie sytuacje są dokładnie w szeregów czasowych z komponentu trendu! Może to wszystko w słowa trudne do zrozumienia, więc przejdźmy do przykładów. Symulować dwa losowy proces, w środku którego gwałtowny skok wkładka (EFG).

Poziome linie oznaczają matę. Oczekiwania (MX, MY) danych szeregów czasowych. Wykres pokazuje, że bezwzględne odchylenie znaków będzie zawsze taka sama, ponieważ Obie serie czasowe są zawsze z jednej strony ich średnich wartości w tym samym czasie. Dla jasności, możemy skonstruować zestaw wartości (Xi-Mx) * (Yi-My):

Jak widać, wszystkie warunki liczniku są pozytywne, a zatem wartość licznik będzie zbliżona do wartości mianownika i wzoru korelacji dadzą nam wysoki współczynnik

Jak powiedziałem, wartość korelacji jest równy 95, 5%!! Ale jeśli jeszcze raz spojrzeć na wykresy dwóch rzędach, widzimy, że oprócz szczeliny mają niewiele wspólnego. Prawidłowy współczynnik korelacji tych serii jest równa 53,4%!

Reasumując: Nie możemy oczekiwać, że współczynnik korelacji dla niestacjonarnych szeregów czasowych!

Jak obliczyć korelację?

Gdy licznik współczynnika korelacji jest wrażliwy na trendy, musimy pozbyć się trendu! Można to zrobić poprzez znalezienie wzrost cen aktywów, korelacja z których musimy znaleźć. Przyrost się według następującego wzoru:

Innymi słowy trzeba znaleźć dzienną zmianę aktywów od blisko świecy przed zamknięciem kolejną świecę. Otrzymujemy stacjonarny szeregów czasowych, a następnie znaleźć korelacji zmian naszych aktywów. To z tego współczynnik korelacji zależy od tego, czy możliwe jest, aby powiedzieć dokładnie dynamikę zmian jednego składnika przez inny zmiany! Na przykład, możemy obliczyć współczynnik korelacji dla ETF'a S & P 500 oraz firmę Halliburton Company pod symbolem Hal. Skonstruować dynamikę zmian cen ich akcji w skali procentowej za rok 2013:

Jak widać oba instrumenty mają się trend. Korelacja "naked" harmonogramy będą:

Korelacja wynosi 92%. Teraz znaleźć przyrost cen i obliczyć ich korelację:

Korelacja wynosiła 61%. Różnica jest istotna. Według współczynnika korelacji dla 2013 SPY z HAL umiarkowanym. Kto nie jest jasne - pisać komentarze, będziemy badać.

Linki do przydatnych artykułów na temat korelacji tych akcji i korelacji w handlu pary:

korelacja sektor, Arbitrage

handel parą. pary korelacji

Trading pary: parę akcji, korelacja, kointegracji portfel inwestycyjny spread