Kointegracji podejście do handlu parami.

Anonim

W tym artykule przedstawię podstawy podstaw statystyczne arbitrażu - podejście kointegracji. Pomimo faktu, że tam już był artykuł o kointegracji i obrotu pary, postaram się przedstawić materiał, trochę bardziej systematycznie i mogą być z tym trudniejsze. Ale, ale mam nadzieję, że będzie rozwijać pełne zrozumienie podstawowej metody stat. arbitraż. Może będzie to seria artykułów o podstawowych algorytmów. Która będzie zawierać więcej osób do tego wspaniałego stylu obrotu.

Jaki jest ko-integracja?

(I dlaczego nie są tak bardzo istotne korelacje)

Więc mamy dwie akcje A i B oraz ich cenę pewien okres czasu (szeregów czasowych cen). Ceny tych dwóch stad oni będą nazwani Cointegrated Jeżeli mogą być kombinowane liniowo w jednym rzędzie, który ma właściwość stacjonarności.

Piszemy tę formułę. A następnie analizować wszystko w porządku:

Zatem zapis:

- seria kursów akcji A. gdzie t oznacza czas. Na przykład, jeżeli zdarzenia 16 marca, „A” jest warte 100 $. To będzie rejestrowane jako

i jeśli to było warte $ 101, a następnie piszemy 14 marca jako

Ale jak pracować z szerokim zakresie cen na pewien okres, a nie na konkretny termin, cena akcji A i B są zapisywane jako:

Następny mówimy

„Jeżeli one liniowo połączone”

Co to oznacza liniowy?

Dla uproszczenia, to kiedy dodać „+” lub odejmować „-” Cenę akcji B lub B z A. To może wycenić zapas pomnożonej przez pewną wartość. Jak widać w cenie akcji formuła B pomnożoną przez współczynnik gamma (nie będzie do końca prawda, ale dla uproszczenia mam jeszcze zamiar zadzwonić stałą liczbę współczynników, chociaż w rzeczywistości jest niezerowy wektor). Więc prowadzimy proste manipulacje z cenami, należy pomnożyć cenę akcji serii B na co ten numer i odjąć cenę cen giełdowych A.

Razzhuem nawet więcej:

14 marca Udział wart był 101 rubli. Akcja na 14 marca, kosztowała 30 rubli.

γ - obliczyliśmy, że liczba tych akcji, równa 2. (jak obliczyć, omówimy poniżej). W rzeczywistości ten stosunek jest nazywany współczynnikiem kointegracji.

Następnie mamy 14 marca:

101 - 2 x 30 = 41

To się nazywa kombinacja liniowa. Chyba załatwione.

Chodźmy dalej:

„Połączony w rzędzie”

Dałem przykład 14 marca. Ale załóżmy, że mamy to odjąć cenę (połączenie) za każdy dzień marca (od 1 marca do 12 marca). Następnie, za każdym razem zabierając cenę poznamy 16 numerów. Te 16 numery są nazywane „szeregów czasowych” to nie tylko same ceny, a ich różnica. I oznaczony jako

Idziemy dalej:

"Mając na własność nieruchoma"

Dla uproszczenia: to jest nieruchoma, gdy plan jest ciągle spaceru wokół tych samych wartości:

Poprawiono zakres:

Niestacjonarnym serii

Poprawiono:

Niestacjonarnym

Mówiąc poprawnie, gdy jest nieruchoma właściwości probabilistyczne są stałe.

Dlatego ważne jest, aby być ustalona?

Ponieważ jego ruchu, jak widać z powyższych wykresów stacjonarny łatwych do przewidzenia.

WAŻNE!

Stacjonarność jest właściwością statystyczny! I to taki zakres nie nazywamy stacjonarną

Wbrew temu, co wydaje się być możemy przewidzieć jego ruch (!).

WAŻNE!

Nie wszystkie pary instrumentów (akcje, Fut, etc.) może być skointegrowane. Ta właściwość jest opętany przez ograniczoną liczbę narzędzi na rynku.

WAŻNE!

Aby obliczyć kointegracji względu na jaki okres czasu będziemy podejmować. I jakie ramy czasowe. Oznacza to, na przykład,

Para: ISBC & STI skointegrowane w przedziale 01-02-2012 - 01. 03.2015 (na co dzień blisko). Ale nie skointegrowane w przedziale 01-01-2010 - 03.01.2015.

WAŻNE!

Nie za nic, użyliśmy formułę w takim samym stosunku. Fakt, że sama różnica w cenie ISBC - STI jak zwykle różnicą innych par. Oni nie mają własność nieruchoma (nie chodzą wokół jednej osi (linia)).

Jak określić skointegrowane parę i tę samą stawkę?

W tym celu testy Engle-Granger.

Jej algorytm:

Krok 1: Sprawdź, czy cena (cena szeregów czasowych) akcji „A” przez pewien określony czas. Jeśli tak nie jest, to: Określenie, czy na własnych cen akcji „w” stacjonarnych. Jeśli tak nie jest, przejdź do kroku 2.

Etap 2: Budowa regresji liniowej pary A i B, i wybranych pozostałości (regresji w oddzielnym rzędu

Etap 3. kontrolę liczby nieruchomą „resztkami” regresji jeśli jest nieruchomy, a następnie dwóch… seria cena skointegrowane.

teraz, w porządku.

"Czy cena akcji" a „przez pewien okres czasu ustalonego”

w celu określenia, czy liczba stałych (tj zachowany, jeżeli jego probabilistyczne właściwości w czasie, lub w prosty sposób idzie wokół linii lub nie) ispol'uet zuetsya APD (test Augmented Dickeya Fuller). Jest to najbardziej popularny. O tym, jak można zapoznać się z nim pojawi się na końcu.

Dla zaawansowanych: brak stacjonarności jest obecność pierwiastka jednostkowego I (1), czyli integrację pierwszej kolejności. Obecność stanie równowagi jest brak pojedynczego korzenia I (0). można sprawdzić wszelkie badania głównego urządzenia.

„Budowa regresji liniowej pary A i B, a następnie wybierz pozostałości regresji w oddzielnym rzędu. ”

Regresja - dla prostego wyszukiwania jest związek między serią dwóch godzin. To jest jak trzeba zwiększyć wartość B na wartość zwiększoną o jeden.

Pamiętaj oryginalny wyraz?

Jeśli poruszamy się w prawo:

Otrzymujemy:

Będzie to równanie regresji. Przyjrzyjmy się dokładniej.

Co to jest regresja?

Przykład rozumieć

Mamy dwa zestawy danych:

  • Dzienny przychód sklep spożywczy w ciągu miesiąca.
  • Liczba osób przybywających do sklepu codziennie przez miesiąc.

Jest oczywiste, że każda osoba spędza w sklepie pewną kwotę pieniędzy. Ktoś bardziej, niektóre mniej. Jednak prawie zawsze zwiększenie liczby klientów prowadzi do zwiększenia przychodów. W celu ustalenia, w jaki sposób zmiany średniego przychodu na liczbę ludzi, którzy przybyli i zbudował równania regresji. Gdzie ważne jest to ostateczny czynnik γ, które pokazują, jak wiele rubli w średniej zmiany przychodów będzie pochodzić jeśli jedna dodatkowa osoba w sklepie.

Ale jak znaleźć tylko „średnią ” wartość średnią, a każda osoba spędza różne kwoty pieniędzy w sklepie, będziemy stale być pewne odchylenia od wartości należnej. Oznacza to, że nawet jeśli sklep trafi dokładnie 100 osób dziennie, codziennie od wpływów będzie inny, choć oscyluje wokół tych samych wartości. Czyli 100 osób, możemy prognoza przychodów w wysokości 100 tysięcy rubli. Ale do pewnego dnia będzie to 93 tysięcy w drugim 108 tys. Przychód jest inna, ale oscyluje wokół 100 tysięcy.

Więc jest to „błąd” (różnica pomiędzy) prognozy i rzeczywiste przychody otrzymane, a pozostała część jest nazywana regresji i jest określany jako

I im lepiej skonstruowany model regresji liniowej (znajdujący odpowiednim stosunku y). Im mniej będzie „chodzić” resztkowe. Oznacza to, że mniej będziemy się mylić w swoich przewidywaniach.

regresji liniowej skonstruowana przy użyciu metody najmniejszych kwadratów (OLS w języku angielskim: OLS). Jego istotą jest to, że jest on szuka tej samej wartości współczynnika gamma tak, że błąd był minimalny (reszta).

Chodź.

Więc mamy dwie akcje A i B oraz ich ceny na okres 2 lat. Zbudowaliśmy regresji liniowej i stwierdził, że średnio, relacja między cenami akcji może być opisana jako:

Gdzie μ - jest wartością ceny zakładowego, jeżeli wartość cena akcji B będzie równa 0. Jest to po prostu stała (których liczba nie zmienia się w czasie, takie jak to może być ustawiony na „3” lub „298” lub ujemne).

W celu sprawdzenia, zapasy są skointegrowane czy nie, musimy podjąć szereg odrębnych bilansów przez okres czasu, np 2 lata. Pomimo faktu, że zorientowali się, jak do działania „na średniej” od siebie niezależne, naprotyazhenii 2 lat cena, prawie codziennie, odbiegała od średniej. Traktujemy te odchylenia osobno, a także sprawdzić je na teście ADF (sprawdzenie salda na stacjonarny). A jeśli ta seria jest stacjonarna ceny A i B są skointegrowane.

Teraz do rzeczy.

Co to wszystko znaczy, i jak inwestować?

Możemy założyć, że gdyby akcja w ciągu 2 lat kointegirovany (między ich wartościami ma pewną równowagę), prawdopodobne jest, że równowaga ta pozostanie na. I możemy handlować krótkoterminowe odchylenia od tej równowagi. Wiedząc, że w końcu przyjdą do ich długookresowej równowagi. Co to oznacza odchylenie od równowagi? Są to pozostałości

Ponieważ te odchylenia są stacjonarne, możemy mieć nadzieję, że odeszła od równowagi, waga powróci do wartości równowagi.

Po raz kolejny, opiszę obraz. Idealnie reszty harmonogram powinien wyglądać następująco:

Jak widzimy odbiegające od 0, po jakimś czasie stopniowo wróciła do niego. To jest wartość łatwo przewidywalne.

Standardowa realizacja handlu jest handel budowa odrzucenie z-score.

Aby nie przeładowywać artykuł dużo, z wyjątkiem powiedzieć, że w statystykach nie ma sposobu, aby ocenić rozprzestrzenianie zmiennej losowej od jej wartości średniej dalej dyspersji. Pierwiastek z wariancji nazywamy odchylenie standardowe i zwykle rejestrowane jako Ď. Więc wynik_z jest zasadniczo mierzy aktualną wartość salda odchyleń standardowych.

Typowy wykres wynik_z jest następujący:

Zgodnie z tym, tu budują strategię:

  • Jeśli Z score≥2 (czerwony linia przerywana z góry) krótki otwór pozycji A w długości i w którym B ma miejsce w kwocie równej y współczynnik zamykając pozycji w Z-score = 0 (przerywane linie w środku zielony);
  • Jeśli Z score≤-2 (czerwona dolna linia przerywana) długości pozycja otwarcia A w krótkim Vgde B pobranych w kwocie równej y współczynnik zamykając pozycji w Z-score = 0 (przerywane linie w środku zielony);

Na podstawie tego wszystkiego. Granica z-score, w którym wejście dla niektórych par może być większa, może mniej za jej definicja musi spojrzeć na danych historycznych.

Teraz krótko o tym, jak można teraz obliczyć Twoich rękach metod dotykowych (musisz google):

  • Aby skonstruować ADF i Engle-Granger, można użyć EViews opakowaniu (na nim wiele ciekawych rzeczy można zrobić z ekonometrii).
  • Jednak bardziej wygodny w użyciu pakiet MATLAB lub Rstudio (można go pobrać bezpośrednio z yahoo cytaty i mają wbudowany ADF). Są one również wygodne, ponieważ możliwe jest, na przykład, aby natychmiast obliczyć stopę zwrotu dla równowagi spreadu. I odpowiednio wcześniej wybrać zapasów z szybszej konwergencji. Co oznacza, że ​​coraz bardziej przekonani, że liczba transakcji.
  • Regresja może być również w EXCEL, aby to zrobić, należy podłączyć pakiet analizy danych.
  • Odchylenie standardowe jest funkcja = ODCH. STANDARDOWE. ma też do thinkorswim.

Powyższe podejście kointegracji jest chyba najprostszy. Ale to tylko podejście do zrozumienia, choć działa. Komplikować ci go sam. Takich jak regresja i std. otklonenie trzeba liczyć się codziennie, czyli okno kalkulacja powinna przejść do różnych par wielkości okna mogą być różne.Razem MNC mogą być zastąpione, lub w każdy inny sposób. Można pracować z serii pre-cenowej dla dokładniejszego wejścia. A sam filtr rozprzestrzeniać. I wiele, wiele więcej.

Jest też bardziej interesujące dynamiczne modele obliczania wejść do intradeya. I probabilistyczne podejście do artykułu do arbitrażu, które są obecnie w trakcie testu.

Postscriptum Nie zapomnij o komentarze, skorygować i zadawać pytania.