Genetické algoritmy – na jakých datech testovat?

Autor článku: 7. 1. 2014

Dnešní článek bude kratší, ale velmi důležitý. Zaměříme se na to, na jakých datech strategie testovat a za jak dlouhé období.

 

Rozdělení strategií

Strategie lze všeobecně rozdělit na dvě části – scalping a ty ostatní.

Každý typ strategie má přirozeně jiné nároky na data.

 

Scalping

Pokud děláte vývoj strategií pro scalping, pak výsledné obchody ovlivňuje mnoho faktorů a do nejmenšího detailu i vývoj ceny jako takové. Je zcela nemyslitelné testovat scalpovací strategie na jiných datech, než jsou data ticková. Tedy taková data, kde je zachycen úplně každý pohyb trhu. Pokud pak data pustíte, chování na 99% odpovídá realitě v dané době. Nicméně další problémy scalpovacích strategi – skluzy a roztahující se spready, již tak snadno neotestujete. Ideálně je mít na toto speciální software. Navíc ticková data futures stojí řádově tisíce USD, není to tedy nic levného.

 

Standardní strategie

Toto se týká většiny z nás. Většina obchodníků staví strategie pro H1 a vyšší timeframe, přičemž zde již pro kvalitní výsledky stačí M1 close data. Tedy taková data, kde máme close ceny každé minuty. Taková data jsou již snadněji dostupná a nemusíme za ně platit tisíce USD. Narazíme však na jiný problém – kvalita dat. V první řadě je potřeba mít zjištěno, zda nejsou v datech velké mezery. Pokud nejsou, tak u futures jsou data daná burzou a u každého obchodníka budete mít kurz stejný, kdežto u forexu se mohou mírně lišit podle brokera a výsledky tak mohou být rozdílné.

Jak si poradit s kvalitou forexových dat?

Osobně mám relativně jednoduché řešení. Mám data od cca 10ti brokerů a požaduji, aby výsledky strategie byly na všech více méně podobné. Pak vím, že strategie bude s vysokou pravděpodobností obchodovatelná u libovolného brokera. Důležité také je, aby si software, na kterém strategie testujete, dokázal efektivně poradit s případnými mezerami v datech.

 

Na jak dlouhých datech strategie testovat?

Toto je velmi častý dotaz. Většina obchodníků testuje na datech od roku 2007, která jsou nejlépe dostupná. Někteří i na datech od roku 2010. Tyto data jsou dostatečná pro mechanické strategie, kde hraje roli též zkušenost a cit pro trh. Nicméně můj názor je, že pro automatizované strategie je lepší mít test delší – ideálně na datech od roku 2001.

Proč je lepší testovat na datech od roku 2001?

Vy co obchodujete déle si jistě pamatujete na polovinu roku 2007, kdy vypukla krize v USA. Zde začala prudce růst volatilita a na původní hodnoty se vrací až nyní. Co když se vrátíme do předkrizového období? Stát se to může a proto chci, aby moje strategie byly robustní na všech datech co jsou dostupná – tedy od roku 2001.

Zde to je krásně vidět. V grafu je vyznačen červenec 2007, kdy krize začala. Období předtím je z hlediska volatility úplně jiné, než to následující.

 

Když se podíváme na graf VIX, tak (logicky) vidíme stejnou situaci – před rokem 2007 mnohem větší klid než nyní.

Na obrázky můžete kliknout pro zvětšení.

 

Závěr

Když si k vývoji volatility přidáme stále rostoucí podíl automatů a HFT, klesající spready, stále více traderů a další faktory ovlivňující trh, je pro mne dlouhodobá robustnost a kvalita dat stále více důležitá. A vám doporučuji se na toto zaměřit též. Je to jeden z důležitých kroků k úspěchu každého algo tradera a jeho strategií.

 

Zdeněk Zaňka
StrategyQuant CZ

Štítky: ,

Napsat komentář





Finanční a komoditní komentáře z Chicaga pro vás připravila společnost Lembros logo