Jeden z předcházejících příspěvků „Principy práce s RelativeValues Lab„se věnoval stručnému popisu dílčích problémů, které by měl software pro tvorbu obchodní strategie založené na obchodním přístupu Relative Value, umožnit řešit. Klíčovým krokem takové strategie je identifikace dvojic dostatečně podobných aktiv. To je velmi nekonkrétní pojem a proto i tento krok lze realizovat různými postupy. Aby mohly být vyhledané dvojice co nejstabilnější, má smysl nejprve provést odfiltrování aktiv, která jsou pro párové obchodování nevhodná, protože mají jen velmi málo společného (technicky, ekonomicky, politicky atd.) i přes to, že jejich chování může být dočasně (náhodně) podobné. Prvotní výběr lze provést prostřednictvím různých snadno dostupných ukazatelů (deskriptivních a fundamentálních, ale i technické ukazatele lze pro tyto účely použít). Mezi předvybranými kandidáty se pak hledají dvojice těch, kteří se historicky dlouhodobě pohybovali co nejvíce společně.

I pro vlastní testování spolupohybů ve dvojicích časových řad lze použít několik postupů založených na různých matematických a statistických metodách:

Výstup analýzy korelací mezi změnami hodnot časové řady vypovídá o síle shody společných pohybů, takže řady s vysokou korelací změn hodnot se tak mohou vzájemně vzdalovat (např. obě rostou, přičemž jedna roste rychleji) a už se nemusí k sobě přiblížit.Pro párové obchodování je však žádoucí situace, kdy časové řady se po dočasném oddálení vzájemně k sobě opět přiblíží, což přítomnost vysoké korelace změn hodnot nezaručuje. Tento jev vzájemného přitahování časových řad je schopna lépe identifikovat kointegrační analýza.Analýzu korelací změn hodnot tak lze použít jako jeden z prvotních filtrů pro výběr kandidátů, mezi nimiž jsou pak hledány dvojice vhodné pro párové obchodování.

Kointegrační analýza je nejběžnějším současným přístupem používaným k identifikaci párů. Opírá se o statistický koncept stacionárních náhodných procesů, což jsou procesy, které jsou bez trendu, mají s měnícím se časem stejný rozptyl a stejný průběh autokorelační funkce. Většina finančních časových řad však tyto vlastnosti nesplňuje, jde tedy o procesy nestacionární, přesto lze při hledání společného chování časových řad využít testování stacionarity.

Obecně platí, že lineární kombinace dvou nestacionárních časových řad vyústí opět v nestacionární časovou řadu. Pokud jsou ale časové řady generovány stejnými nebo velmi podobnými procesy, je možné, že některá lineární kombinace těchto řad vyústí ve stacionární řadu. Základní myšlenkou kointegrační analýzy je tedy nalezení takové dvojice nestacionárních časových řad, jejichž lineární kombinace vytvoří časovou řadu stacionární. Aby bylo možné považovat řady za kointegrované, rezidua z nalezené lineární kombinace řad musejí být stacionární.

Pro časové řady vstupující do analýzy se často, kvůli předpokladům pro použití určitých metod, používají různé transformace jako např. normalizace, logaritmy původních hodnot či klouzavé průměry. Nejznámější metodou pro hledání lineární kombinace je tzv. metoda nejmenších čtverců, lze však využít i tzv. metodu úplných nejmenších čtverců (ortogonální regresi). Testováním stacionarity řady (reziduí) se zabývá mnoho testů jednotkového kořene, nejznámějším zástupcem je ADF test, PP test či KPSS test. Pro kvalitnější rozhodnutí je vhodné provést KPSS test a některý z dalších testů tohoto typu (ADF). KPSS test se od ostatních liší konstrukcí nulové hypotézy (hledá důkazy pro nestacionaritu, zatímco ADF a další pro stacionaritu), pokud se testy shodnou, je velmi vysoká pravděpodobnost, že závěr skutečně platí.

Vedle testování stacionarity reziduí z nalezené lineární kombinace je vhodné provést i prostou analýzu frekvence návratů řady ke své střední hodnotě, resp. doby mezi dvěma protnutími. Výhodou této analýzy je skutečnost, že cílí přímo na konkrétní vlastnost řady, která je z praktického pohledu pro účely párového obchodování nejdůležitější. Nalezená dvojice vykazující stacionaritu reziduí může mít tak nízkou četnost návratů ke střední hodnotě, že pro párové obchodování bude nezajímavá, jelikož u takového páru by bylo nutné držet pozice otevřené příliš dlouhou dobu, což z pohledu řízení rizika může znamenat problém. Stacionarita sama o sobě zde tedy tak silný význam nemá, významnější je spíše jeden z jejích projevů: vysoká četnost návratů časové řady ke své střední hodnotě.

Po nalezení dvojic s vlastnostmi blížícími se ideálním požadavkům (s rezidui z lineární kombinace, která jsou stacionární a mají dostatečně vysokou frekvenci návratů ke střední hodnotě) lze však s jistotou předpokládat, že tyto vztahy nebudou trvat věčně. Za vhodné období pro opakování procesu hledání párů se běžně doporučuje uplynutí 6 měsíců.

Naďa Chalupová

Finanční trhy jsou známé pro svou pravidelnou změnu chování z hlediska velikosti volatility, změny trendů či stagnace a to z důvodu velkého množství kvalitativních i kvantitativních vstupů, které nelze často jednoduše identifikovat. I přesto lze ale nalézt vzory vývoje ceny u některých assetů a s určitou pravděpodobností předpovědět budoucí vývoj ceny a využít této informace pro podporu investičního rozhodování (otevření nebo uzavření obchodní pozice).

Analýzu vzorů chování finančních instrumentů lze rozdělit do tří základních kategorií:

Tyto tři kategorie jsou vzájemně propojeny a doplňují se. Historický průběh cen v sobě obsahuje footprint psychologie davu i fundamentálních informací.

Náš tým aktuálně pracuje na nástroji PatternLab, který dokáže automatizovaně vyhledávat a statisticky vyhodnocovat vzory chování ceny. Pomocí jednoduchého formuláře si uživatel vybere požadovaný vzor a seznam assetů pro analýzy. Vzory jsou rozděleny do několika kategorií – indikace zvýšení volatility, pokračování aktuálního trendu nebo obrat trendu.

Uživatel PatternLab

Uživatelem PatternLab je ten, kdo potřebuje pravidelně v rámci investičního rozhodování využít tvrdá statistická data a nespoléhat pouze na své intuitivní rozhodování. Typickým příkladem je portfolio manažer, který řídí obchodní pozice stovek klientů a jeho rozhodnutí může mít velký dopad na stav obchodních účtů, jeho kredibilitě a další akvizice nového kapitálu.

Příklad použití

Portfolio manažer je v situaci, kdy se rozhodne po 10 měsících uzavřít obchodní pozice na vybraném assetu. Pomocí PatternLabu provede analýzu a dostane statistické vyhodnocení o tom, že pokud obchodní pozici neuzavře ihned, ale počká ještě 5 dní, tak s vysokou pravděpodobností vydělá ještě dvě procenta navíc.

PatternLab může být samozřejmě použit retailovým obchodníkem, makléřem nebo marketingovým oddělením pro snažší komunikaci s klienty při akvizici nebo komunikaci aktuálního stavu obchodních pozic.

Unikátnost

Unikátnost PatternLabu leží v expertním know-how vzorů chování, které jsou výsledkem desetileté aplikace v procesu investičního rozhodování. Nejde tedy o přeoptimalizovaný výstup, ale o ověřenou expertní znalosti kombinovanou s pravidelnou statistickou analýzou.

Jan Budík

V dnešním příspěvku se podíváme na to, jak se z výstupů výzkumné činnosti stává uživatelská aplikace.

Aplikace je plánována jako modulární, kde každý modul bude pokrývat nějaký obchodní přístup. Každý modul bude mít formalizovaný výstup definovaný danou obchodní strategií: backtest a detailní analýzu (s grafy a metrikami). Uživatel si tak může vytvořit vlastní strategii volbou vstupních parametrů.

Jedním ze zmíněných obchodních přístupů je Relative value, který je založen na sázkách na konvergenci v případě, že se zvětší nesoulad mezi podobnými nebo stejnými akciemi. To znamená vyhledání příležitosti využít odchylek v ceně nebo poměru stejných nebo podobných cenných papírů. Předpokládá se, že rozdíly jsou pouze krátkodobé a že poměr cen se brzy vrátí zpět na původní (normální) míru. Fondy s relativní hodnotou jsou vnímány jako zajištěné fondy, jelikož neobchodují pouze cenu určitého cenného papíru samostatně a strategie, která využívá cenových nesrovnalostí, je koupit jeden cenný papír (považovaný za podhodnocený) a prodat druhý (považovaný za nadhodnocený) ve formě párového obchodování.

Uživatel (správce fondu) vytvoří tento druh obchodní strategie v několika základních krocích:

Přijetím této univerzální metodiky vznikne řada otázek a aplikace by měla umožnit správci fondu je vyřešit.

Není pochyb o tom, že fáze výběru vhodných párů je rozhodující. Potenciální správce fondu musí najít dva cenné papíry, které jsou dostatečně podobné. Ve fázi přípravy dat pro tuto analýzu je nutné zabývat se problémy jako:

Dalším krokem v procesu výběru párů je provést vlastní analýzu připravených dat. Zde jsou otázkami hlavně:

Po rozhodujícím kroku výběru párů následuje obchodní část strategie. Jde o určení obchodních signálů, tj. definici pravidel řešících problémy, jako jsou:

Naďa Chalupová

Hledáme odborníky pro kontrolu výstupů naší „umělé inteligence“, která analyzuje tisíce textových recenzí k nejrůznějším výrobkům.

O co jde

Na obrovském množství nestrukturovaného textu (recenze, odborné články, testy) provádíme textovou analýzu, prostřednictvím které identifikujeme stěžejní diskutovaná témata (vlastnosti výrobků) a následně sentiment (jak jsou tyto vlastnosti uživateli hodnoceny).

Na níže uvedeném příkladu je například analyzováno 914 recenzí v českém jazyce a je vidět, že uživatelé se nejvíce vyjadřuji k funkcím/režimům fotoaparátu (celkem 86 názorů). Zároveň je vidět, že uživatelé nejlépe hodnotí výklopný/dotykový display (49 pozitivních recenzí a pouze 4 negativní).

K čemu Tě potřebujeme?

V prototypu zobrazujeme pouze agregované výstupy analýzy, kterým předchází samotná identifikace vlastností a určení sentimentu.

Ne vždy se náš software musí trefit a abychom výsledky stále zlepšovali, potřebujeme zpětnou vazbu od odborníků v daných oblastech.

Aktuálně hledáme pomoc především v oblasti fotoaparátů a mobilních telefonů. Postupně budeme ale přidávat další oblasti. Pokud Tě náš produkt zaujme, budeme rádi, když se nám ozveš a ihned jak se začneme zabývat Tvým tématem, budeš mít informaci z první ruky a třeba náš software rovnou využiješ 😊.

Jiří Fuchs

Martinovou hlavní rolí je identifikace vhodných příležitostí na trhu a komunikace s výzkumným týmem, tak aby produkty odpovídaly tržním potřebám. Martin vystudoval Univerzitu obrany, Fakultu ekonomiky a managementu a Masarykovu univerzitu, obor Právo a mezinárodní obchod. Martin má jedinečnou kombinaci znalostí z oblasti marketingu, obchodu, odborných IT znalostí a zkušenosti s řízením lidí.

  +420 777 551 594
  martin.vokral@cyrrusadvisory.cz
 Martin Vokřál

Projekty

Electronic Quotient SystemMulticriterial text analysisFinancial research software

Michal je vedoucím vývoje v oblasti datové analýzy. Absolvoval Vysokou školu ekonomickou v Praze, fakultu informatiky a statistiky. V rámci své VaV činnosti se věnuje datové analýze, bayesovské statistice, či modelování časových řad.

  +420 774 372 831
  michal.dufek@cyrrusadvisory.cz
 Michal Dufek

Projekty

Electronic quotient systemFinancial research software

We will inform you about the milestones we have achieved in analyzing text reviews. Let’s take a look at our research.

Motivation

Our team is currently working on a project to help make decisions about buying different products. A huge amount of opinions and reviews of individual products can be found on the Internet.
These user reviews are distributed across a variety of discussion forums, product rating sites, or specific portals. For a regular user, it’s difficult to find the information needed, get a look at them, and make its own opinion.

Methodology

In order to analyze large amounts of unstructured data, we have decided to use machine learning methods. We want to use these data to identify topics that are important to users and to determine their positive or negative attitudes towards individual product features.

Current status

We are currently working on creating crawlers for downloading user reviews and articles about the selected product group. These crawlers are tailored to the structure of specific sites. Crawlers from these sites get relevant data that can help in analyzing themes and attitudes. So far, we have created eight crawlers, which have helped us to download about half a million user reviews and expert articles about two thousand products in two languages ​​(Czech and English).

Problems solved

We had to deal with several issues when acquiring the data. One of the main ones is the different way of labeling products on different sites. Although it is an identical product, there are differences in names that complicate product pairing. Another problem is limiting the number of accesses to some sites in the form of code captcha. The last issue that needs to be solved is the changing web structure that causes crawlers to fail.

Conclusion

We have a practically closed first phase of the project in which we have defined the task of creating data acquisition tools for subsequent analysis. In the next phase, using machine learning methods, we will work to uncover the topics discussed and attitudes of users.

Jan Přichystal