Připravujeme web AnalyticalPlatform.com. Aneb jak jsme začali zobrazovat výstupy našeho „Financial research software“ týmu nejdříve v rámci wordpressové stránky www.objektivni.info a následně se přeorientovali na komplexní Analytical Platform. (Pokračování textu…)

Sorry, this entry is only available in Angličtina (Usa).

Jak jsme Vás informovali v našich předchozích příspěvcích, náš tým se nezabývá pouze state-of-art technologiemi a researchem obchodních strategií, které využívají hedgové fondy. Do našeho portfolia patří i běžné a relativně jednoduché reportovací a analytické nástroje. Jedním z těchto nástrojů je intuitivní stock screener, který můžete využít k jednoduchému seřazení “nejlepších” titulů dle Vámi navolených preferencí.

Další stock screener?

Většina stock screenerů je založena na tom, že máte k dispozici určitý universe (množinu) aktiv, který prostřednictvím filtrů (které máte k dispozici) prosíváte, dokud Vám nezbydou taková aktiva, která vyhovují předvoleným kritériím. Uživatelskou nevýhodou takového workflow je ten fakt, že potřebujete přesně vědět, co hledáte. Valná většina “hledajících” uživatelů ovšem v počátečním okamžiku neví přesně, dle jaké metodiky svoje výstupy hledá.

Náš stock screener tento fakt respektuje a řeší jej pomocí dvoustupňové klasifikace výstupu.

Jak to funguje?

V našem screeneru nejprve intuitivně volíte priority (technicky vyjádřeno se jedná o filtry), díky kterým vyjadřujete svoje preference (měna investice, riziková averze, investiční horizont apod.). Díky těmto preferencím nadefinujete metodu hodnocení skenované množiny aktiv, a tedy v důsledku Vašeho výběru dojde k nastavení hodnoticího modelu, který škáluje jednotlivé assety do žebříčku.

Black box, o kterém nevím, co uvnitř dělá?

Na výstupu dostanete seznam akcií, které i) vyhovují Vašim prioritám a ii) jsou seřazeny “od nejlepšího” dle hodnocení modelu, který reflektuje Vaše preference. Jednotlivá kritéria obsažená v hodnoticím modelu uvidíte ve výstupní tabulce spolu s ohodnocenými assety.

Nemůže se tedy stát, že byste nevěděli proč a jak model k výsledku došel. Hodnoticí model není pouze transparentní, ale je také libovolně upravitelný prostřednictvím nastavení indikátorů, které komplexní hodnoticí model utváří. Tuto funkci mohou ocenit zejména odborně zdatní analytici, kteří si dle vlastního úsudku přejí určité technické indikátory preferovat, nebo naopak diskriminovat.

Pokud Vás zajímá více o této aplikace, sledujte náš web nebo se na nás přímo obraťte.

Michal Dufek

Sorry, this entry is only available in Angličtina (Usa).

Research & Development team se aktuálně zaměřuje na vývoj obchodních strategií zaměřených na futures kontrakty pro ropu, zemní plyn a zlato. Tyto komodity se obchodují na centralizovaných amerických burzách NYMEX a COMEX a patří mezi nejvíce likvidní, přičemž se denně realizují transakce za miliardy dolarů. Vysoká likvidita a zájem ostatních obchodních subjektů vytváří vhodné prostředí pro implementaci krátkodobých momentových strategií využívajících neefektivity tržního prostředí. Vzhledem k povaze těchto komodit jak z hlediska potřebné volatility, tak i z hlediska struktury samotného finančního instrumentu, který je derivátem využívajícím finanční páku, je vhodné zařazení těchto komodit do výzkumného portfolia.

R&D team vyvíjí a optimalizuje obchodní strategie vycházející z rule-based konceptu, které vykazují pozitivní performance a s určitou pravděpodobností dokáží předpovědět vznik nového krátkodobého cenového momenta.

Implementací moderních technologií pro analýzu performance strategií a souvisejících rizik je prováděn exaktní a přesný výzkum, který dokáže rigorózně otestovat danou strategii. Oproti “zastaralým” technologiím dokáží ty moderní implementovat reálnou exekuci obchodních příkazů založených na skutečně realizovaných obchodech. Výzkumník tak dostává výsledky performance strategie téměř totožné s reálnou exekucí obchodní strategie. Právě při aplikaci zastaralých technologií, které neprováděly simulaci reálného tržního prostředí, docházelo často k výrazně odlišným výsledkům navržené a optimalizované strategie vůči reálné aplikaci.

Vývoj a optimalizace strategií pomocí moderních technologií je jeden z nosných pilířů celého projektu.

Po dokončení vývoje budou strategie pro obchodování ropy, zemního plynu a zlata zařazeny do portfolia, které bude řízeno obchodním konceptem metastrategie založené na chytré alokaci prostředků do jednotlivých strategií.

Myšlenkové workflow:

Jan Budík

Our EQS software, based on the text analysis in services (e.g. “I am looking for a nursery in Brno which takes children as young as 1 year old”), will present the user with appropriate suppliers.

To correctly pair the data, the search algorithm requires a sufficient amount of data for learning. We have approached this problem by creating web crawlers owing to which we received needed data in the Czech language from external sources. However, predominantly, we are creating our own database of all activities located in the Czech Republic.

When creating it, we did not want to be limited only to the set of services (for example, the mentioned nursery or children’s group), nor occupations (teacher, nanny, …) but the aim was to create a complete database of all activities which people can possibly perform. For this reason, we merged mentioned areas and supplemented them with additional activities (for example, “babysitting”, or more detailed “night-time babysitting”).

The primary input for creating the database was the “National System of Occupations” which was further extended by categories from commercial enquiry servers. In this way, we created database areas, or more precisely, type clusters teacher/nanny/teacher assistant (=occupation) + nursery/children’s group (=service) + babysitting/children’s programme (=activity). We collectively refer to these categories as activities.

All activities were supplemented with keywords that are typical for them (children to nurseries, babysitting, …). Since our algorithm attaches the highest weight to keywords, these keywords are far more important than the names of the respective activities, therefore, the above-mentioned clusters are made by a set of words associated with the given activity/areas of activities.

When aggregating keywords, we used both automated and man-made databases and, last but not least, our own descriptions or suggestions of suppliers we have been calling to over the last 6 months to offer them a free presentation of their services on our test portal mojilidi.cz.

The primary database was afterwards published on the above-mentioned website and we started facing the real operation. The ones who were interested in the presentation of their services from any areas, entered a description of their activity to the search bar, for example, “We are running a children’s group in Brno which specialises in ABA therapy, speech therapy or exercising with kids.”

In response to the analysis of the input text, the users are presented with activities which are identified as most relevant (for example Children’s Group, Night Babysitting, Babysitting or wrongly Nutrition Therapist).

Users have an option either to apply to an already existing activity or to edit/add keywords and description regarding their services or add a completely new activity.

Adding a new activity is subject to confirmation by an administrator so that there are not double values such as taking care of a kid / taking care of kids. Considering the principles of the search algorithm, adding new similar activities would not be a problem. However, for tracking statistics or applying to an existing activity with the most relevant keywords, we are trying to approve only entirely new / not yet given activities.

By doing this, we have been complementing our own database over a year. Activities with a higher number of users have a database of the most interesting keywords and phrases which are recommended to users straight away at the registration.

We also track which (and how many) activities include a particular keyword, see keywords listed above. Furthermore, we track the number of competition in individual regions. When comparing results gained from telephone calls with users and also by an analysis of new customers acquired from advertising in particular areas (for example, we are finding out that car repair shops are not interested in registering whereas text proofreaders are highly interested), interesting statistics about individual market segments are being developed.

The picture is related to Project Architect activity.

The database is constantly growing and updating with the ever-growing number of users. Likewise, our search algorithm is getting better and is offering more relevant results. In the following article, we are going to present how we translated our database into English and German and what interesting features have been accomplished by this.

Jiří Fuchs

Na začátku nového roku si náš tým sestavil výhled výzkumných aktivit pro rok 2019 a prostřednictvím tohoto postu bychom Vás rádi seznámili s nejvýznamnějšími milníky tohoto roku. Začátek nového roku patří dokončování prací na implementaci obchodního přístupu Relative Value. Jak dopadly implementační výsledky Vás budeme informovat v některém z následujících postů. Po dokončení tohoto úkolu si výzkumný tým udělá krátkou odbočku na pole trhů se zlatem. Výsledkem této 14 – ti denní zastávky by měl být profitabilní obchodní systém využívající momentum cenového pohybu futures kontraktů.

Po tomto intermezzu se tým ponoří do nové kapitoly optimalizace portfolia a tvorbě metastrategií. Optimalizace portfolia ruled-based strategií je pro tým velkou výzvou jak z technologického tak z obchodního hlediska. Budeme muset sloučit alfu-generující pravidla s o úroveň vyšší problematikou optimalizace (maximalizace zisku vs. minimalizace rizika, respekt k investičnímu horizontu vs. dostupnost dat a technická proveditelnost exekuce apod.). Současně s otevřením této kapitoly bude pokračovat tvorba nástrojů pro jednotlivé obchodní přístupy, které využívají hedgeové a podílové fondy (Fixed Income, Global Macro, Long/Short).

Kromě těchto úkolů čekají tým i další aktivity – na začátku dubna se budou někteří členové účastnit konference Asset Management 4.0 pořádanou Asociací pro komunikační nástroje a internet věcí. V rámci konference se budou členové týmu postupně vyjadřovat k tématům automatizace rozhodovacích a reportovacích procesů, tvorbě matematicko-statistických modelů, optimalizace a řízení rizika.

Další novinkou, která nás tento rok čeká je naše předsevzetí dát Vám zprávu o naši činnosti každý týden prostřednictvím alespoň jednoho postu. V rámci našich postů bychom Vás také rádi informovali o výsledcích naší činnosti, a to včetně výsledků implementace obchodních přístupů. Budeme se těšit na pravidelná setkávání a přejeme vše nejlepší do nového roku.

Michal Dufek

As we mentioned in the previous post, our team is working on a project to help you make decisions about buying different products and services. We try to help users create an objective view of the specific items they want to buy by analyzing published reviews of other users. Currently, we’ve downloaded enough reports and product articles in Czech and English language to analyze individual views. In the first phase it was necessary to adapt the obtained texts to the form suitable for analysis.

It was necessary to divide the documents into individual sentences, because users often present more ideas in one document and evaluate more criteria. The next step was to remove insignificant words that do not bring any or just little information value. For example, clutches, prepositions, web addresses, and so on. In this step, we also used our own POS analyzer, which assigns the words in sentence word types, and our own dataset with stop words. In particular, nouns, adjectives and verbs were interesting for us. Subsequently, we worded the words into their basic shapes, by specifying the roots of words.

We have transformed the edited documents into vector shape using tf-ifd and then split them into clusters with the same themes using k-means methods. We have managed to identify approximately diversified clusters with a high degree of internal integrity. Identified topics were related to the main parameters of the product segment surveyed.

The clusters created for the whole segment, based on expert articles, were then used to classify product reviews. From identified clusters for individual reviews, we chose those with the highest predictive value – and are presented as a suitable representative for a given set of reviews. The result of the analysis is shown in the example below.

Jan Přichystal