본문 바로가기

Trading Bot( time GAN )

Trading Bot (2주차) - 퀀트란? , time GAN이란?

1. 퀀트란?

 

퀀트(quant) = 계량적인(quantitative) + 분석가(anlayst)의 합성어


== 수학, 통계지식을 이용한 투자법칙 기반 투자모델 생성금융시장의 변화 예측

!= 느낌과 감정에 의한 투자




-> 퀀트란 고도의 수학, 통계지식을 이용해서 투자 법칙을 찾아내고 컴퓨터로 적합한 프로그램을 구축해서, 이를 토대로 투자를 행하는 사람을 일컫는 말로 Quantitative의 줄임말이다.

 

(수학 공식을 주식시장에 적용)

 

어려운 말로 하면,  퀀트는 어떤 금융상품의 *공정가치를 구하는 사람으로 쓰이기도 한다. 학술적 의미에서, 혹은 대학에서 쓰이는 퀀트는 거의 대부분 이러한 직군을 지칭한다.

 

(*공정가치 : 쉽게 말하면 시세, 시세를 회계에서 공정가치라고 함.)

 

 

 

2. 퀀트의 종류

 

셀 사이드(sell side) 퀀트

 

기업이 필요로 하거나 고객이 원하는 상품을 적절히 섞은 상품을 합성하고 파는 전문가

"데스크 퀀트"가 대표적

(투자 은행에서 활동하며 기업이 파생 상품 요구시 그에 맞는 상품 개발)

 

 

 

 

!장단점

장점 : 명확한 통계로 뛰어난 수익 창조

단점 : 컴퓨터에만 의존, 잘못된 맹신

 

 

 

바이 사이드(buy side) 퀀트

 

 

미래 가격이나 가치를 예측하는 모델을 만들고 이것을 토대로 한 투자로 수익을 내는 전문가.


왓다 큰 수익 可 but 직업 안정성 低

 

 

 

뭔가 나에게 와닿게 정리해주신 참고 블로그

 

참고 링크 : brunch.co.kr/@nsung/3

 

 

 

 

 

 

3. GAN의 이해

 

ㄱ. GAN이란?

 

간? 가은이?
no.. nope..!

Generative Adversarial Network이다.


세개네 하나씩 뜯어보자


- Generative : "생성적인, 생산하는" 듯, GAN모델 안에서의 의미는 이미지(여기서는 예측 모델)를 생성한다.

- Adversarial : "적대적인" 이르는 뜻으로, 서로 경쟁하면서 무엇인가를 좋게하는 의미이다. 즉 위의 모델을 만들긴 하는데 서로 경쟁하면서 좋게 만든다 라는 의미.

- Network : 너무 광범위하고... 그냥 넷투워크!

 

ㄴ. GAN의 구조

 

 

출처 : https://towardsdatascience/gan-introduction 부분

 

 

  • Discriminator(판별기) + Generator(생성기)

 

  • Discriminator : 가짜데이터와 진짜데이터를 0과 1로 판별하는 역할
  • Generator : *latent sample(노이즈)를 통해, 가짜 데이터를 생성하는 역할

 

*latent sample 이란?

=> 잠재된 공간에서의 샘플 데이터(정규화된 분포나 균등한 분포를 따름)

 

 

정리잘된 인공지능 신문에

좋은 참고 사진이 있는데, 맘대로 쓰지말라고하고 무단재배포 금지라고 써논거 보니 고소할까봐 못쓰겟다..

(수익 창출 아니어도 쓰면 안되나? 아는새럼?)

드러워서 내가 만듬.

무단 재배포시 딱밤 스무대

 


GAN을 학습시키기 위해 필요한 준비물은 Real Image이다(앞으로 이미지 처리의 예를 들 것이므로 이 data는 Image data라고 가정하자). 즉 G가 모방하게 할 실제 Data Set이 필요하다.
먼저, 우리는 G에게 줄 Random Noise를 생성하게 된다. 이 Noise는 G가 Fake Image를 만들 재료로 쓰이게 된다. 보통 Gaussian Distribution으로 Noise를 생성한다.
G는 이 Noise를 Input으로 받아, Neural Network를 거쳐 Fake Image를 생성하게 된다. 그리고 D는 Fake Image 또는 Real Image를 Input으로 받아 Neural Network를 거쳐 0과 1 사이의 값을 출력하게 되는데, 이 값은 D가 나름대로 판단한 ‘Input이 Real Image일 확률’이다. 즉, 이상적인 D는 Real Image를 받으면 1을, Fake Image를 받으면 0을 출력해야 한다.

이케해서 D와 G를 학습시키는데, D(진또배기 데이터를 넣었을때 출력값)와 Genrator에 가짜데이터를 넣었을 때 나온 값과의 차이를 줄여나가는 것(MInimize)하는 것이다.

 

 

ㄷ. 그런데 이 GAN => Time GAN??

우리가 살고있는 이 세계는 하루 86400초 지금 내가 타이핑하는 중에도 시간이 흘러가고 있다.

 

금융시간의 시간도 흐른다.

 

시간의 흐름에 따라 내가사면 떨어지는 가상화폐 값도 꾸준히 변화한다,..

 

이 GAN을 시계열데이터에서 이상값을 감지하는 딥러닝 기반을 통해서

 

봇을 개발하고자 하는 것이다.

 

예전에 혈당데이터 예측을 하고 자신의 혈당데이터 예측을 제공해준 자에게는 블록체인을 통해 토큰보상을 해주던

Anti Sugar Pee 프로젝트를 진행할 때 LSTM-RNN 을 통해 개발을 했었는데 GAN 기반의 LSTM을 통해서 시계열 데이터의 이상탐지를

진행해야할 것 같기도 하고,,? 아직 잘 모르겠다.

 

Time GAN은 지금 못찾겠어서 조금 더 조사가 필요할 듯하다.

 

 

하지막 목표는 명확하다.

 

비트코인 가격 예측이다. 

가상화페의 가격 예측에서 가장 어려운 부분은 순간 순간 새로운 상황이 벌어진다는 것이다.

그리고 주어진 데이터 상황에서 과연 어떤 시퀀스가 나올 지 예측 해야하는데 그러려면 지금 상황에서 확률 분포가 같지만,

다른 (가장 확률이 높을것으로 예측되는)시퀀스를 Time GAN 개념으로 합성해서 많은 데이터를 확보하여 딥러닝을 사용해서 미래 가격을 예측하는 것이다.

 

 

 

검색을 해보니 이해하기 쉽게 잘 정리해주신 블로그가 있다

ssomu.tistory.com/54

 

[이상탐지] MAD-GAN: Multivariate Anomaly Detection for Time Series Data

시계열 데이터 이상탐지모델 Abstract LSTM-RNN based GAN을 이용해 시계열 데이터의 이상탐지를 진행 DR score를 이용해 이상을 탐지한다. the Secure Water Treatment(SWaT), Water Distribution(WADI) 데이터셋..

ssomu.tistory.com