기본 콘텐츠로 건너뛰기

令和5年5月3日気になるニュース

yahooニュース 産経新聞、首相「腹を割って意見交換」 7、8日に訪韓し尹大統領と会談  岸田文雄首相は1日(日本時間2日)、7~8日の日程で韓国を訪問し、尹錫悦(ユン・ソンニョル)大統領と会談する方向で調整(ちょうせい)していると明らかにした。訪問先(ほうもんさき)のガーナで記者団の取材に答えた。首相は尹氏が3月に来日(らいにち)した際(さい)、首脳同士が相互(そうご)に訪問する「シャトル外交」の再開(さいかい)で合意(ごうい)しており、その第1弾(いちだん)となる。 続いて、日本政府は4月28日に韓国を輸出手続き簡略化などの優遇措置の対象国となる「グループA(旧ホワイト国)」に再指定(さいしてい)する方針を発表したが、首相の訪韓(ほうかん)で成果(せいか)を示(しめ)せるかが焦点(しょうてん)になると書いていました。 日韓関係が改善されているようでうれしい記事でした。

Moving Average

In statistics, a moving average is a calculation used to analyze data points by creating a series of averages of different subsets of the full data set. In finance, a moving average (MA) is a stock indicator that is commonly used in technical analysis.

Let find Moving Average Line followed by previous market stock prices.

Module Import

from urllib.request import *
from bs4 import *
import requests
import re
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

in previous analysis (ref. https://tomtomplace.blogspot.com/2022/05/web-crawling.html), we've already get object variable 'pList', which is closing market stock price of Samsung electronic, and now we used to its data, we are going to make moving average price using Queue ADT.

Queue ADT

Queue is a linear data structure in which the insertion and deletion operations are performed at two different ends. In a queue data structure, adding and removing elements are performed at two different positions. The insertion is performed at one end and deletion is performed at another end. (ref. btechsmartclass) We can find 5 days moving average price using following method :

numMA_5 = 5
  mList_5 = []
  Q_5 = []
  mSum_5 = pList[0] * numMA_5
  for i in range(numMA_5) :
      Q_5.append(pList[0])
  for M in pList :
      mSum_5 = mSum_5 - Q_5.pop(0)
      mSum_5 += M
      mList_5.append(mSum_5/numMA_5)
      Q_5.append(M)

numMA_5 is a number how much interval days we want to set, mList_5 is such container saving average price analyzed, and Q_5 is temporary container to make average price. As using similar method, we can make 20 days moving average price and its of 60 days to use following codes :
def makeMA(pList):
  numMA_5 = 5
  mList_5 = []
  Q_5 = []
  mSum_5 = pList[0] * numMA_5

  numMA_20 = 20
  mList_20 = []
  Q_20 = []
  mSum_20 = pList[0] * numMA_20

  numMA_60 = 60
  mList_60 = []
  Q_60 = []
  mSum_60 = pList[0] * numMA_60

  for i in range(numMA_5) :
      Q_5.append(pList[0])
  for i in range(numMA_20) :
      Q_20.append(pList[0])
  for i in range(numMA_60) :
      Q_60.append(pList[0])

  for M in pList :
      mSum_5 = mSum_5 - Q_5.pop(0)
      mSum_5 += M
      mList_5.append(mSum_5/numMA_5)
      Q_5.append(M)

      mSum_20 = mSum_20 - Q_20.pop(0)
      mSum_20 += M
      mList_20.append(mSum_20/numMA_20)
      Q_20.append(M)

      mSum_60 = mSum_60 - Q_60.pop(0)
      mSum_60 += M
      mList_60.append(mSum_60/numMA_60)
      Q_60.append(M)

  drawGraph(pList,mList_5,mList_20,mList_60)

  return mList_5, mList_20, mList_60
makeMA() is the function which makes moving average price whose interval is 5, 20, 60 days.

Visualization

To visualize our analyzed data, we need to make the function who draw a graph. From the above code, the function named drawGraph is chain-function which is make MA price graph.

def drawGraph(pList,mList_5,mList_20,mList_60):
graph = pd.Series(pList, index=range(len(pList)))
  graph_m5 = pd.Series(mList_5, index=range(len(pList)))
  graph_m20 = pd.Series(mList_20, index=range(len(pList)))
  graph_m60 = pd.Series(mList_60, index=range(len(pList)))
  plt.style.use('seaborn')
  plt.plot(graph, label = 'stock price')
  plt.plot(graph_m5, label = '5MA')
  plt.plot(graph_m20, label = '20MA')
  plt.plot(graph_m60, label = '60MA')
  plt.legend(loc = 'upper left')
  plt.xlabel('Days')
  plt.ylabel('Price')
  plt.grid(True)
  plt.show()

The bottom image is following result.


댓글

댓글 쓰기

이 블로그의 인기 게시물

Random Forest 파헤치기

Random Forest Random Forest Random Forest는 weak Learner로 Decision Tree를 이용하는 일종의 bagging Algorithm이다. (배깅 학습기라는 뜻은 아니다) Machine Learning 분야에서 Support Vector Machine과 같이 가장 많이 사용하는 분류모형 중 하나이다. Random Forest Class는 다음 특징을 가진다. Keyword Argument의 대부분은 DecisionTreeClassifier와 같다. Random Forest에서 Tree의 수가 많아질수록 예측에 유리하지만 시간이 많이 걸리고, 한계적인 이득은 체감한다. Random Forest의 Base Model로는 보통 Deep Tree를 많이 사용한다. Shallow tree는 상대적으로 분산이 작지만 상당한 편의를 발생시킨다. 반면 Deep Tree는 분산이 큰 반면 편의가 작으므로 여러 결과의 평균을 예측에 사용하면 분산을 줄이는 효과가 있다. Random Features Random Forest는 훈련 과정에서 무작위로 추출한 Feature Set만을 사용한다. 이는 모형들 사이의 Correlation을 감소시킨다 Missing Value와 관련된 문제를 효과적으로 완화시킨다. 오늘은 Random Forest와 Decision Tree의 기본 구조를 알고 있다고 가정하고 Keyword Argument 중 중요한 것들을 중심으로 소개하고자 한다. class_weight {class_label:weight} 형식의 클래스와 연결된 가중치이다. 만약 주어지지 않는다면, 모든 Class는 하나의 가중치로 되어 있다. 다중 출력 문제의 경우 dict 목록을 y 열과 같은 순서로 제공할 수 있다. 다중 출력(다중 레이블 포함)의 경우 자체 dict의 모든 열의 각 클래스에 대해 가중치를 정의해야 한다. 예를 들어 4개 클래스의 다중 레이블 분류 가중치는 [{1:1}, {2:5}, {3:1}, {4:1} 대신 [{...

Team Q Research

  Q research Naver blog Qraft에 계신 선배님과 서강대학교 학부생이 함께 만든 퀀트 리서치 팀입니다. 주로 Machine Learning과 Quantitative Finance 분야를 다루며, 최근 연구 분야는 ML분류기에서 나온 Accuracy를 확률로써 해석하기 위해 Probability Calibration을 통해 보정하고, Bet size를 정하는 Secondary Model로써 활용하는 것을 연구중입니다. 이외에도 Machine Learning 분류기와 Neural Network를 사용하여 투자 집행에 도움이 되는 실전 전략 연구를 수행하고 있습니다.

Portfolio Analysis, Mean Variance Frontier

  포트폴리오 이론에서의 기대수익률     포트폴리오 기대수익률은 개별 자산의 기대수익률의 가중치를 고려하여 만든 포트폴리오의 기대수익률이다 mean - variance space     자산 투자에 있어서 기대수익률을 위해서는 투자의 리스크를 감수해야 한다. 즉, 위험 한 단위가 증가할 때 기대수익률 또한 증가한다. Indifference Curve     Risk Averse의 성향이 많은 개인 투자자는 위험에 대해 기피하는 경향이 있다. 따라서, 위험 한 단위가 증가할 때마다 기대수익률을 더 많이 받으려고 하는 경향을 보인다. 따라서 무차별 곡선은 우상향하며, 기울기는 체증한다. 반면, Risk lover의 Indifference Cuve의 기울기는 체감한다. Portfolio Risk     포트폴리오의 리스크는 각 자산의 기대수익률간의 편차로 계산한다.  Example     2000년 1월부터 2020년 12월까지 기간동안 고려한 자산은 다음과 같다 스페인 국채 10년물  KOSPI 주가지수 S&P 주가지수 원유 선물 천연가스 선물 금 선물 구리 선물 import numpy as np import pandas as pd import matplotlib.pyplot as plt % matplotlib inline csv data의 변수명은 다음과 같이 정의한다 data : 수익률 데이터 cycle : 경기순환 사이클 데이터  import한 데이터는 다음과 같이 세가지 형식으로 분류한다 df = pd . concat ([ data . iloc [:, 1 :], cycle . iloc [:, 1 :]], axis = 1 ) # 전체 데이터 df_up = df [ df . cycle == 1 ] # 경기 확장기의 데이터 df_down = df [ df . cycle == 0 ] ...