게시판

자료실Institute for Health and Environmental > 게시판 > 자료실
 


제목 기계 학습을 활용한 인터넷 트래픽 시계열 분석_3권 1호. 35-51 등록일 21-03-30 17:37
글쓴이 관리자 조회 525
요약문

본 논문은 시계열 데이터인 인터넷 트래픽 데이터를 기계 학습에 적용하는 방법론을 연구한다. 시계열 데이터는 자기상관성 특징을 가지고 있기 때문에 기계 학습 기법에 적용시키기 위해서는 적절한 데이터 변환이 필요하다. 따라서 인터넷 트래픽 데이터의 특징을 탐색하여 새로운 데이터를 생성하였다. 그리고 시계열의 데이터의 구성요소에 따라 분해하였다. 추세성분은 ARIMA기법으로 예측하고, 나머지 성분과 계절 성분은 기계 학습기법으로 예측하였다. 적용된 기계 학습 모형은 Random Forest, Gradient Boost Machine, CART 회귀나무 그리고 Automl이다. 이에 따른 결과로, 모든 기간별 예측에서 시계열의 각 구성요소에 따른 분해하여 학습하는 것이 예측 성능이 더 좋은 것을 확인하였다. 그리고 Dynamic harmonic regression모형과 성능을 비교해 본 결과, 장기 예측에서 본 방법론이 우수한 성능을 보였다.

주요용어: 인터넷 트래픽, 시계열 구성요소, 기계 학습, 시계열, 자기상관성, Dynamic Harmonic Regression.

 
 

주소: 서울특별시 동작구 흑석로 84 중앙대학교 305관 903호 ㅣ TEL:02-820-6417 l E-mail : AICHEN6417@gmail.com
copyrightⓒ2017 미래융복합건강환경연구소 all rights reserved.
Quick menu