Skip to content

농산물 가격 예측 모델(XGBoost, LightGBM, RNN, LSTM) 간 성능비교

Notifications You must be signed in to change notification settings

jiyeonnn03/Agricultural-Prices-Prediction

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

31 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

농산물 가격 예측 모델 성능 비교

Model

  • XGBoost
  • LightGBM
  • RNN
  • LSTM

분석 Flow

1. 데이터 수집

  • 나라지표, 기상청, 공공데이터포털, 농넷 제공 데이터 병합 image

2. 데이터 전처리

  • 이상치 제거(하루 전/후 가격 차이가 매우 큰 데이터를 이상치라 판단하여 제거)
  • 결측값 평균 대체(주말/공휴일 등 거래가 없는 날, 하루 전/후 평균 가격으로 대체)
  • 정규화(MinMaxScaler)
  • 데이터 분할(window size = 7)
  • 최종 데이터 구조 image

3. 모델 학습

4. 교차 검증

  • 시계열 데이터 속성을 고려해 Time Series Split 사용

    image

5. 결과 해석

  • Fold별 가격 예측 결과 image

  • 모델 성능 비교 image

  • 모델 성능 순위 image

  • 모델 성능 비교 결과 RNN > LGBM > XGB > LSTM 순으로 성능이 우수함을 확인

  • XGBoost 변수 중요도 비교 결과, 유류 가격과 물가가 가격에 미치는 영향이 컸음

6. 한계점 및 후속 연구

  • 전체 데이터의 수가 적어 변동 요인 추세 변동 , 계절 변동 , 순환 변동 , 불규칙 변동 ) 파악 어려움 -> 더 많은 양의 데이터셋을 수집 해 변동 요인 파악이 가능할 것으로 보임
  • 하루 사이 가격 변동 이 크게는 몇천원까지 발생하기도 함 -> 가격을 1000 원 단위로 라벨링하여 회귀 문제로 접근하지 않고 분류 문제로 접근해보는 것도 흥미로운 결과를 도출해낼 수 있을 것으로 보임
  • 딥러닝 모델에서 가격에 영향을 미치는 주요인 파악의 어려움 -> 모델에서 변수 중요도를 제공하지 않는 경우, XAI 모델을 통해 각 변수의 영향력 정도를 파악할 수 있을 것으로 보임
  • 앙상블 을 통한 더 나은 모델 -> 성능이 좋은 부스팅 모델 + 딥러닝 모델을 앙상블 하여 새로운 결과를 도출

About

농산물 가격 예측 모델(XGBoost, LightGBM, RNN, LSTM) 간 성능비교

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published