준나이의 블로그

  • 홈
  • 태그

Data Science/Statistics 1

resampling으로 imbalanced data(불균형 데이터 문제) 해결하기

Resampling으로 imbalanced data(불균형 데이터 문제) 해결하기 imbalanced data : 데이터 내 각각의 class들이 차지하는 데이터의 비율이 균일하지 않고 한쪽으로 치우친 데이터 major class : dataset 내에서 상대적으로 다수를 차지하는 class minor class : dataset 내에서 상대적으로 다수를 차지하는 class imbalanced data와 같은 문제에 처했을 때 보통 classification algorithm의 성능을 향상시키거나, 학습 전에 resampling을 통해 training set내의 클래스를 균형을 맞춘다. 보편적으로 이 중에서 후자가 선호된다. Resampling 방법은 dataset 내에서 minor class의 비중을 ..

Data Science/Statistics 2018.12.06
이전
1
다음
더보기
프로필사진

준나이의 블로그

  • 분류 전체보기 (37)
    • Data Science (20)
      • Neural Network (5)
      • Basic ML (2)
      • NLP (5)
      • Paper Review (7)
      • Statistics (1)
      • Hadoop (0)
    • IT (17)
      • NoSQL (0)
      • Python (3)
      • AWS (0)
      • linux (5)
      • Elasticsearch (9)

Tag

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바