입력 데이터

문제
다음 중 의사결정나무의 분할 기준인 지니 지수와 엔트로피에 대한 설명으로 가장 적절하지 않은 것은?
보기 문제 이미지
  1. 선택지 1 이진 분류에서 지니 지수의 최대값은 1이고 엔트로피의 최대값은 0.5이므로, 엔트로피가 지니 지수보다 불순도 변화에 더 민감하다.
  2. 선택지 2 CART 알고리즘은 지니 지수를, C4.5/C5.0 알고리즘은 엔트로피 기반의 정보 이득비를 분할 기준으로 사용한다.
  3. 선택지 3 엔트로피는 로그 연산을 포함해 지니 지수보다 계산량이 많을 수 있으나, 두 기준에 따른 모델 성능 차이는 크지 않은 경우가 많다.
  4. 선택지 4 정보 이득은 부모 노드의 엔트로피에서 자식 노드 엔트로피의 가중합을 뺀 값으로, 값이 클수록 분할 효과가 크다.
정답
1
해설

문제 최종 검수

BG 빅데이터 모델링 정형 데이터 분석기법 분류 분석
10185번
문제
보기

입력된 내용이 없습니다.

선택지1
선택지2
선택지3
선택지4
정답
키워드
해설
비기봇 해설
1차 검수 상태 :