입력 데이터

문제
대규모 뉴스 기사 데이터셋에서 TF-IDF를 이용해 주요 단어를 추출할 때, 다음 중 TF-IDF의 성질과 해석으로 가장 적절하지 않은 것은?
보기 문제 이미지
  1. 선택지 1 한 문서에서 자주 등장하더라도, 대부분의 문서에 포함된 단어는 TF-IDF 값이 낮다.
  2. 선택지 2 TF-IDF는 단어의 순서와 문맥을 고려해 문장 의미 차이를 반영한다.
  3. 선택지 3 전체 문서 수가 같을 때, 특정 단어의 문서 빈도가 감소하면 IDF와 TF-IDF 값은 증가한다.
  4. 선택지 4 IDF는 단어가 전체 문서 집합에서 얼마나 희소하게 등장하는지를 나타낸다.
정답
2
해설

문제 최종 검수

BG 빅데이터 모델링 비정형 데이터 분석기법 텍스트 마이닝
10200번
문제
보기

입력된 내용이 없습니다.

선택지1
선택지2
선택지3
선택지4
정답
키워드
해설
비기봇 해설
1차 검수 상태 :