이번 주제는 Spooky Author Identification 이다. 공포이야기가 쓰여진 책의 문장의 단어를 분석하여 작가를 예측하는 모델을 구현 한다. 제출은 id(문장에대한 고유한 id) 별로 3명의 작가에 대한 각각의 확률을 구한다. id, EAP, HPL, MWS id07943,0.33,0.33,0.33 ... Abhishek Thakur님의 Approaching (Almost) Any NLP Problem on Kaggle 를 참고하여 자연어 분석어를 진행하였다. 이제 차근차근 따라가 봅시다. 1. 데이터 준비 In [61]: import pandas as pd import numpy as np import xgboost as xgb from tqdm import tqdm from sklear..