ㅈPseudo coding: (국문)영화 데이터 리뷰 -> 감정 분석(긍정, 부정, 중립) 1.크롤링 2.전처리 : 문자만 가져오기, Null, 라벨링 / 데이터 분리(테스트, 트레이닝) 3.토큰화(Konlpy) : 1.사전만들기 1.딕셔너리 형태, k-v, 단어-형태소, 인덱스-단어) 2.불용어제거 1.불용어 리스트 : 1.명사: 직접 만들기 2.형태소분석을 통해서 어미, 조사, .!” 그런거 제거 2.For문을 돌면서 불용어에 포함되지 않으면 새로운 사전에 넣는다 4.벡터화 1.카운트 : CountVecector(BoW), TfIDF 2.예측 : Word2Vec, FastText 3.카운트 + 예측 : Glove 4.(정답값) : One-hot 5.모델링 1.분류 모델 : RandomForestCla..