겨울방학동안 데이터 청년 캠퍼스를 하면서 미니 프로젝트로 '네이버영화리뷰를 통한 핫 키워드 추출'을 하고있다. 모티브는 내가 진짜 좋아하는 드라마 스토브리그에서 구단에 사건에 생길때마다 네티즌들의 반응을 분석하고 시각화해서 아래와 같이 보여주는데, 나도 해보고 싶었음. 그래서 주제를 냈는데 팀플로 하게 되었다. 근데 어떤 사건에 대한 네티즌 반응을 구하는게 쉽지는 않았다. 어디서 어떻게 모을거냐구ㅠㅠ 그래서 스토브리그처럼 하는 건 너무 어려울 것 같았고, 대신 긍/부정이 명확하고, 뽑아낼 수 있는 감정표현이 다양한게 없을까 생각하다가 리뷰들을 총정리해서 보여주는 게 있으면 좋겠다는 생각을 했다! 활용은 다양하게 할 수 있겠지만 먼저 영화 리뷰를 택했다. (자료가 많으니까 ㅎ) 아무튼 생각하고 있는 목표는..
에러 'utf-8' codec can't decode byte 0xb3 in position 0: invalid start byte 파이썬에서 csv를 불러올때 한글을 인식하지 못 해 생긴다고 한다. data = pd.read_csv('주토피아review.csv', names = ['Review','Rank']) data 해결 encoding인자에 'euc-kr' 이나 'cp949'로 추가해주면 된다. 찾아보니 cp949가 더 범용적이라고 한다! 나도 왜인지 모르겠지만 euc-kr로 하니 오류가 났다. data = pd.read_csv('주토피아review.csv', encoding='cp949', names = ['Review','Rank']) data 잘 나오는구만... 해결!
내 블로그 - 관리자 홈 전환 |
Q
Q
|
---|---|
새 글 쓰기 |
W
W
|
글 수정 (권한 있는 경우) |
E
E
|
---|---|
댓글 영역으로 이동 |
C
C
|
이 페이지의 URL 복사 |
S
S
|
---|---|
맨 위로 이동 |
T
T
|
티스토리 홈 이동 |
H
H
|
단축키 안내 |
Shift + /
⇧ + /
|
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.