네이버 영화 리뷰와 평점 기반으로 학습하여 새로운 리뷰의 평점을 분류(예측)하는 문제입니다.
Dataset: 16_tcls_movie
- 데이터 소스 : 네이버 영화 사용자 리뷰 데이터
- 데이터 특성 : 영화 54,183편에 대한 사용자 리뷰 및 평점 데이터
- 영화 평점(label) : 0 ~ 10점
- # of data
- train : 약 10.5M
- test : 약 1.3M
Text | Label |
---|---|
사람들 평점이 좋아 기대됨 | 7 |
이런 대작을 결코 놓쳐서는 안된다. 음악도 너무너무 좋다~ | 10 |
이런 배우들로 이런 퀄리티를 내놓다니. 이건 죄악아닌가? | 1 |
어느 누가 과연 마지막 장면에 미소 짓지 않을 수 있으리오...... | 9 |
베이스라인 모델 학습 시작
nsml run -d 16_tcls_movie -e main.py
/~https://github.com/lime-robot/product-categories-classification