RSC01 - 추천 시스템 개론
추천시스템 평가 방법
오프라인 평가
: 배포전에 이루어짐

-
Leave one last : 마지막 구매를 test set으로, 2번째를 valid set으로
-
Temporal User/Global split

- Random Split

- User split

- K-fold cross validation

- Time series cross validation


- 예측 알고리즘 평가 지표

1) 평점 예측
- Root Mean Squard Error

- Mean Absolute Error

2) 랭킹 예측

- Precision@K : $A/(A+C)$
-
Recall@K : $A/(A+B)$
- AP@K (Average precision)

(m : 사용자가 반응한 아이템 갯수 / rel(i) : item의 i 와의 relevance score를 의미)
- MAP@K(Mean Average Precision)

| ( | U | : 유저 수) |

- Hit rate

특성 평가 지표
- Coverage : 전체 아이템 중 추천시스템이 추천하는 비율

- Novelty : 새롭고 흔하지 않은 추천

- Personalization

- Serendipity : 만족스러운 뜻밖의 항목 추천 (점수 내기 힘들기 때문에 온라인에서 주로)

- Diversity

온라인 평가
: 실제로 테스트 하면서 기존 것과 A/B 비교

댓글남기기