최대 1 분 소요

추천시스템 평가 방법

오프라인 평가

: 배포전에 이루어짐

image-20221024111203938

  1. Leave one last : 마지막 구매를 test set으로, 2번째를 valid set으로

  2. Temporal User/Global split

image-20221024111648141

  1. Random Split

image-20221024111736803

  1. User split

image-20221024111810796

  1. K-fold cross validation

image-20221024111844915

  1. Time series cross validation

image-20221024112033085

image-20221024112143143

  1. 예측 알고리즘 평가 지표

image-20221024112213281

1) 평점 예측

  • Root Mean Squard Error

image-20221024112445653

  • Mean Absolute Error

image-20221024112451324

2) 랭킹 예측

image-20221024115705730

  • Precision@K : $A/(A+C)$
  • Recall@K : $A/(A+B)$

  • AP@K (Average precision)

image-20221024130508454

(m : 사용자가 반응한 아이템 갯수 / rel(i) : item의 i 와의 relevance score를 의미)

  • MAP@K(Mean Average Precision)

image-20221024130531595

( U : 유저 수)

image-20221024131856235

  • Hit rate

image-20221024133014461

특성 평가 지표

  • Coverage : 전체 아이템 중 추천시스템이 추천하는 비율

image-20221024133356429

  • Novelty : 새롭고 흔하지 않은 추천

image-20221024133433243

  • Personalization

image-20221024133455785

  • Serendipity : 만족스러운 뜻밖의 항목 추천 (점수 내기 힘들기 때문에 온라인에서 주로)

image-20221024133542045

  • Diversity

image-20221024133620736

온라인 평가

: 실제로 테스트 하면서 기존 것과 A/B 비교

image-20221024133748303

댓글남기기