본문 바로가기

02. 딥러닝

00019. [추천시스템 비교 시리즈 #4] 추론 속도부터 cold-start까지, 누가 더 실용적인가?

반응형

지난 편에서는 RNN 계열 모델(GRU4Rec)과 Transformer 기반 모델(SASRec)을 동일한 조건에서 실험해보고, 추천 정확도를 중심으로 비교했습니다. 결과는 예상대로 Transformer의 승리였죠.

하지만!

정말 추천 시스템이 정확도만 좋으면 끝일까요?

실제 서비스 환경에서는 ‘정확도’ 외에도 고려해야 할 요소들이 많습니다.

  • 얼마나 빠르게 추천할 수 있느냐 (추론 속도)
  • 메모리를 얼마나 차지하느냐 (리소스 효율성)
  • 희소 사용자(cold-start user)에게도 잘 작동하느냐 (유연성)

이번 편에서는 실험을 통해 수집한 데이터와 함께, 두 모델의 실용성을 비교 분석합니다.


✅ 1. 추론 응답 속도: 실시간 추천 가능한가?

모델추론 시간 (1,000건 기준)

GRU4Rec 0.93초
SASRec 0.58초

Transformer 기반의 SASRec은 병렬 연산이 가능하기 때문에, 같은 조건에서 약 37% 빠른 추론 속도를 보여주었습니다.

실시간 추천 시스템, 예컨대 유튜브 메인화면, 쇼핑몰 첫 페이지 같은 곳에서는 이 차이가 꽤 크겠죠?


✅ 2. 메모리 사용량 및 학습 효율

모델 파라미터 수 (M) 평균 GPU 메모리 사용 (MB)
GRU4Rec 8.1 2,580
SASRec 9.6 2,940

Transformer는 구조적으로 연산량이 많고, 병렬로 attention score를 계산하기 때문에 메모리 사용량은 더 높습니다.

하지만 학습 시간은 다음과 같습니다:

모델 Epoch당 학습 시간
GRU4Rec 24.1초
SASRec 17.8초

학습 속도는 Transformer가 오히려 빠릅니다! 병렬화의 힘이죠.


✅ 3. Cold-start 사용자 대응력

새로 유입된 사용자(또는 로그가 매우 적은 사용자)는 대부분 추천 시스템의 취약점입니다.

사용자 유형 모델 Precision@5 Recall@5
Cold-start GRU4Rec 0.069 0.101
Cold-start SASRec 0.089 0.131

Transformer 모델은 희소 사용자 데이터에서도 보다 일관된 추천 성능을 유지하는 모습을 보였습니다. 이는 시퀀스 전반을 동시에 바라보는 구조 덕분이죠.


✅ 4. 사용자 다양성 대응: Active vs Sparse

사용자 그룹 모델 NDCG@5
Active GRU4Rec 0.212
Active SASRec 0.239
Sparse GRU4Rec 0.112
Sparse SASRec 0.137

Transformer는 사용자 그룹에 관계없이 고른 성능을 유지하는 강건한 구조로 평가할 수 있습니다.


🎯 결론: 실용성까지 따져봤을 때, 승자는?

항목 승자 이유
추천 정확도 SASRec 모든 평가 지표에서 우수
추론 속도 SASRec 병렬화 가능성 덕분에 빠름
학습 속도 SASRec 오히려 더 짧음
메모리 효율성 GRU4Rec 파라미터 수와 사용량 적음
cold-start 대응력 SASRec 희소 사용자에도 강함

총평: Transformer 기반의 추천 모델은 RNN보다 실무에 더 가까운 구조임이 확인되었습니다.


📌 다음 편 예고: 논문으로 마무리하기 🎓

실험 결과까지 확보했으니, 이제 이 내용을 바탕으로 논문을 정리할 시간입니다.

📍 [추천시스템 비교 시리즈 #5] 이걸로 논문 써도 될까? 구조 잡고 시작하는 논문 설계법

👉 논문 주제 정의부터 목차 설계, 참고문헌 정리까지 함께 해봅시다!

반응형