![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/ky7aV/btsugQUOK89/2bqKooaK779jeMj3xxlbhK/img.png)
Intro Collaborative Filtering 은 크게 봤을 때 neighborhood method와 latent factor models 2가지로 나눌 수 있음 neighborhood method는 user들 끼리 or item 끼리 유사도를 측정해서 유사한 선호도를 가지는 item의 추천을 진행하는 방식이었다면, latent factor model은 관찰된 데이터 속에서 잠재되어 있는 유저와 아이템의 특성을 뽑아내서 유사한 정도를 파악하고 추천을 진행하는 방식이라고 볼 수 있음! Matrix Factorization 행렬 분해 Interaction Matrix ( 상호작용 행렬 ) 각 유저가 아이템에 대해 매긴 평점, 혹은 구매/클릭 여부를 나타낸 행렬 → 유저의 직접적/간접적인 선호가 드러나..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/oMgMV/btstG6ja1HY/4U6LEYLBYG0ViSxMdwl1x0/img.png)
💡 대규모의 데이터 처리시, 각 레코드 하나하나를 다루기는 쉽지 않음 → 대량의 데이터를 집계하고 몇가지 지표를 사용해 데이터 전체의 특징 파악하기! - 데이터 집약 : 평균, 최대 최소,,, 통계 지표 출력 → 윈도 함수를 사용해 순서를 고려하는 처리, 여러개의 레코드를 대상으로 하는 처리 - 데이터 가공 : 테이블 형식이 집계에 적합하지 않은 경우 어떻게 테이블을 가공해야 하는지! 1. 그룹의 특징 잡기 집약 함수 : 여러 레코드를 기반으로 하나의 값을 리턴하는 함수 ex) COUNT(), SUM() 테이블 전체의 특징량 계산하기 COUNT : 지정한 컬럼의 레코드 수 리턴 DISTINCT : 중복을 제외하고 수를 세워줌 SELECT COUNT(*) AS total_count , COUNT(DISTI..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/miKL1/btssgHmzRE3/VuK8VJ2tyrDDQJTzcAGeG1/img.png)
- 컨텐츠 기반 필터링 - 협업 필터링 - 하이브리드 필터링 협업 필터링 vs 컨텐츠 필터링 "너가 좋아했던 그거, 그거 찾던 애들은 이것도 찾던데? " vs "너 그거 좋아했으니, 그거랑 비슷한 이것도 좋아할 거야!" 컨텐츠 기반 필터링(Contents - Based Filtering) "너 그거 좋아했으니, 그거랑 비슷한 이것 도 좋아할 거야!" 컨텐츠 필터링 구현 절차 1) 피처 추출 - 아이템의 유사성을 계산하기 위해, 아이템의 특성을 추출 - 상품의 특징을 담은 tabular feature 사용하거나, 텍스트의 경우 TF-IDF 기법 적용 2) 사용자 프로필 정보 생성 - 유저의 선호도를 나타내는 역할 수행 - 유저가 상호작용한 아이템의 특징을 집계하여 생성 3) 유사도 계산 - 아이템과 사용자..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/cmaJi1/btssinVr7FX/BM0w9RKhfoHcIAhDS66x40/img.png)
- 추천시스템이란 - 추천시스템의 제약 사항 - 추천시스템 파이프라인 - 고전 추천 알고리즘의 종류 - 연관 규칙 추천 추천시스템의 개요 추천 시스템? 유저와 아이템의 주변 정보와 상호작용 기록을 바탕으로 유저가 선호할 아이템을 예측하여 유저의 의사결정을 돕는 인공지능 서비스 User : 서비스를 이용하는 주체 Item : 서비스에서 판매 / 제공하는 대상 물품 Interaction / log : 서비스 내에서 유저가 남기는 일련의 행동 기록 → 유저에게 유관한 정보만을 Filtering 해줌으로써 Information Overload로부터 도움! → 추천시스템은 커머스/ 컨텐츠 / POI 등의 어플리케이션에서 널리 사용되며 유저의 리텐션을 확보함으로써 기업의 직간접적인 수익창출에 기여 추천시스템의 한계..
- Total
- Today
- Yesterday
- WHERE문 집계함수
- 이코테
- 하이브리드 필터링
- 연관규칙분석
- 다중 GROUP BY
- 고전적 추천 알고리즘
- 알고리즘
- matrix factorization
- 다이내믹프로그래밍
- 여러개 값에 대한 조작
- 숨겨진조건
- SQL레시피
- cold-start
- groupby 다중
- ORDER BY LIMIT
- SELECT문 안 서브쿼리
- SQL
- NULL AS
- SASRec
- 콘텐츠 기반 필터링
- 추천시스템
- SET문
- IFNull()
- 하나의 테이블에 대한 조작
- 협업 필터링
- Lagrange Multipler
- 라그랑주 승수법
- 서브쿼리
- NULL인 열 만들어주기
- WHERE절서브쿼리
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |