아빠는 개발자

[tensorflow 2] Text embedding A/B TEST - 2 본문

Python/Text embeddings

[tensorflow 2] Text embedding A/B TEST - 2

father6019 2024. 8. 19. 21:51
728x90
반응형

tensorflow embedding A/B 테스트

tensorflow embedding 모델을 2가지 방법으로 색인해서 테스트해 본다.

 

A : https://tfhub.dev/google/universal-sentence-encoder-multilingual-large/3"
B : https://tfhub.dev/google/universal-sentence-encoder-multilingual/3"

위의 두개를 테스트 해보았으나.. 뭐가 낫다고 판단 할 수가 없어 색인 방법으로 테스트를 다시 해 봄

 

모델은 라지 형님

#모델 API 
https://tfhub.dev/google/universal-sentence-encoder-multilingual-large/3"

CASE A

상품명(name) 으로 vector 를 추출

name = [doc["name"] for doc in docs]

 

CASE B

상품명(name) 과 카테고리(category) 를 조합하여 vector 를 추출

name = [[doc["name"], doc["category"]] for doc in docs]

 

검색어 : 루이비통 여성
CASE A :
name: 루이 비통 모노그램 종크, category: 패션잡화 주얼리 팔찌 패션팔찌, score: 1.5737112
name: 루이 비통 삭 쾨르 M58738, category: 패션잡화 여성가방 숄더백, score: 1.5171634
name: 루이 비통 파시 M45592, category: 패션잡화 여성가방 숄더백, score: 1.4977398

CASE B :
name: 프라다 파니에 사피아노 스몰백 17 2ERX F0LJ4 1BA217, category: 패션잡화 여성가방 토트백, score: 1.5737112
name: 루이 비통 뉴 웨이브 체인 백 M58664, category: 패션잡화 여성가방 숄더백, score: 1.5171634
name: 루이 비통 네오노에 MM M45256, category: 패션잡화 여성가방 토트백, score: 1.4977398

 

검색어 : 롤렉스 시계
CASE A :
name: 롤렉스 남성 시계 126334G, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.7302626
name: 롤렉스 남성시계 116618LB, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.6464772
name: 롤렉스 데이저스트 69173 시계 26M 다이아10p, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.5828612

CASE B :
name: 유사나 바이오메가 530.5mg x 112캡슐, category: 식품 건강식품 영양제 오메가3, score: 1.659427
name: 해외561027236 특별 가격Omega De Ville Ladies Watch 42, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.646426
name: 오메가 여주점 레어팩토리 드 빌 프레스티지 쿼츠 424 23 27 60 52 001, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.646426

 

와.. 망.. 카테고리가  오히려 방해가 되네 

B가 이긴다는 가정하에 작업을 했는데..

내가  뭘 잘못했나?

 

728x90
반응형