일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Cache
- TSLA
- Selenium
- mysql
- elasticsearch cache
- Docker
- KNN
- JPA
- request cache
- vavr
- IONQ
- Elastic
- Elasticsearch
- redis
- NORI
- java crawler
- ann
- aqqle
- API
- api cache
- dbeaver
- 아이온큐
- 테슬라
- java
- Query
- aggs
- Analyzer
- Aggregation
- 양자컴퓨터
- file download
- Today
- Total
아빠는 개발자
[tensorflow 2] Text embedding A/B TEST - 2 본문
tensorflow embedding A/B 테스트
tensorflow embedding 모델을 2가지 방법으로 색인해서 테스트해 본다.
A : https://tfhub.dev/google/universal-sentence-encoder-multilingual-large/3"
B : https://tfhub.dev/google/universal-sentence-encoder-multilingual/3"
위의 두개를 테스트 해보았으나.. 뭐가 낫다고 판단 할 수가 없어 색인 방법으로 테스트를 다시 해 봄
모델은 라지 형님
#모델 API
https://tfhub.dev/google/universal-sentence-encoder-multilingual-large/3"
CASE A
상품명(name) 으로 vector 를 추출
name = [doc["name"] for doc in docs]
CASE B
상품명(name) 과 카테고리(category) 를 조합하여 vector 를 추출
name = [[doc["name"], doc["category"]] for doc in docs]
검색어 : 루이비통 여성
CASE A :
name: 루이 비통 모노그램 종크, category: 패션잡화 주얼리 팔찌 패션팔찌, score: 1.5737112
name: 루이 비통 삭 쾨르 M58738, category: 패션잡화 여성가방 숄더백, score: 1.5171634
name: 루이 비통 파시 M45592, category: 패션잡화 여성가방 숄더백, score: 1.4977398
CASE B :
name: 프라다 파니에 사피아노 스몰백 17 2ERX F0LJ4 1BA217, category: 패션잡화 여성가방 토트백, score: 1.5737112
name: 루이 비통 뉴 웨이브 체인 백 M58664, category: 패션잡화 여성가방 숄더백, score: 1.5171634
name: 루이 비통 네오노에 MM M45256, category: 패션잡화 여성가방 토트백, score: 1.4977398
검색어 : 롤렉스 시계
CASE A :
name: 롤렉스 남성 시계 126334G, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.7302626
name: 롤렉스 남성시계 116618LB, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.6464772
name: 롤렉스 데이저스트 69173 시계 26M 다이아10p, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.5828612
CASE B :
name: 유사나 바이오메가 530.5mg x 112캡슐, category: 식품 건강식품 영양제 오메가3, score: 1.659427
name: 해외561027236 특별 가격Omega De Ville Ladies Watch 42, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.646426
name: 오메가 여주점 레어팩토리 드 빌 프레스티지 쿼츠 424 23 27 60 52 001, category: 패션잡화 시계 패션시계 메탈밴드시계, score: 1.646426
와.. 망.. 카테고리가 오히려 방해가 되네
B가 이긴다는 가정하에 작업을 했는데..
내가 뭘 잘못했나?
'Python > Text embeddings' 카테고리의 다른 글
[tensorflow 2] Text embedding A/B TEST - 1 (1) | 2024.08.19 |
---|---|
[tensorflow 2]Universal-sentence-encoder-multilingual-large (1) | 2024.08.19 |