일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Cache
- NORI
- API
- TSLA
- api cache
- IONQ
- Docker
- aqqle
- 양자컴퓨터
- Query
- aggs
- Elasticsearch
- Selenium
- Aggregation
- 아이온큐
- KNN
- ann
- java
- Analyzer
- Elastic
- dbeaver
- JPA
- request cache
- file download
- 테슬라
- mysql
- elasticsearch cache
- redis
- vavr
- java crawler
Archives
- Today
- Total
아빠는 개발자
[NLP] snunlp 본문
728x90
반응형
nlp 환경에 접속
conda activate nlp
라이브러리 설치
# 필수 라이브러리 설치
pip install torch transformers sentence-transformers
사용 가능한 모델 ID: snunlp/KR-SBERT-V40K-klueNLI-augSTS
이 모델은 “KLUE-NLI” 데이터에 기반해 파인튜닝된 SBERT로, 문장 유사도나 클러스터링 등에 바로 활용
from sentence_transformers import SentenceTransformer, util
# 올바른 모델 ID
model = SentenceTransformer("snunlp/KR-SBERT-V40K-klueNLI-augSTS")
sentences = ["문장 A", "문장 B"]
# 임베딩 생성 및 유사도 계산
embeddings = model.encode(sentences, convert_to_tensor=True)
cos_sim = util.pytorch_cos_sim(embeddings[0], embeddings[1])
print(f"Cosine similarity: {cos_sim.item():.4f}")
결과
"오뚜기참기름", "오뜌기참기름"
Cosine similarity: 0.1739
728x90
반응형
'NLP > HuggingFace' 카테고리의 다른 글
[NLP] jhgan vs snunlp vs upskyy (0) | 2025.05.05 |
---|---|
[NLP] jhgan (0) | 2025.05.05 |
[NLP] upskyy (0) | 2025.05.01 |
[NLP] 가상환경 만들기 - conda (0) | 2025.05.01 |
[NLP] Hugging Face (1) | 2025.04.30 |