일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- vavr
- java crawler
- Selenium
- TSLA
- Query
- elasticsearch cache
- file download
- mysql
- Analyzer
- aggs
- NORI
- dbeaver
- 테슬라
- api cache
- request cache
- Elasticsearch
- java
- API
- KNN
- IONQ
- 아이온큐
- 양자컴퓨터
- aqqle
- redis
- JPA
- Cache
- Aggregation
- Docker
- Elastic
- ann
- Today
- Total
목록Elastic (6)
아빠는 개발자
Project path local: /Users/doo/plugin/aqqle_analyzer git: https://github.com/900gle/aqqle_analyzer 라이선스 이슈때문에 테스트도 못해보고 망한 작업 우선 아래에 링크에 있는 내용을 확인한다. https://www.elastic.co/guide/en/elasticsearch/plugins/current/example-text-analysis-plugin.html 작업 요약 github.com (https://github.com/elastic/elasticsearch.git) 에서 elasticsearch 소스 다운로드 소스에서 plugin > example > stable-analysis 복사 build.gradle 수정 및 pl..
검색성능 개선 final 이다. 지금까지 테스트 해본 결과를 바탕으로 구조를 잡아서 테스트 ( final 이라고 해놓고 진격의 거인마냥 final part 1, final part 2, final 1기 1쿨 이렇게 증식되지 않기를 바랄뿐..) 우선 이슈는 픽업 서비스 오픈 이후 response time이 튀는 현상이 발생했다. 당연히 검색쿼리로 데이터 조회 후 처리 로직이 추가되었으니 당연히 응답시간이 늘어나는건데 이것이 문제가 되고 있으니.. 늘어난 응답시간은 100ms 이하라서 사용자가 인지하기 힘든 속도이긴 하나. cloud watch 의 모니터링 대시보드에선 널뛰기를 하는 모습으로 나온다. 그래도 로직이 추가될때마다 성능이 저하된다면 문제가 맞긴 한듯하다 cloud watch의 ALB 대상그룹의 ..
전역 서수는 집계 성능을 최적화하는 데 사용되는 데이터 구조입니다. 이는 느리게 계산되어 필드 데이터 캐시의 일부로 JVM 힙에 저장됩니다. 버킷팅 집계에 많이 사용되는 필드의 경우 요청을 수신하기 전에 Elasticsearch에 전역 서수를 구성하고 캐시하도록 지시할 수 있습니다. 힙 사용량이 증가하고 새로 고침 시간이 더 오래 걸릴 수 있으므로 이 작업은 신중하게 수행해야 합니다. 이 옵션은 Eager 전역 서수 매핑 매개변수를 설정하여 기존 매핑에서 동적으로 업데이트될 수 있습니다. 맵핑 옵션 PUT index { "mappings": { "properties": { "foo": { "type": "keyword", "eager_global_ordinals": true } } } } 테스트 해보자 ..
Approximate Nearest Neighbor search 대략적인 최근접 이웃 검색? 다음과 같은 가능성을 열어준다. 질문에 대한 답이 포함될 가능성이 있는 구절 찾기 대규모 데이터세트에서 거의 중복된 이미지 감지 특정 노래와 비슷한 소리 찾기 ANN 알고리즘 Elasticsearch 8.0은 HNSW(Hierarchical Navigable Small World Graphs)라는 ANN 알고리즘을 사용 테스트에 사용할 내 제물 knn-index : knn search 를 사용하기 위한 맵핑구조 512차원의 dense_vector 타입 필드를 가지고 있음 ann-index : knn search 를 사용하기 위한 맵핑구조 512차원의 dense_vector 타입 필드를 가지고 있음 match-in..
nori 형태소분석기의 사전파일 테스트 프로젝트 경로 /Users/doo/docker/es8.8.1 프로젝트를 활용할 예정 docker-compose.yml 파일을 열어보면 900gle 에서 쓰고있는 컨테이너들이 잔뜩 들어 있다.. pc 가 성능이 좋았으면 다돌려도 상관없는데.. 내껀 아니라 es, kibana 를 제거한 .yml 파일 생성 docker-compose.yml version: '3.7' services: # The 'setup' service runs a one-off script which initializes the # 'logstash_internal' and 'kibana_system' users inside Elasticsearch with the # values of the pa..
kNN ( k-nearest neighbor ) 검색은 유사성 메트릭으로 측정된 쿼리 벡터에 가장 가까운 k 개의 벡터를 찾습니다 . ANN ( approximate nearest neighbor search ) KD-트리와 같은 저차원 벡터에는 kNN에 대한 잘 확립된 데이터 구조가 있습니다. 실제로 Elasticsearch는 KD-트리를 통합하여 지리 공간 및 숫자 데이터에 대한 검색을 지원합니다. 그러나 텍스트 및 이미지에 대한 최신 임베딩 모델은 일반적으로 100 - 1000개 또는 그 이상의 요소로 구성된 고차원 벡터를 생성합니다. 이러한 벡터 표현은 고차원에서 가장 가까운 이웃을 효율적으로 찾는 것이 매우 어렵기 때문에 고유한 문제를 제시합니다. 이러한 어려움에 직면한 가장 가까운 이웃 알고리..