Tag: 임베딩
All the articles with the tag "임베딩".
-
FastEmbed — ONNX 기반 경량 고성능 임베딩 라이브러리
Qdrant의 FastEmbed 라이브러리를 정리한다. ONNX Runtime 기반으로 PyTorch 없이 경량 임베딩을 생성하는 방법, 서버리스 환경 활용, MTEB 벤치마크 성능 비교를 다룬다.
-
Hugging Face 데이터셋을 Qdrant에 로드하고 검색하기
Hugging Face에 공개된 사전 임베딩 데이터셋을 Qdrant에 로드하여 즉시 벡터 검색을 실습하는 방법을 정리한다. arxiv-titles 데이터셋 예시로 대규모 벡터 업로드와 검색 과정을 다룬다.
-
Static Embedding 다시 주목해야 할까
최근 자원-제약 환경에서 정적 임베딩(static embedding)이 재조명되고 있다. 트랜스포머 계열 모델이 성능 면에서 우위를 점하고 있음에도, 정적 임베딩은 속도·메모리 이점을 앞세워 적지 않은 품질 손실만으로도 충분히 실용적임을 보여 주고 있다.
-
OpenSearch Vector Search 가이드 — Raw Vector와 Neural 검색 비교
OpenSearch의 벡터 검색 방식을 정리한다. knn 쿼리로 직접 벡터를 입력하는 Raw Vector 검색과, neural 쿼리로 텍스트/이미지를 자동 임베딩하는 방식의 차이와 사용법을 다룬다.