Tag: Python
All the articles with the tag "Python".
-
Qdrant Async API — Python 비동기 벡터 검색 클라이언트 활용
Qdrant의 Python AsyncQdrantClient를 활용한 비동기 벡터 검색을 정리한다. FastAPI/Quart 환경에서의 비동기 CRUD, gRPC 비동기 통신, 동시성 성능 향상 전략을 다룬다.
-
Qdrant + LangChain 연동 — 벡터 스토어와 Retriever 설정 가이드
langchain-qdrant 모듈로 Qdrant를 LangChain 벡터 스토어로 활용하는 방법을 정리한다. Dense/Sparse/Hybrid 검색 설정, 메타데이터 필터링, Retriever 변환, 임베딩 모델 연동을 다룬다.
-
Intel NPU 가속을 활용한 TinyLlama 챗봇 구현
Intel NPU Acceleration Library를 사용하여 TinyLlama 모델을 NPU에서 추론하는 챗봇을 구현한 과정. transformers 버전 호환성 문제와 NPU 가속 설정을 정리한다.
-
OJT 리팩토링과 Kotaemon RAG 구현기
기존 OJT 시스템의 한계를 해결하고자 전면 리팩토링을 진행했다. Kotaemon RAG 프레임워크를 도입하여 문서 기반 질의응답 성능을 대폭 개선한 과정을 공유한다.