MIPS
MIPS(Maximum Inner Product Search) 학습된 임베딩의 점수 자체를 신뢰하는 검색 방식 주어진 질의 벡터와 가장 내적(Inner Product)이 큰 벡터(문서)를 찾는 검색 방법 EX) 입력 질의 $q$와 문서 임베딩들 $d_1, d_2, …, d_N$이 주어졌을 때, 다음 값을 최대화하는 문서를 찾...
MIPS(Maximum Inner Product Search) 학습된 임베딩의 점수 자체를 신뢰하는 검색 방식 주어진 질의 벡터와 가장 내적(Inner Product)이 큰 벡터(문서)를 찾는 검색 방법 EX) 입력 질의 $q$와 문서 임베딩들 $d_1, d_2, …, d_N$이 주어졌을 때, 다음 값을 최대화하는 문서를 찾...
Data Load # GPU 할당 import os os.environ["CUDA_VISIBLE_DEVICES"] = "3" import torch print(f"pytorch에서 사용 가능한 GPU 개수 확인 : {torch.cuda.device_count()}") print(f"현재 기본 GPU(Device) 확인 : {torch.cuda.cu...
📐 Markdown 수식 Cheat Sheet 수학 · 통계 · 머신러닝 · 딥러닝 글을 작성할 때 자주 사용되는 Markdown(LaTeX) 수식 기호를 용도별로 정리한 참고 문서 ✏️ 수식 작성 기본 규칙 Markdown에서는 LaTeX 문법을 사용해 수식을 표현 문장 안 수식: $ ... $ → 문장 흐름 안에서 간단한 수식 표현...
RAG에서 Retrieval이란? RAG(Retrieval-Augmented Generation)는 외부 지식을 검색(Retrieval) 하고, 그 결과를 바탕으로 LLM이 답변을 생성(Generation) 하는 구조의 아키텍처이다. 이 글에서는 RAG의 핵심 구성요소 중 하나인 Retrieval 단계를 중심으로 개념부터 구현 관점까지 정리한다. ...
Prefix Sum Algorithm이란? Prefix sum (누적 합) 앞부분 합을 미리 계산해 두어 이후의 구간 합 / 구간 업데이트를 아주 빠르게 처리하기 위한 기법 어떻게 생각을 하게 되었는가? “배열의 구간 합 (sum of A[l … r])”을 반복해서 묻거나, “구간에 같은 ...
필요한 정보 I. MIPS II. BART III. LLM IV. Retrieval V. Transformers VI. LangChain RAG (Retrieval-Augmented Generation) 개요(Overview) 1.1 RAG란 무엇인가 1.2 RAG의 필요성 및 장점 1.3 RAG의 활용 사례 시스템 아키텍처(Sy...
데이터 설명 실제 전자상거래(이커머스) 거래 내역을 기반으로 한 거래 데이터(Transaction Data)로, 고객의 구매 행동 분석, RFM 세분화, 코호트 분석, 리텐션 분석, 추천 시스템, 수요 예측 등의 연구에 자주 사용됨 URL : https://archive.ics.uci.edu/dataset/352/...
LeetCode 611. Valid Triangle Number 문제 링크 📝 문제 해석 정수 배열 nums가 주어졌을 때, 배열에서 세 개의 수를 골라 삼각형의 세 변으로 만들 수 있는 경우의 수를 구하는 문제입니다. 삼각형의 조건은 삼각 부등식에 따라 가장 긴 변을 c라 할 때, a + b > c 가 반드시 성립해야 합니다. ...
컴퓨터가 이해하는 정보 CPU는 기본적으로 0과 1만을 이해할 수 있음 비트(bit) : 0과 1을 나타내는 가장 작은 정보의 단위 $N$ 비트는 $2^N$개의 정보를 표현 가능 1 byte ...
컴퓨터 구조 기본 개념 컴퓨터가 이해하는 정보 데이터 : 명령어에 종속적인 정보, 명령의 대상, 명령어의 재료 0과 1로 숫자 표현 정수 실수 0과 1로 문자 표현 명령어 명령어의 종류 ...