Day 5: RAG Fundamentals — AI System Engineer

Celkový progres 17%

🎯 Cieľ dňa

Pochopiť a implementovať RAG pipeline — od chunkingu cez embeddings po vector search a generáciu.

core practice

Jasný, praktický walkthrough troch core RAG komponentov.

In-depth analýza chunking stratégií s benchmarkmi od vector DB makera.

Recursive 512-token splitting: 69% accuracy vs semantic chunking: 54%. Defaults: 256-512 tokens, 10-20% overlap.

OpenAI text-embedding-3, Voyage 3.5, Nomic V2, Cohere embed-v4. MTEB benchmarks + pricing.

FAISS, Chroma, Pinecone, Qdrant, Weaviate. Chroma pre prototyping, Qdrant pre hybrid.

Embeddings — Konverzia textu na vysoko-dimenzionálne vektory; cosine similarity, dot product

Chunking Strategies — Fixed-size (simple), recursive (best 69%), semantic (groups by meaning 54%)

Chunk Size Sweet Spot — 256-512 tokenov s 10-20% overlapom ako validované defaults

Vector Databases — In-memory (FAISS) vs managed (Pinecone) vs self-hosted (Qdrant, Weaviate)

RAG Pipeline Flow — Ingestion → Chunking → Embedding → Storage → Query → Retrieval → Generation

Buildni document Q&A systém.