Day 19: Fine-tuning Fundamentals

🎯 Cieľ dňa

Pochopiť kedy a prečo fine-tuniť, ovládnuť LoRA/QLoRA techniky, a spustiť prvý fine-tuning experiment.

theory practice

Comprehenzívny tutorial: LoRA fundamenty, PEFT knižnica, implementácia.

Aktuálny script-based guide s rôznymi PEFT metódami a optimization technikami.

Hands-on: od nuly po fine-tuned model s PyTorch a Hugging Face.

QLoRA s MLflow tracking. Notebook tutorial s sql-create-context dataset.

LoRA (Low-Rank Adaptation) — Injektuje trainable low-rank updates do linear layers. ~90% redukcia trainable parametrov.

QLoRA — LoRA + 4-bit quantization. Fine-tune 7B model na consumer GPU (16GB VRAM).

Kedy Fine-tune — Keď prompt engineering nestačí: custom format, domain vocabulary, consistent style, latency requirements.

Kedy NIE Fine-tune — Keď stačí few-shot, keď nemáš quality training data, keď sa model mení často.

Training Data Quality — Garbage in, garbage out. 100 quality examples > 10,000 noisy examples.

Spusti prvý LoRA fine-tuning experiment.