REST vs streaming, token management, rate limiting, error handling
Navrhnúť resilientnú AI API vrstvu s retry logikou, circuit breakermi a model fallbackmi.
Officiálna dokumentácia SSE-based streaming. Štartovací bod.
docsPraktický guide na budovanie resilientného LLM API layeru.
articleToken math, budgeting, throughput management. Reálne kalkulácie.
articleHands-on tutorial: streaming API endpoint s FastAPI a SSE. Working code.
hands-onTPM, RPM, Retry-After headers. Oficiálna rate limiting dokumentácia.
docsBuildni resilientný LLM API wrapper.