LLM
Query Analyzer
Model phân tích intent — nên dùng model nhỏ, nhanh
JSON array — thêm intent mới không cần restart server
Embedding
Đổi model cần re-embed toàn bộ tài liệu
Retrieval
Dịch câu hỏi tiếng Việt sang tiếng Anh trước khi search
System Prompt
Nguy hiểm
Cần chạy lại khi đổi embedding model