Thẻ retrieval-augmented generation (RAG)

retrieval-augmented generation (RAG) — kết hợp prompt + truy xuất kiến thức để tạo ra output chính xác hơn.

kinh nghiem rlhf pipeline va pitfalls thuc te 1252

Kinh nghiệm RLHF: Pipeline và pitfalls thực tế

RLHF Thực Chiến: Xây Pipeline Từ Preference Data Đến PPO, Và Những Hố Bẫy “Ăn Đòn” Hay Gặp Chào anh em dev, đặc biệt là team AI/ML đang vật lộn với LLM fine-tune. Hôm nay anh Hải “Deep Dive” đây,…

instruction tuning alignment tong quan rlhf 1246

Instruction Tuning & Alignment: Tổng quan RLHF

Deep Dive Vào Instruction Tuning & RLHF: Làm Model AI “Nghe Lời” Như Thế Nào? Chào anh em dev, Mình là Hải đây, hôm nay với góc nhìn Hải “Deep Dive”, mình sẽ lột trần cơ chế bên dưới của…

full model fine tuning quy trinh loi hai dataset chuan 1240

Full-model Fine-tuning: Quy trình, lợi/hại, dataset chuẩn

Fine-tuning Full-model: Đào Sâu Quy Trình, Lợi Hại Và Những Chi Tiết “Under The Hood” Anh Hải “Deep Dive” đây. Hôm nay ngồi cà phê, lôi laptop ra đào sâu vào Full-model Fine-tuning – cái kỹ thuật cổ điển nhưng…

llm hallucination fix bang cot tot react 1224

LLM Hallucination: Fix bằng CoT, ToT, ReAct

Deep Dive vào Core Prompt Engineering: Bên Dưới Bề Mặt LLM Là Gì? Chào anh em dev, AI trainer hay researcher đang vật lộn với LLM. Mình là Hải đây, hôm nay với góc nhìn Hải “Deep Dive”, mình sẽ…