Thẻ retrieval-augmented generation (RAG)

retrieval-augmented generation (RAG) — kết hợp prompt + truy xuất kiến thức để tạo ra output chính xác hơn.

kinh nghiem rlhf pipeline va pitfalls thuc te 1252

Kinh nghiệm RLHF: Pipeline và pitfalls thực tế

RLHF Thực Chiến: Xây Pipeline Từ Preference Data Đến PPO, Và Những Hố Bẫy “Ăn Đòn” Hay Gặp Chào anh em dev, đặc biệt là team AI/ML đang vật lộn với LLM fine-tune. Hôm nay anh Hải “Deep Dive” đây,…

instruction tuning alignment tong quan rlhf 1246

Instruction Tuning & Alignment: Tổng quan RLHF

Deep Dive Vào Instruction Tuning & RLHF: Làm Model AI “Nghe Lời” Như Thế Nào? Chào anh em dev, Mình là Hải đây, hôm nay với góc nhìn Hải “Deep Dive”, mình sẽ lột trần cơ chế bên dưới của…

deep dive vao parameter efficient fine tuning lora adapters prompt tuning train model lon ma khong can sieu may 1244

Deep Dive vào Parameter-Efficient Fine-Tuning: LoRA, Adapters, Prompt Tuning – Train Model Lớn Mà Không Cần Siêu Máy

Chào anh em dev, mình là Hải đây. Hôm nay với góc nhìn Hải “Deep Dive”, mình sẽ lột trần cơ chế under-the-hood của mấy phương pháp Parameter-Efficient Fine-Tuning (PEFT). Nếu anh em từng thử full fine-tune một con Llama-7B…

full model fine tuning quy trinh loi hai dataset chuan 1240

Full-model Fine-tuning: Quy trình, lợi/hại, dataset chuẩn

Fine-tuning Full-model: Đào Sâu Quy Trình, Lợi Hại Và Những Chi Tiết “Under The Hood” Anh Hải “Deep Dive” đây. Hôm nay ngồi cà phê, lôi laptop ra đào sâu vào Full-model Fine-tuning – cái kỹ thuật cổ điển nhưng…

embedding spaces vector algebra hieu cho retrieval clustering 1238

Embedding Spaces & Vector Algebra: Hiểu cho Retrieval/Clustering

Deep Dive vào Embedding Spaces & Vector Algebra: Cơ Chế Bên Dưới Retrieval Và Clustering Chào anh em dev, Hôm nay anh Hải “Deep Dive” đây, ngồi cà phê đen đá ngẫm về cái thế giới vector embeddings. Không phải…

So sánh BPE vs SentencePiece vs Unigram: OOV, length, pretokenization VN

Deep Dive: Tokenization Subword – BPE, SentencePiece, Unigram Và Cú Twist Pretokenization Cho Tiếng Việt Chào anh em dev, hôm nay anh Hải ở mode “Deep Dive”, ngồi cà phê đen đá đào sâu under the hood của tokenization. Nếu…

Transformer khó hiểu: Attention, multi-head – Toán chi tiết

Kiến trúc Transformer: Deep Dive Toán Học Từ Attention Đến Layer Norm Chào anh em dev, hôm nay anh Hải “Deep Dive” đây. Transformer ra đời từ paper “Attention is All You Need” (Vaswani et al., 2017, Google Brain) đã…

llm hallucination fix bang cot tot react 1224

LLM Hallucination: Fix bằng CoT, ToT, ReAct

Deep Dive vào Core Prompt Engineering: Bên Dưới Bề Mặt LLM Là Gì? Chào anh em dev, AI trainer hay researcher đang vật lộn với LLM. Mình là Hải đây, hôm nay với góc nhìn Hải “Deep Dive”, mình sẽ…

startup viet nam mat 187 trieu vi chi phi an aws kinh nghiem that tu bill shock va vendor lock in 1204

Startup Việt Nam Mất 187 Triệu Vì Chi Phí Ẩn AWS: Kinh Nghiệm Thật Từ Bill Shock Và Vendor Lock-in

Hôm nay mình muốn chia sẻ một chút kinh nghiệm… Hôm nay mình muốn chia sẻ một chút kinh nghiệm về chuyện dùng cloud AWS cho mấy anh em startup ở Việt Nam. Không phải kiểu khoe khoang đâu, mà…

Đang là xu hướng