Thẻ self-consistency

self-consistency — sử dụng nhiều chuỗi tư duy hoặc nhiều lần sampling để LLM chốt câu trả lời nhất quán.

llm safety thiet lap filter classifier escalation flow 1340

LLM Safety: Thiết lập Filter, Classifier & Escalation Flow

Safety Engineering với LLM: Xây Filter, Classifier Unsafe Content & Escalation Flow – Đừng Để Nội Dung Độc Lọt Lưới Chào anh em dev, anh Hải đây. Hôm nay ngồi cà phê, lướt qua mấy cái post trên Twitter về…

calibration uncertainty temperature scaling conformal prediction 1338

Calibration & Uncertainty: Temperature Scaling, Conformal Prediction

Deep Dive vào Calibration & Uncertainty Estimation: Temperature Scaling, Conformal Prediction và Predictive Intervals Chào anh em dev, đặc biệt là team ML Engineer đang vật lộn với những model predict ra con số trông “chắc ăn” nhưng thực tế…

model introspection probing classifiers va neuron analysis 1330

Model Introspection – Probing Classifiers và Neuron Analysis

Deep Dive: Model Introspection – Probing Classifiers và Neuron Analysis để “Mổ Xẻ” Model Black-Box Chào anh em dev, đặc biệt là team AI/ML đang vật lộn với mấy con model transformer khổng lồ. Mình là anh Hải đây, hôm…

kinh nghiem prompt versioning ci cd cho prompt catalogs 1312

Kinh nghiệm Prompt Versioning & CI/CD cho Prompt Catalogs

Prompt Versioning & CI/CD cho Prompt Catalogs: Đừng Over-Engineer, Nhưng Cũng Đừng Để Prompts “Hoang Dã” Chào anh em dev, Anh Hải đây, ngồi cà phê sáng nay nghĩ về cái mớ prompt trong các dự án AI. Prompt giờ…

kinh nghiem prompt robustness testing fuzzing 1308

Kinh nghiệm Prompt Robustness Testing & Fuzzing

Deep Dive: Prompt Robustness Testing & Fuzzing – Xây Suite Tấn Công Để “Đập Tan” Brittleness Trong LLM Chào anh em dev, Mình là Hải đây, hôm nay ngồi đào sâu vào một vấn đề đang hot với dân AI/ML:…

scaling laws cho llm capacity planning va diem hoa von 1276

Scaling Laws cho LLM: Capacity Planning và điểm hòa vốn

Scaling Laws & Capacity Planning Cho LLM: Tính Compute, Dataset Và Điểm Break-Even Latency/Chi Phí Chào anh em dev, Mình là Hải “Performance”, thằng ám ảnh với latency và RPS từ hồi code PHP thuần năm 2012. Giờ làm Senior…

so sanh hnsw vs ivf vs pq latency vs recall tradeoffs 1272

So sánh HNSW vs IVF vs PQ: Latency vs Recall Tradeoffs

Vector Databases & ANN Search: Kiến Trúc Index HNSW/IVF/PQ – Tradeoff Latency vs Recall Như Thế Nào? Chào anh em dev, anh Hải đây. Hôm nay ngồi cà phê, nghĩ về cái thế giới vector search đang bùng nổ với…

thiet ke rag pipeline retrieval index rerank freshness 1268

Thiết kế RAG Pipeline: Retrieval, Index, Rerank, Freshness

Thiết Kế Hệ Thống RAG Scale Được: Từ Index Đến Freshness, Không Để Latency “Ăn Chặn” Response Chào anh em dev, Anh Hải đây, hôm nay ngồi cà phê đen đá nhìn cái pipeline RAG (Retrieval-Augmented Generation – Sinh tạo…

catastrophic forgetting nguyen nhan replay buffer regularization 1262

Catastrophic Forgetting: Nguyên nhân, replay buffer, regularization

Catastrophic Forgetting Trong Continual Learning: Deep Dive Vào Nguyên Nhân Và Replay Buffer, Regularization, Progressive Networks Chào anh em dev, anh Hải “Deep Dive” đây. Hôm nay mình đào sâu vào một vấn đề kinh điển trong machine learning: Catastrophic…

perplexity vs task specific metrics cho llm bleu rouge 1254

Perplexity vs Task-specific Metrics cho LLM: BLEU, ROUGE

Deep Dive Vào Evaluation Metrics Cho LLM: Từ Perplexity Đến Task-Specific Và Thiết Kế Benchmark Nội Bộ Chào anh em dev, Anh Hải đây, hôm nay ngồi deep dive vào một chủ đề mà mấy tháng nay team mình hay…

kinh nghiem rlhf pipeline va pitfalls thuc te 1252

Kinh nghiệm RLHF: Pipeline và pitfalls thực tế

RLHF Thực Chiến: Xây Pipeline Từ Preference Data Đến PPO, Và Những Hố Bẫy “Ăn Đòn” Hay Gặp Chào anh em dev, đặc biệt là team AI/ML đang vật lộn với LLM fine-tune. Hôm nay anh Hải “Deep Dive” đây,…

instruction tuning alignment tong quan rlhf 1246

Instruction Tuning & Alignment: Tổng quan RLHF

Deep Dive Vào Instruction Tuning & RLHF: Làm Model AI “Nghe Lời” Như Thế Nào? Chào anh em dev, Mình là Hải đây, hôm nay với góc nhìn Hải “Deep Dive”, mình sẽ lột trần cơ chế bên dưới của…

full model fine tuning quy trinh loi hai dataset chuan 1240

Full-model Fine-tuning: Quy trình, lợi/hại, dataset chuẩn

Fine-tuning Full-model: Đào Sâu Quy Trình, Lợi Hại Và Những Chi Tiết “Under The Hood” Anh Hải “Deep Dive” đây. Hôm nay ngồi cà phê, lôi laptop ra đào sâu vào Full-model Fine-tuning – cái kỹ thuật cổ điển nhưng…