Thẻ retrieval-augmented generation (RAG)

retrieval-augmented generation (RAG) — kết hợp prompt + truy xuất kiến thức để tạo ra output chính xác hơn.

kinh nghiem a b testing llm outputs voi noisy human measures 1493

Kinh nghiệm A/B Testing LLM Outputs với Noisy Human Measures

A/B Testing Output LLM Trong Product: Thiết Kế Experiment, Metrics Và Significance Testing Với Human Data Noisy – Đừng Làm Màu! Chào anh em dev, Anh Hải đây, đang ngồi trà đá kiểu Hà Nội, nghĩ về cái A/B testing…

Eval Frameworks for Instruction Following: Protocols & Rubrics

Hướng Dẫn Xây Dựng Evaluation Framework Cho Instruction Following: Từ Protocol Human Eval Đến Inter-Annotator Agreement Chào anh em dev, Mình là Hải đây, Senior Solutions Architect với hơn 12 năm lăn lộn từ PHP thuần đến microservices scale triệu…

Active Learning: Uncertainty Sampling cho Data Efficiency

Active Learning Để Tiết Kiệm Label Dữ Liệu: Hướng Dẫn Từng Bước Cho Junior Dev Chào anh em dev, đặc biệt là các bạn junior mới chân ướt chân ráo vào ML. Mình là anh Hải đây, Senior Solutions Architect…

thiet ke hitl route human khi nao ui ergonomic feedback loop 1482

Thiết kế HITL: Route human khi nào, UI ergonomic, feedback loop

Human-in-the-Loop Systems Design: Route Đúng Người, UI Không Làm Mệt, Feedback Loop Chặt Chẽ Chào anh em dev, Anh Hải đây. Hơn 12 năm code từ PHP thuần đến microservices scale triệu CCU, giờ đang mò mẫm mấy cái AI/ML…

Discrete vs Continuous Prompt Tokens: AutoPrompt, P-Tuning

Deep Dive vào Automated Prompt Tuning: AutoPrompt vs P-Tuning, Discrete vs Continuous Tokens, và Recipes Reproducible Chào anh em dev, Mình là Hải đây, hôm nay ngồi cà phê với code, đào sâu vào Automated Prompt Tuning – cái mà…

kinh nghiem meta prompting llms tu viet prompts auto optimize 1460

Kinh nghiệm Meta-Prompting: LLMs tự viết prompts auto-optimize

Meta-Prompting: LLM A Viết Prompt Cho LLM B – Đào Sâu Pipeline Auto-Optimization Chào anh em dev, anh Hải Deep Dive đây. Hôm nay ngồi cà phê, lướt qua mấy paper về LLMs, thấy cái meta-prompting (hay còn gọi là…

self consistency monte carlo sampling chains de giam variance 1458

Self-Consistency & Monte Carlo: Sampling chains để giảm variance

Self-Consistency & Monte Carlo Reasoning: Đào Sâu Vào Sampling Multiple Chains Để Giảm Variance Xuống Còn 25-40% Chào anh em dev, Mình là Hải đây, hôm nay ngồi cà phê đen đá, lôi cái chủ đề Self-Consistency và Monte Carlo…

kinh nghiem least to most prompting case studies decomposition large tasks 1454

Kinh nghiệm Least-to-Most Prompting: Case studies decomposition large tasks

Least-to-Most Prompting Trong Dự Án Thực Tế: Phân Tích Nhiệm Vụ Lớn Như Thế Nào Chào anh em dev, mình là Hải đây. Hôm nay với vai trò Hải “Mentor”, mình sẽ dẫn dắt từng bước một về Least-to-Most Prompting…

Tree of Thoughts: Search Strategies, Heuristics & Rollout Policies

Tree of Thoughts (ToT) Applied: Algorithms & Implementations – Đào Sâu Search Strategies, Heuristics Và Rollout Policies Anh Hải “Deep Dive” đây. Hôm nay mình lăn xả đào sâu vào Tree of Thoughts (ToT), một cách tiếp cận prompting cho…

chain of thought cho math symbolic reasoning prompt templates multi step dung 1446

Chain-of-Thought cho Math & Symbolic Reasoning: Prompt templates multi-step đúng

Chain-of-Thought cho Math & Symbolic Reasoning: Prompt Templates Giúp LLM Giải Đúng Từng Bước Một Chào anh em dev, Mình là Hải đây, hôm nay ngồi cà phê với thằng junior trong team, nó hỏi: “Anh ơi, dùng GPT-4o hay…

llms nghien cuu khoa hoc reproducibility pitfalls

LLMs Nghiên cứu Khoa học: Reproducibility Pitfalls & Fixes

LLMs Trong Nghiên Cứu Khoa Học: Reproducibility Và Quản Lý Reference – Deep Dive Vào Use Cases, Lỗ Hổng Và Mitigation Hallucination Chào anh em dev kiêm researcher, anh Hải đây. Hôm nay anh chọn góc nhìn Deep Dive để…

prompting data science prompts tao phan tich notebooks tai su dung han che 1440

Prompting Data Science: Prompts tạo phân tích, notebooks tái sử dụng – Hạn chế

Prompting cho Data Science & Analysis: Hướng dẫn từng bước từ Junior lên Pro Chào anh em dev, data analyst! Mình là Hải đây, hôm nay với vai Hải “Mentor”, mình sẽ dẫn dắt anh em từ con số 0…

Code Models Interpretability: Token Attribution & Training Traceback

Deep Dive: Interpretability cho Code Models – Token-Level Attribution và Traceback to Training Data Chào anh em dev, hôm nay anh Hải “Deep Dive” đây. Mình ngồi cà phê sáng nay, lướt qua mấy paper mới về LLMs cho code…

kinh nghiem llm cho code review docs pair programming 1432

Kinh nghiệm LLM cho Code Review, Docs, Pair-Programming

LLM-Assisted Software Engineering: Workflow Thực Dụng Cho Code Review, Docs & Pair-Programming – Đừng Để Nó Làm Màu Yo anh em dev, anh Hải “Pragmatic” đây. 12 năm code từ PHP thuần đến microservices scale triệu CCU, mình ghét nhất…

automated code generation program synthesis tu spec den code test driven 1430

Automated Code Generation & Program Synthesis: Từ spec đến code test-driven

Deep Dive vào Automated Code Generation & Program Synthesis: Từ Spec Đến Code Đúng, Với Unit-Test-Driven Chào anh em dev, Hôm nay anh Hải ở mode Deep Dive, kiểu giảng viên cà phê sữa ngồi mổ xẻ under the hood…

safe tool use tu llms grounding sandboxing react patterns 1420

Safe Tool Use từ LLMs: Grounding, sandboxing, ReAct patterns

Tool Use & API Calling từ LLMs: Sandboxing, Grounding và ReAct Pattern Để Tránh “Tự Đâm” Chính Mình Anh Hải “Security” đây. Hơn 12 năm code, mình từng thấy bao nhiêu lần dev tin tưởng LLM gọi tool/API mà không…

kinh nghiem agent architectures planner executor patterns 1418

Kinh nghiệm Agent Architectures – Planner + Executor Patterns

Agent Architectures: Planner + Executor Patterns – Orchestration LLM Như Kiến Trúc Sư Thông Minh Chào anh em dev, anh Hải đây. Hôm nay ngồi cà phê, lướt qua mấy thread trên Reddit về LLM Agent, thấy nhiều bro vẫn…

kinh nghiem dialog state memory design cho agents 1412

Kinh nghiệm Dialog State & Memory Design cho Agents

Conversational Agents: Deep Dive Vào Dialog State Tracking Và Memory Design Chào anh em dev, Hôm nay anh Hải ở mode Deep Dive, ngồi đào bới under the hood của Conversational Agents (Agent hội thoại). Không phải kiểu chat chit…

kinh nghiem tich hop asr tts voi llm latency quality trade offs 1402

Kinh nghiệm tích hợp ASR-TTS với LLM: Latency-quality trade-offs

Xây Pipeline ASR -> LLM -> TTS: Trade-off Latency vs Quality Ở Mức 100ms End-to-End Chào anh em dev, anh Hải đây. Hôm nay ngồi cà phê, nghĩ về cái pipeline voice AI: ASR (Automatic Speech Recognition – Nhận diện…

CLIP-style vs Beyond: Vision-Language Models Training VN

Vision-Language Models: CLIP-style và Beyond — Đào Sâu Training Objectives, Zero-Shot Retrieval, Fine-Tuning Cho Tiếng Việt Chào anh em dev, mình là Hải đây. Hôm nay với góc nhìn Hải “Deep Dive”, mình sẽ lột trần cơ chế bên dưới…

kinh nghiem multimodal models fusion pretraining alignment 1394

Kinh nghiệm Multimodal Models: Fusion, Pretraining, Alignment

Deep Dive Multimodal Models: Fusion Architectures, Pretraining Strategies & Cross-Modal Alignment Chào anh em dev, mình là Hải đây. Hôm nay với vai Hải “Deep Dive”, mình sẽ lột trần từng lớp bên dưới của Multimodal Models – những con…

Symbolic vs Neural: Neuro-symbolic Hybrid Models

Hybrid Models: Kết Hợp Symbolic & Neural – Đào Sâu Neuro-Symbolic Integration Cho Constraints Solving Và Logic Layers Chào anh em dev, anh Hải đây. Hôm nay ngồi cà phê, lướt qua mấy paper về AI mới thấy hybrid models…

giam latency early exit cascade async retrieval 1386

Giảm Latency: Early Exit, Cascade, Async Retrieval

Latency-Sensitive Design: Techniques & Trade-offs Early Exit, Cascade Models, và Async Retrieval – Đừng Để User Chờ Đói ⚡ Chào anh em dev, anh Hải “Performance” đây – thằng cha ám ảnh với latency p95 dưới 100ms và RPS vọt…

giam chi phi llm inference spot mixed precision prompt caching 1382

Giảm chi phí LLM Inference: Spot, Mixed Precision, Prompt Caching

Tối Ưu Chi Phí Inference LLM: Spot Instances, Mixed Precision Và Các Chiến Thuật Caching Giảm Bill GPU Xuống Còn 1/3 Chào anh em dev, anh Hải đây – thằng cha ám ảnh với performance từ hồi code PHP thuần…

Đang là xu hướng