Thẻ prompt tuning

prompt tuning — kỹ thuật tinh chỉnh prompt (ví dụ như P-Tuning) để hiệu quả hơn

temporal reasoning llms xu ly dates aging knowledge 1559

Temporal Reasoning LLMs: Xử lý dates, aging knowledge.

Deep Dive: Temporal Reasoning Trong LLMs – Tại Sao LLMs Hay “Lú” Về Thời Gian Và Cách Fix Under The Hood Chào anh em dev, Anh Hải đây. Hôm nay mình đào sâu vào Temporal Reasoning (Lý luận thời gian)…

fact checking pipelines automated human in the loop 1555

Fact-Checking Pipelines: Automated & Human-in-the-loop

Fact-Checking Pipelines: Xây Luồng Kiểm Tra Sự Thật Tự Động + Human-in-the-Loop Chào anh em dev, mình là Hải đây. Hôm nay ngồi cà phê, nghĩ về cái mớ fake news lan truyền trên mạng xã hội, đặc biệt khi…

kinh nghiem llm etl pipelines entity resolution dedupe 1551

Kinh nghiệm LLM ETL: Pipelines, Entity Resolution, Dedupe

LLM-based ETL: Xây Pipeline Trích Xuất Dữ Liệu Cấu Trúc Từ Text – Tập Trung Pipelines, Entity Resolution & Dedupe Chào anh em dev, anh Hải đây. Hôm nay mình nhìn vấn đề ETL từ góc độ Architect, high-level trước…

chain of thought leakage qua reasoning xac dinh va redact 1541

Chain-of-Thought Leakage qua Reasoning: Xác định và Redact

Chain-of-Thought Prompting: Reasoning Siêu Mượt Nhưng Leak Data Qua “Suy Nghĩ” – Cách Soi Mói Và Che Đậy Privacy Leakage Chào anh em dev, Hải đây. Hôm nay ngồi cà phê, lướt qua mấy engineering blog thì thấy drama về…

confidence scores lech lac trong ui cach calibrate 1527

Confidence Scores lệch lạc trong UI: Cách Calibrate

Confidence Estimation: Calibrated Scores Và Cách “Nói Thật” Với User Về Độ Chắc Chắn Của Model Chào anh em dev, anh Hải đây. Hôm nay với góc nhìn Hải “Deep Dive”, mình sẽ lặn sâu vào Confidence Estimation – cái…

synthetic vs real refs danh gia hallucination grounded qa 1523

Synthetic vs Real Refs: Đánh giá Hallucination Grounded QA

Evaluating Hallucination với Grounded QA Datasets: Test Design, Synthetic vs Real References, và Scoring Chào anh em dev, Hôm nay anh Hải Deep Dive đây. Anh em nào đang build LLM app, đặc biệt RAG (Retrieval-Augmented Generation), chắc chắn từng…

medical domain prompting accuracy citations guardrails 1501

Medical Domain Prompting: Accuracy, Citations, Guardrails

Hải “Security” Khuyên: Prompting AI Trong Y Tế – Đừng Để Hallucination Giết Người Dùng Anh em dev, đặc biệt ai đang dấn thân vào AI cho healthcare app, nghe anh cảnh báo cái đã. Từ 2012 code PHP thuần…

eval frameworks for instruction following protocols rubrics 1489

Eval Frameworks for Instruction Following: Protocols & Rubrics

Hướng Dẫn Xây Dựng Evaluation Framework Cho Instruction Following: Từ Protocol Human Eval Đến Inter-Annotator Agreement Chào anh em dev, Mình là Hải đây, Senior Solutions Architect với hơn 12 năm lăn lộn từ PHP thuần đến microservices scale triệu…

active learning uncertainty sampling cho data efficiency 1487

Active Learning: Uncertainty Sampling cho Data Efficiency

Active Learning Để Tiết Kiệm Label Dữ Liệu: Hướng Dẫn Từng Bước Cho Junior Dev Chào anh em dev, đặc biệt là các bạn junior mới chân ướt chân ráo vào ML. Mình là anh Hải đây, Senior Solutions Architect…