Thẻ prompt engineer

prompt engineer — nghề prompt engineer vẫn được nhiều người tra cứu nhằm học & phát triển kỹ năng.

automated testing voi llms unit tests fuzz oracle 1563

Automated Testing với LLMs: Unit tests, fuzz, oracle

Automated Software Testing với LLMs: Generate Unit/Integration Tests, Fuzz Inputs và Oracle Design Chào anh em dev, Hôm nay anh Hải “Deep Dive” đây, kiểu ngồi cà phê đào sâu under the hood của mấy công nghệ hot. Chủ đề…

temporal reasoning llms xu ly dates aging knowledge 1559

Temporal Reasoning LLMs: Xử lý dates, aging knowledge.

Deep Dive: Temporal Reasoning Trong LLMs – Tại Sao LLMs Hay “Lú” Về Thời Gian Và Cách Fix Under The Hood Chào anh em dev, Anh Hải đây. Hôm nay mình đào sâu vào Temporal Reasoning (Lý luận thời gian)…

fact checking pipelines automated human in the loop 1555

Fact-Checking Pipelines: Automated & Human-in-the-loop

Fact-Checking Pipelines: Xây Luồng Kiểm Tra Sự Thật Tự Động + Human-in-the-Loop Chào anh em dev, mình là Hải đây. Hôm nay ngồi cà phê, nghĩ về cái mớ fake news lan truyền trên mạng xã hội, đặc biệt khi…

kinh nghiem llm etl pipelines entity resolution dedupe 1551

Kinh nghiệm LLM ETL: Pipelines, Entity Resolution, Dedupe

LLM-based ETL: Xây Pipeline Trích Xuất Dữ Liệu Cấu Trúc Từ Text – Tập Trung Pipelines, Entity Resolution & Dedupe Chào anh em dev, anh Hải đây. Hôm nay mình nhìn vấn đề ETL từ góc độ Architect, high-level trước…

chain of thought leakage qua reasoning xac dinh va redact 1541

Chain-of-Thought Leakage qua Reasoning: Xác định và Redact

Chain-of-Thought Prompting: Reasoning Siêu Mượt Nhưng Leak Data Qua “Suy Nghĩ” – Cách Soi Mói Và Che Đậy Privacy Leakage Chào anh em dev, Hải đây. Hôm nay ngồi cà phê, lướt qua mấy engineering blog thì thấy drama về…

confidence scores lech lac trong ui cach calibrate 1527

Confidence Scores lệch lạc trong UI: Cách Calibrate

Confidence Estimation: Calibrated Scores Và Cách “Nói Thật” Với User Về Độ Chắc Chắn Của Model Chào anh em dev, anh Hải đây. Hôm nay với góc nhìn Hải “Deep Dive”, mình sẽ lặn sâu vào Confidence Estimation – cái…

synthetic vs real refs danh gia hallucination grounded qa 1523

Synthetic vs Real Refs: Đánh giá Hallucination Grounded QA

Evaluating Hallucination với Grounded QA Datasets: Test Design, Synthetic vs Real References, và Scoring Chào anh em dev, Hôm nay anh Hải Deep Dive đây. Anh em nào đang build LLM app, đặc biệt RAG (Retrieval-Augmented Generation), chắc chắn từng…

medical domain prompting accuracy citations guardrails 1501

Medical Domain Prompting: Accuracy, Citations, Guardrails

Hải “Security” Khuyên: Prompting AI Trong Y Tế – Đừng Để Hallucination Giết Người Dùng Anh em dev, đặc biệt ai đang dấn thân vào AI cho healthcare app, nghe anh cảnh báo cái đã. Từ 2012 code PHP thuần…

eval frameworks for instruction following protocols rubrics 1489

Eval Frameworks for Instruction Following: Protocols & Rubrics

Hướng Dẫn Xây Dựng Evaluation Framework Cho Instruction Following: Từ Protocol Human Eval Đến Inter-Annotator Agreement Chào anh em dev, Mình là Hải đây, Senior Solutions Architect với hơn 12 năm lăn lộn từ PHP thuần đến microservices scale triệu…