Thẻ self-consistency

self-consistency — sử dụng nhiều chuỗi tư duy hoặc nhiều lần sampling để LLM chốt câu trả lời nhất quán.

data concept drift in production metrics va retrain triggers 1580

Data & Concept Drift in Production: Metrics và Retrain Triggers

Data & Concept Drift Detection in Production: Drift Metrics, Retraining Triggers và Validation Sets Anh Hải “Deep Dive” đây. Hôm nay ngồi cà phê, nghĩ về cái bẫy chết người nhất trong ML production: model chạy ngon lành ở dev,…

bao mat llm apis rate limits anomaly detection quotas 1565

Bảo mật LLM APIs: Rate Limits, Anomaly Detection, Quotas

Securing LLM APIs: Auth, Throttling, Abuse Detection – Đừng Để Token Của Bạn Bay Theo Gió Chào anh em dev, anh Hải đây. Hôm nay với góc nhìn Hải “Security”, mình sẽ soi mói mấy lỗ hổng kinh điển khi…

automated testing voi llms unit tests fuzz oracle 1563

Automated Testing với LLMs: Unit tests, fuzz, oracle

Automated Software Testing với LLMs: Generate Unit/Integration Tests, Fuzz Inputs và Oracle Design Chào anh em dev, Hôm nay anh Hải “Deep Dive” đây, kiểu ngồi cà phê đào sâu under the hood của mấy công nghệ hot. Chủ đề…

temporal reasoning llms xu ly dates aging knowledge 1559

Temporal Reasoning LLMs: Xử lý dates, aging knowledge.

Deep Dive: Temporal Reasoning Trong LLMs – Tại Sao LLMs Hay “Lú” Về Thời Gian Và Cách Fix Under The Hood Chào anh em dev, Anh Hải đây. Hôm nay mình đào sâu vào Temporal Reasoning (Lý luận thời gian)…

fact checking pipelines automated human in the loop 1555

Fact-Checking Pipelines: Automated & Human-in-the-loop

Fact-Checking Pipelines: Xây Luồng Kiểm Tra Sự Thật Tự Động + Human-in-the-Loop Chào anh em dev, mình là Hải đây. Hôm nay ngồi cà phê, nghĩ về cái mớ fake news lan truyền trên mạng xã hội, đặc biệt khi…

kinh nghiem llm etl pipelines entity resolution dedupe 1551

Kinh nghiệm LLM ETL: Pipelines, Entity Resolution, Dedupe

LLM-based ETL: Xây Pipeline Trích Xuất Dữ Liệu Cấu Trúc Từ Text – Tập Trung Pipelines, Entity Resolution & Dedupe Chào anh em dev, anh Hải đây. Hôm nay mình nhìn vấn đề ETL từ góc độ Architect, high-level trước…