LLM Blackbox: Saliency, Attention Probing, Feature Attribution, Concept Activation

Deep Dive vào Explainability & Interpretability cho LLM: Saliency, Attention Probing, Feature Attribution và Concept Activation Chào anh em dev, mình là Hải đây. Hôm nay với vai Hải “Deep Dive”, mình sẽ lột trần từng lớp bên dưới của…













