Research · Ars Technica · 28 May 2026

LLMs believe false statements even after explicit warnings that they're false

Research shows large language models (LLMs) tend to confidently assert false statements as true, even after explicit warnings. Fine-tuning tests reveal a persistent bias toward representing such claims as factual.

Read the full story at Ars Technica →