Adaptive Latent Agentic Reasoning
ALAR (Adaptive Latent Agentic Reasoning) est un framework dual-mode qui alterne entre raisonnement latent compact et chain-of-thought explicite selon la difficulté. Entraîné sur les actions de l'agent, il réduit les tokens générés de 43,6% en recherche et 84,6% en tool-use tout en maintenant la précision.