Trust Region Masking for Long-Horizon LLM Reinforcement Learning

Published: December 19, 2025

Yingru Li*, Jiacai Liu*, Jiawei Xu*, Yuxuan Tong, Ziniu Li, Qian Liu, Baoxiang Wang.