Trust Region Masking for Long-Horizon LLM Reinforcement Learning

Published in ICML, 2026

Yingru Li*, Jiacai Liu*, Jiawei Xu*, Yuxuan Tong, Ziniu Li, Qian Liu, Baoxiang Wang.