3 | Big AI Dream

Learning from Failures in Multi-Attempt Reinforcement Learning

arXiv

Mar 4, 2025

Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking

arXiv

Feb 27, 2025

Stacking Your Transformers: A Closer Look at Model Growth for Efficient LLM Pre-Training

NeurIPS 2024 Spotlight

May 30, 2024

AI Alignment: A Comprehensive Survey

arXiv

Oct 30, 2023

Interactive Natural Language Processing

arXiv

May 22, 2023