Xuan Xiao's picture

Xuan Xiao

xiaoxuanzi

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 11 hours ago

ProRL: Effective Reinforcement Learning for Proactive Recommendation via Rectified Policy Gradient Estimation

updated a model 2 days ago

Kwai-Klear/GoLongRL-4B

updated a model 2 days ago

Kwai-Klear/GoLongRL-30B-A3B

View all activity

Organizations

xiaoxuanzi 's datasets

None public yet