liyaxuan's picture

liyaxuan

lllyx

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 21 hours ago

Beyond SFT-to-RL: Pre-alignment via Black-Box On-Policy Distillation for Multimodal RL

upvoted a paper about 21 hours ago

MiniCPM-o 4.5: Towards Real-Time Full-Duplex Omni-Modal Interaction

upvoted a paper about 21 hours ago

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

View all activity

Organizations

None yet

lllyx 's models 2

lllyx/Qwen3-1.7B-SFT

Text Generation • 2B • Updated 8 days ago • 696 • 1

lllyx/Qwen3-4B-Base-GRPO

Text Generation • 4B • Updated 8 days ago • 142 • 1