Jay Gala's picture

Jay Gala

jaygala24

·

https://jaygala24.github.io/

AI & ML interests

Machine Learning, Natural Language Processing, Language and Vision Intersection, Fairness and Biases

Recent Activity

updated a dataset 15 days ago

jaygala24/reasoning-geometry

published a dataset 17 days ago

jaygala24/reasoning-geometry

updated a collection 17 days ago

RL post-training

View all activity

Organizations

jaygala24 's models 25

jaygala24/Qwen3-4B-DAPO-math-reasoning

Text Generation • 4B • Updated 17 days ago • 717

jaygala24/Qwen3-4B-RLOO-math-reasoning

Text Generation • 4B • Updated 20 days ago • 460

jaygala24/Qwen3-1.7B-RLOO-math-reasoning

Text Generation • 2B • Updated 21 days ago • 981

jaygala24/Qwen2.5-3B-RLOO-math-reasoning

Text Generation • 3B • Updated 21 days ago • 915

jaygala24/Qwen2.5-1.5B-RLOO-math-reasoning

Text Generation • 2B • Updated 21 days ago • 868

jaygala24/Qwen2.5-0.5B-RLOO-math-reasoning

Text Generation • 0.5B • Updated 21 days ago • 814

jaygala24/Qwen3-1.7B-DAPO-math-reasoning

Text Generation • 2B • Updated 21 days ago • 863

jaygala24/Qwen2.5-3B-DAPO-math-reasoning

Text Generation • 3B • Updated 21 days ago • 831

jaygala24/Qwen2.5-1.5B-DAPO-math-reasoning

Text Generation • 2B • Updated 21 days ago • 1.02k

jaygala24/Qwen2.5-0.5B-DAPO-math-reasoning

Text Generation • 0.5B • Updated 21 days ago • 799

jaygala24/Qwen3-4B-ReMax-math-reasoning

Text Generation • 4B • Updated 26 days ago • 403

jaygala24/Qwen3-4B-GRPO-math-reasoning

Text Generation • 4B • Updated 26 days ago • 452

jaygala24/Qwen3-4B-GRPO-KL-math-reasoning

Text Generation • 4B • Updated 26 days ago • 505

jaygala24/Qwen3-1.7B-ReMax-math-reasoning

Text Generation • 2B • Updated 26 days ago • 446

jaygala24/Qwen3-1.7B-GRPO-math-reasoning

Text Generation • 2B • Updated 26 days ago • 425

jaygala24/Qwen3-1.7B-GRPO-KL-math-reasoning

Text Generation • 2B • Updated 26 days ago • 407

jaygala24/Qwen2.5-3B-ReMax-math-reasoning

Text Generation • 3B • Updated 26 days ago • 345

jaygala24/Qwen2.5-3B-GRPO-math-reasoning

Text Generation • 3B • Updated 26 days ago • 348

jaygala24/Qwen2.5-3B-GRPO-KL-math-reasoning

Text Generation • 3B • Updated 26 days ago • 358

jaygala24/Qwen2.5-1.5B-ReMax-math-reasoning

Text Generation • 2B • Updated 26 days ago • 341

jaygala24/Qwen2.5-1.5B-GRPO-math-reasoning

Text Generation • 2B • Updated 26 days ago • 366

jaygala24/Qwen2.5-1.5B-GRPO-KL-math-reasoning

Text Generation • 2B • Updated 26 days ago • 347

jaygala24/Qwen2.5-0.5B-ReMax-math-reasoning

Text Generation • 0.5B • Updated 26 days ago • 314

jaygala24/Qwen2.5-0.5B-GRPO-math-reasoning

Text Generation • 0.5B • Updated 26 days ago • 345

jaygala24/Qwen2.5-0.5B-GRPO-KL-math-reasoning

Text Generation • 0.5B • Updated 26 days ago • 332