Tianze Wang's picture

Tianze Wang

tzwilliam0

AI & ML interests

None yet

Recent Activity

updated a model about 1 month ago

tzwilliam0/qwen-dapo-17k-vs-6

published a model about 1 month ago

tzwilliam0/qwen-dapo-17k-vs-6

updated a model about 1 month ago

tzwilliam0/qwen-dapo-17k-vs-5

View all activity

Organizations

None yet

tzwilliam0 's datasets 19

tzwilliam0/semi_Ministral3_8B

Viewer • Updated Mar 14 • 4.96k • 31

tzwilliam0/semi_qwen2.5_0.5B

Viewer • Updated Mar 14 • 4.96k • 11

tzwilliam0/instruction_following

Viewer • Updated Oct 21, 2025 • 19.9k • 3

tzwilliam0/instruction_following_dpo_filtered_add

Viewer • Updated Oct 21, 2025 • 18.8k • 3

tzwilliam0/instruction_following_dpo_filtered

Viewer • Updated Oct 20, 2025 • 10.3k • 4

tzwilliam0/math_reward_training

Viewer • Updated Oct 17, 2025 • 2.42k • 3

tzwilliam0/non_reasoning_reward_training

Viewer • Updated Oct 16, 2025 • 30k • 10

tzwilliam0/non_reasoning_training

Viewer • Updated Oct 16, 2025 • 30k • 3

tzwilliam0/Safe_dpo_helpful

Viewer • Updated Jul 31, 2025 • 30.4k • 3

tzwilliam0/Safe_dpo_harmless

Viewer • Updated Jul 31, 2025 • 30.4k • 3

tzwilliam0/PPOtraining

Viewer • Updated Dec 28, 2024 • 16k • 9

tzwilliam0/training

Viewer • Updated Dec 20, 2024 • 16k • 5

tzwilliam0/humor

Viewer • Updated Dec 18, 2024 • 25k • 28 • 1

tzwilliam0/harmless

Viewer • Updated Dec 16, 2024 • 25k • 7

tzwilliam0/helpful

Viewer • Updated Dec 16, 2024 • 25k • 8

tzwilliam0/imdb_second

Viewer • Updated Nov 14, 2024 • 5k • 6

tzwilliam0/imdb_first

Viewer • Updated Nov 14, 2024 • 5k • 11

tzwilliam0/reward_calculation

Viewer • Updated Nov 10, 2024 • 4k • 8

tzwilliam0/sampled_imdb

Viewer • Updated Nov 6, 2024 • 4k • 42