Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

MeganEFlynn updated a model 1 day ago

inference-optimization/Gemma4-DFlash-SWA-Causal-Nemo-Cascade

MeganEFlynn published a model 1 day ago

inference-optimization/Gemma4-DFlash-SWA-Causal-Nemo-Cascade

kylesayrs updated a model 1 day ago

inference-optimization/Qwen3-1.6B-A0.9B

View all activity

inference-optimization 's models 355

inference-optimization/Gemma4-DFlash-SWA-Causal-Nemo-Cascade

4B • Updated 1 day ago • 13

inference-optimization/Qwen3-1.6B-A0.9B

Text Generation • 2B • Updated 1 day ago • 67

inference-optimization/gemma-4-1B-0.8B-tiny

1B • Updated 1 day ago • 10 • 1

inference-optimization/Ministral-3-14B-Instruct-2512-NVFP4

Text Generation • Updated 5 days ago • 171

inference-optimization/ctest-Qwen3.5-9B-subset-397-speculator.dflash

2B • Updated 6 days ago • 63

inference-optimization/Qwen3-235B-A22B-Thinking-2507-quantized.w4a16

Text Generation • 32B • Updated 6 days ago • 183

inference-optimization/Qwen3-235B-A22B-Thinking-2507-quantized.w8a8

Text Generation • 235B • Updated 6 days ago • 178

inference-optimization/Qwen3-235B-A22B-Instruct-2507-quantized.w4a16

Text Generation • 32B • Updated 6 days ago • 161

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-noise

Image-Text-to-Text • 32B • Updated 6 days ago • 129

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-hybrid

Image-Text-to-Text • 32B • Updated 6 days ago • 125

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-heuristic

Image-Text-to-Text • 32B • Updated 6 days ago • 156

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-noise

Image-Text-to-Text • 30B • Updated 6 days ago • 130

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-hybrid

Image-Text-to-Text • 30B • Updated 6 days ago • 115

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-heuristic

Image-Text-to-Text • 30B • Updated 6 days ago • 106

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-noise

Image-Text-to-Text • 28B • Updated 6 days ago • 112

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-hybrid

Image-Text-to-Text • 28B • Updated 6 days ago • 289

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-heuristic

Image-Text-to-Text • 28B • Updated 6 days ago • 118

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-noise

Image-Text-to-Text • 26B • Updated 6 days ago • 120

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-hybrid

Image-Text-to-Text • 26B • Updated 6 days ago • 124

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-heuristic

Image-Text-to-Text • 26B • Updated 6 days ago • 115

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-noise

Image-Text-to-Text • 24B • Updated 6 days ago • 109

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-hybrid

Image-Text-to-Text • 24B • Updated 6 days ago • 146

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-heuristic

Image-Text-to-Text • 24B • Updated 6 days ago • 453

inference-optimization/Gemma4_SWA_DFLASH

4B • Updated 7 days ago • 125

inference-optimization/DSV4-tiny-empty

3B • Updated 8 days ago • 584

inference-optimization/final-ctest-Qwen3-8B-speculator.dflash

2B • Updated 13 days ago • 87

inference-optimization/updated-ctest-Qwen3-8B-speculator.dflash

2B • Updated 18 days ago • 89

inference-optimization/qwen3_8b_7.0_bits_mode_noise_stiched

7B • Updated 18 days ago • 58

inference-optimization/qwen3_8b_7.0_bits_mode_hybrid_stiched

7B • Updated 18 days ago • 58

inference-optimization/qwen3_8b_7.0_bits_mode_heuristic_stiched

7B • Updated 18 days ago • 57