Falcon-H1-Tiny-90M-Instruct-reasoning-aggressive

REASONING-optimized | Aggressive pruning | 35% weights pruned

This model is a aggressively pruned version of tiiuae/Falcon-H1-Tiny-90M-Instruct.

Note: Minimal quality drop detected. The Wanda pruning algorithm effectively identifies and removes less important weights while preserving model capability.

Performance Comparison

Category	Original	Pruned	Change
Python	0.0%	0.0%	→
Html	0.0%	0.0%	→
Trivia	15.0%	15.0%	→
Math	10.0%	10.0%	→
Reasoning	15.0%	10.0% ⭐	↓ 5.0%
Medical	5.0%	5.0%	→
Linux	30.0%	30.0%	→
Writing	0.0%	0.0%	→

Average: 9.4% -> 8.8% (-0.6%)

Reasoning Retention: 66.7%

Quick Start

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("CompactAI/Falcon-H1-Tiny-90M-Instruct-reasoning-aggressive")
tokenizer = AutoTokenizer.from_pretrained("CompactAI/Falcon-H1-Tiny-90M-Instruct-reasoning-aggressive")

inputs = tokenizer("Your prompt here", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Technical Details

Property	Value
Base Model	tiiuae/Falcon-H1-Tiny-90M-Instruct
Specialization	Reasoning
Prune Mode	Aggressive
Weight Reduction	35% weights pruned

License

This model inherits the license from the base model.

Downloads last month: 7

Safetensors

Model size

91.1M params

Tensor type

F16

Model tree for CompactAI/Falcon-H1-Tiny-90M-Instruct-reasoning-aggressive

Base model

tiiuae/Falcon-H1-Tiny-90M-Instruct

Finetuned

(17)

this model

Collection including CompactAI/Falcon-H1-Tiny-90M-Instruct-reasoning-aggressive

Falcon-H1-Tiny-90M-Instruct

Collection

Pruned models based on tiiuae/Falcon-H1-Tiny-90M-Instruct • 16 items • Updated 5 days ago