Spaces:

willsh1997
/

context_window_POC

Running on T4

willsh1997 commited on Jun 27

Commit

fa8a6c8

1 Parent(s): 1761d59

TEST cast to bfloat16

Files changed (1) hide show

context_window_gradio.py CHANGED Viewed

@@ -13,7 +13,7 @@ from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer, BitsAndB
 # quantization_config = BitsAndBytesConfig(load_in_4bit=True)
 torch_device = "cuda" if torch.cuda.is_available() else ("mps" if torch.mps.is_available() else "cpu")
-torch_dtype = torch.float16 if torch_device in ["cuda", "mps"] else torch.float32
 llama_model=AutoModelForCausalLM.from_pretrained("meta-llama/Llama-3.2-1B-Instruct",
                                            #  quantization_config=quantization_config,

 # quantization_config = BitsAndBytesConfig(load_in_4bit=True)
 torch_device = "cuda" if torch.cuda.is_available() else ("mps" if torch.mps.is_available() else "cpu")
+torch_dtype = torch.bfloat16 if torch_device in ["cuda", "mps"] else torch.float32
 llama_model=AutoModelForCausalLM.from_pretrained("meta-llama/Llama-3.2-1B-Instruct",
                                            #  quantization_config=quantization_config,