Spaces:

labadvcomp
/

dev

Sleeping

songs1 commited on Jul 24, 2025

Commit

6c4b07c

1 Parent(s): 0f9c95c

submodule

Files changed (3) hide show

app.py CHANGED Viewed

@@ -1,21 +1,10 @@
-import os
 import gradio as gr
 import spaces
 from guidance import gen
 from guidance.models import Transformers
-from transformers import AutoModelForCausalLM, AutoTokenizer
-AUTH_TOKEN = os.environ.get("HF_TOKEN", False)
-model = AutoModelForCausalLM.from_pretrained(
-    "meta-llama/Llama-3.2-3B-Instruct",
-    token=AUTH_TOKEN,
-)
-tok = AutoTokenizer.from_pretrained(
-    "meta-llama/Llama-3.2-3B-Instruct",
-    token=AUTH_TOKEN,
-)
-model = model.to("cuda").eval()
 @spaces.GPU(duration=10)

 import gradio as gr
 import spaces
 from guidance import gen
 from guidance.models import Transformers
+from mymodule.utils import load_model_and_tok
+model, tok = load_model_and_tok()
 @spaces.GPU(duration=10)

mymodule/__init__.py ADDED Viewed

File without changes

mymodule/utils.py ADDED Viewed

+import os
+from transformers import AutoModelForCausalLM, AutoTokenizer
+def load_model_and_tok():
+    AUTH_TOKEN = os.environ.get("HF_TOKEN", False)
+    model = AutoModelForCausalLM.from_pretrained(
+        "meta-llama/Llama-3.2-3B-Instruct",
+        token=AUTH_TOKEN,
+    )
+    tok = AutoTokenizer.from_pretrained(
+        "meta-llama/Llama-3.2-3B-Instruct",
+        token=AUTH_TOKEN,
+    )
+    model = model.to("cuda").eval()
+    return model, tok