Spaces:

KJ24
/

chunkr-api

Runtime error

App Files Files Community

KJ24 commited on Jun 12

Commit

1737ef1

verified ·

1 Parent(s): 63ed81d

Update app.py

Browse files

Files changed (1) hide show

app.py +5 -18

app.py CHANGED Viewed

@@ -2,9 +2,9 @@ from fastapi import FastAPI
 from pydantic import BaseModel
 from typing import Optional
-# ✅ Modules de LlamaIndex
 from llama_index.core.settings import Settings
-from llama_index.core import Document, ServiceContext
 from llama_index.llms.llama_cpp import LlamaCPP
 from llama_index.core.node_parser import SemanticSplitterNodeParser
@@ -24,7 +24,6 @@ os.environ["TRANSFORMERS_CACHE"] = CACHE_DIR
 os.environ["HF_MODULES_CACHE"] = CACHE_DIR
 os.environ["HF_HUB_CACHE"] = CACHE_DIR
 # ✅ Configuration du modèle d’embedding local (ex: BGE / Nomic / GTE etc.)
 MODEL_NAME = "BAAI/bge-small-en-v1.5"
@@ -70,23 +69,15 @@ async def chunk_text(data: ChunkRequest):
             def get_text_embedding(self, text: str):
                 return get_embedding(text)
-        try:
-            # 🛠️ Remplace Settings.llm + embed_model par ServiceContext
-            Settings.service_context = ServiceContext.from_defaults(
-                llm=llm,
-                embed_model=SimpleEmbedding()
-            )
-            print("✅ ✔️ Settings configurés via ServiceContext (LLM + Embedding)")
-        except Exception as e:
-            print(f"❌ Erreur dans la configuration des Settings : {e}")
-            return {"error": str(e)}
         print("✅ LLM et embedding configurés - prêt pour le split")
         print("✅ Début du split sémantique...", flush=True)
         # ✅ Utilisation du Semantic Splitter avec le LLM actuel
         parser = SemanticSplitterNodeParser.from_defaults(llm=llm)
-        fallback_splitter = Settings.node_parser  # fallback = splitter par défaut
         doc = Document(text=data.text)
@@ -101,10 +92,6 @@ async def chunk_text(data: ChunkRequest):
             print(f"❌ Erreur lors du split sémantique : {e}")
             return {"error": str(e)}
-            # Fallback option (non utilisé ici)
-            nodes = fallback_splitter.get_nodes_from_documents([doc])
-            print(f"⚠️ Split fallback utilisé - chunks générés : {len(nodes)}")
         # ✅ Résultat complet pour l’API
         return {
             "chunks": [node.text for node in nodes],

 from pydantic import BaseModel
 from typing import Optional
+# ✅ Modules LlamaIndex – version >= 0.10.0+
 from llama_index.core.settings import Settings
+from llama_index.core import Document
 from llama_index.llms.llama_cpp import LlamaCPP
 from llama_index.core.node_parser import SemanticSplitterNodeParser
 os.environ["HF_MODULES_CACHE"] = CACHE_DIR
 os.environ["HF_HUB_CACHE"] = CACHE_DIR
 # ✅ Configuration du modèle d’embedding local (ex: BGE / Nomic / GTE etc.)
 MODEL_NAME = "BAAI/bge-small-en-v1.5"
             def get_text_embedding(self, text: str):
                 return get_embedding(text)
+        # ✅ Nouvelle configuration (⚠️ ne plus utiliser ServiceContext)
+        Settings.llm = llm
+        Settings.embed_model = SimpleEmbedding()
         print("✅ LLM et embedding configurés - prêt pour le split")
         print("✅ Début du split sémantique...", flush=True)
         # ✅ Utilisation du Semantic Splitter avec le LLM actuel
         parser = SemanticSplitterNodeParser.from_defaults(llm=llm)
         doc = Document(text=data.text)
             print(f"❌ Erreur lors du split sémantique : {e}")
             return {"error": str(e)}
         # ✅ Résultat complet pour l’API
         return {
             "chunks": [node.text for node in nodes],