Spaces:

datbkpro
/

voicebot

Running

App Files Files Community

datbkpro commited on Oct 29, 2025

Commit

1b5b7a4

verified ·

1 Parent(s): 093eb67

Update config/settings.py

Browse files

Files changed (1) hide show

config/settings.py +66 -14

config/settings.py CHANGED Viewed

@@ -1,3 +1,53 @@
 import os
 from dotenv import load_dotenv
@@ -10,17 +60,17 @@ class Settings:
     VIETNAMESE_EMBEDDING_MODEL = 'keepitreal/vietnamese-sbert'
     VIETNAMESE_LLM_MODEL = "llama-3.1-8b-instant"
-    MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'  # Sử dụng model nhẹ hơn
     MULTILINGUAL_LLM_MODEL = "llama-3.1-8b-instant"
-    # Fallback models in case primary models fail
     FALLBACK_MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
-    # Default models (fallback)
     DEFAULT_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
     DEFAULT_LLM_MODEL = "llama-3.1-8b-instant"
-    # Whisper Settings - CẬP NHẬT
     WHISPER_MODEL = "whisper-large-v3"
     # TTS Settings
@@ -30,21 +80,23 @@ class Settings:
         'de': 'de', 'ja': 'ja', 'ko': 'ko', 'zh': 'zh'
     }
-    # RAG Settings - CẬP NHẬT
-    EMBEDDING_DIMENSION = 768  # For all-MiniLM-L6-v2
     TOP_K_RESULTS = 5
-    # Audio Processing Settings - CẬP NHẬT QUAN TRỌNG
     SAMPLE_RATE = 16000
     AUDIO_CHUNK_SIZE = 1024
-    AUDIO_SILENCE_THRESHOLD = 0.005  # Ngưỡng âm lượng thấp hơn
-    MIN_AUDIO_DURATION = 0.5  # Giây - âm thanh tối thiểu
-    MAX_AUDIO_DURATION = 10.0  # Giây - âm thanh tối đa
-    # SpeechBrain VAD Settings - CẬP NHẬT
     VAD_MODEL = "snakers4/silero-vad"
-    VAD_THRESHOLD = 0.2  # Giảm threshold để nhạy hơn
-    VAD_MIN_SILENCE_DURATION = 3  # Tăng thời gian silence
-    VAD_SPEECH_PAD_DURATION = 0.3   # Tăng padding
 settings = Settings()

+# import os
+# from dotenv import load_dotenv
+# load_dotenv()
+# class Settings:
+#     GROQ_API_KEY = os.getenv("GROQ_API_KEY")
+#     # Multilingual Model Settings
+#     VIETNAMESE_EMBEDDING_MODEL = 'keepitreal/vietnamese-sbert'
+#     VIETNAMESE_LLM_MODEL = "llama-3.1-8b-instant"
+#     MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'  # Sử dụng model nhẹ hơn
+#     MULTILINGUAL_LLM_MODEL = "llama-3.1-8b-instant"
+#     # Fallback models in case primary models fail
+#     FALLBACK_MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
+#     # Default models (fallback)
+#     DEFAULT_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
+#     DEFAULT_LLM_MODEL = "llama-3.1-8b-instant"
+#     # Whisper Settings - CẬP NHẬT
+#     WHISPER_MODEL = "whisper-large-v3"
+#     # TTS Settings
+#     MAX_CHUNK_LENGTH = 200
+#     SUPPORTED_LANGUAGES = {
+#         'vi': 'vi', 'en': 'en', 'fr': 'fr', 'es': 'es',
+#         'de': 'de', 'ja': 'ja', 'ko': 'ko', 'zh': 'zh'
+#     }
+#     # RAG Settings - CẬP NHẬT
+#     EMBEDDING_DIMENSION = 768  # For all-MiniLM-L6-v2
+#     TOP_K_RESULTS = 5
+#     # Audio Processing Settings - CẬP NHẬT QUAN TRỌNG
+#     SAMPLE_RATE = 16000
+#     AUDIO_CHUNK_SIZE = 1024
+#     AUDIO_SILENCE_THRESHOLD = 0.005  # Ngưỡng âm lượng thấp hơn
+#     MIN_AUDIO_DURATION = 0.5  # Giây - âm thanh tối thiểu
+#     MAX_AUDIO_DURATION = 10.0  # Giây - âm thanh tối đa
+#     # SpeechBrain VAD Settings - CẬP NHẬT
+#     VAD_MODEL = "snakers4/silero-vad"
+#     VAD_THRESHOLD = 0.2  # Giảm threshold để nhạy hơn
+#     VAD_MIN_SILENCE_DURATION = 3  # Tăng thời gian silence
+#     VAD_SPEECH_PAD_DURATION = 0.3   # Tăng padding
+# settings = Settings()
 import os
 from dotenv import load_dotenv
     VIETNAMESE_EMBEDDING_MODEL = 'keepitreal/vietnamese-sbert'
     VIETNAMESE_LLM_MODEL = "llama-3.1-8b-instant"
+    MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
     MULTILINGUAL_LLM_MODEL = "llama-3.1-8b-instant"
+    # Fallback models
     FALLBACK_MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
+    # Default models
     DEFAULT_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
     DEFAULT_LLM_MODEL = "llama-3.1-8b-instant"
+    # Whisper Settings - TỐI ƯU HÓA
     WHISPER_MODEL = "whisper-large-v3"
     # TTS Settings
         'de': 'de', 'ja': 'ja', 'ko': 'ko', 'zh': 'zh'
     }
+    # RAG Settings
+    EMBEDDING_DIMENSION = 768
     TOP_K_RESULTS = 5
+    # Audio Processing Settings - TỐI ƯU HÓA QUAN TRỌNG
     SAMPLE_RATE = 16000
     AUDIO_CHUNK_SIZE = 1024
+    AUDIO_SILENCE_THRESHOLD = 0.003  # Giảm ngưỡng cho nhạy hơn
+    MIN_AUDIO_DURATION = 0.8  # Tăng thời gian tối thiểu
+    MAX_AUDIO_DURATION = 15.0  # Tăng thời gian tối đa
+    # SpeechBrain VAD Settings - TỐI ƯU HÓA QUAN TRỌNG
     VAD_MODEL = "snakers4/silero-vad"
+    VAD_THRESHOLD = 0.3  # Tăng threshold để ổn định hơn
+    VAD_MIN_SPEECH_DURATION = 1.0  # Thời gian speech tối thiểu
+    VAD_MIN_SILENCE_DURATION = 2.0  # Thời gian silence tối thiểu để kết thúc
+    VAD_SPEECH_PAD_DURATION = 0.5  # Tăng padding
+    VAD_PRE_SPEECH_BUFFER = 0.3  # Thêm buffer trước khi speech
 settings = Settings()