datbkpro commited on
Commit
1b5b7a4
·
verified ·
1 Parent(s): 093eb67

Update config/settings.py

Browse files
Files changed (1) hide show
  1. config/settings.py +66 -14
config/settings.py CHANGED
@@ -1,3 +1,53 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  import os
2
  from dotenv import load_dotenv
3
 
@@ -10,17 +60,17 @@ class Settings:
10
  VIETNAMESE_EMBEDDING_MODEL = 'keepitreal/vietnamese-sbert'
11
  VIETNAMESE_LLM_MODEL = "llama-3.1-8b-instant"
12
 
13
- MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2' # Sử dụng model nhẹ hơn
14
  MULTILINGUAL_LLM_MODEL = "llama-3.1-8b-instant"
15
 
16
- # Fallback models in case primary models fail
17
  FALLBACK_MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
18
 
19
- # Default models (fallback)
20
  DEFAULT_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
21
  DEFAULT_LLM_MODEL = "llama-3.1-8b-instant"
22
 
23
- # Whisper Settings - CẬP NHẬT
24
  WHISPER_MODEL = "whisper-large-v3"
25
 
26
  # TTS Settings
@@ -30,21 +80,23 @@ class Settings:
30
  'de': 'de', 'ja': 'ja', 'ko': 'ko', 'zh': 'zh'
31
  }
32
 
33
- # RAG Settings - CẬP NHẬT
34
- EMBEDDING_DIMENSION = 768 # For all-MiniLM-L6-v2
35
  TOP_K_RESULTS = 5
36
 
37
- # Audio Processing Settings - CẬP NHẬT QUAN TRỌNG
38
  SAMPLE_RATE = 16000
39
  AUDIO_CHUNK_SIZE = 1024
40
- AUDIO_SILENCE_THRESHOLD = 0.005 # Ngưỡng âm lượng thấp hơn
41
- MIN_AUDIO_DURATION = 0.5 # Giây - âm thanh tối thiểu
42
- MAX_AUDIO_DURATION = 10.0 # Giây - âm thanh tối đa
43
 
44
- # SpeechBrain VAD Settings - CẬP NHẬT
45
  VAD_MODEL = "snakers4/silero-vad"
46
- VAD_THRESHOLD = 0.2 # Giảm threshold để nhạy hơn
47
- VAD_MIN_SILENCE_DURATION = 3 # Tăng thời gian silence
48
- VAD_SPEECH_PAD_DURATION = 0.3 # Tăng padding
 
 
49
 
50
  settings = Settings()
 
1
+ # import os
2
+ # from dotenv import load_dotenv
3
+
4
+ # load_dotenv()
5
+
6
+ # class Settings:
7
+ # GROQ_API_KEY = os.getenv("GROQ_API_KEY")
8
+
9
+ # # Multilingual Model Settings
10
+ # VIETNAMESE_EMBEDDING_MODEL = 'keepitreal/vietnamese-sbert'
11
+ # VIETNAMESE_LLM_MODEL = "llama-3.1-8b-instant"
12
+
13
+ # MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2' # Sử dụng model nhẹ hơn
14
+ # MULTILINGUAL_LLM_MODEL = "llama-3.1-8b-instant"
15
+
16
+ # # Fallback models in case primary models fail
17
+ # FALLBACK_MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
18
+
19
+ # # Default models (fallback)
20
+ # DEFAULT_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
21
+ # DEFAULT_LLM_MODEL = "llama-3.1-8b-instant"
22
+
23
+ # # Whisper Settings - CẬP NHẬT
24
+ # WHISPER_MODEL = "whisper-large-v3"
25
+
26
+ # # TTS Settings
27
+ # MAX_CHUNK_LENGTH = 200
28
+ # SUPPORTED_LANGUAGES = {
29
+ # 'vi': 'vi', 'en': 'en', 'fr': 'fr', 'es': 'es',
30
+ # 'de': 'de', 'ja': 'ja', 'ko': 'ko', 'zh': 'zh'
31
+ # }
32
+
33
+ # # RAG Settings - CẬP NHẬT
34
+ # EMBEDDING_DIMENSION = 768 # For all-MiniLM-L6-v2
35
+ # TOP_K_RESULTS = 5
36
+
37
+ # # Audio Processing Settings - CẬP NHẬT QUAN TRỌNG
38
+ # SAMPLE_RATE = 16000
39
+ # AUDIO_CHUNK_SIZE = 1024
40
+ # AUDIO_SILENCE_THRESHOLD = 0.005 # Ngưỡng âm lượng thấp hơn
41
+ # MIN_AUDIO_DURATION = 0.5 # Giây - âm thanh tối thiểu
42
+ # MAX_AUDIO_DURATION = 10.0 # Giây - âm thanh tối đa
43
+
44
+ # # SpeechBrain VAD Settings - CẬP NHẬT
45
+ # VAD_MODEL = "snakers4/silero-vad"
46
+ # VAD_THRESHOLD = 0.2 # Giảm threshold để nhạy hơn
47
+ # VAD_MIN_SILENCE_DURATION = 3 # Tăng thời gian silence
48
+ # VAD_SPEECH_PAD_DURATION = 0.3 # Tăng padding
49
+
50
+ # settings = Settings()
51
  import os
52
  from dotenv import load_dotenv
53
 
 
60
  VIETNAMESE_EMBEDDING_MODEL = 'keepitreal/vietnamese-sbert'
61
  VIETNAMESE_LLM_MODEL = "llama-3.1-8b-instant"
62
 
63
+ MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
64
  MULTILINGUAL_LLM_MODEL = "llama-3.1-8b-instant"
65
 
66
+ # Fallback models
67
  FALLBACK_MULTILINGUAL_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
68
 
69
+ # Default models
70
  DEFAULT_EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
71
  DEFAULT_LLM_MODEL = "llama-3.1-8b-instant"
72
 
73
+ # Whisper Settings - TỐI ƯU HÓA
74
  WHISPER_MODEL = "whisper-large-v3"
75
 
76
  # TTS Settings
 
80
  'de': 'de', 'ja': 'ja', 'ko': 'ko', 'zh': 'zh'
81
  }
82
 
83
+ # RAG Settings
84
+ EMBEDDING_DIMENSION = 768
85
  TOP_K_RESULTS = 5
86
 
87
+ # Audio Processing Settings - TỐI ƯU HÓA QUAN TRỌNG
88
  SAMPLE_RATE = 16000
89
  AUDIO_CHUNK_SIZE = 1024
90
+ AUDIO_SILENCE_THRESHOLD = 0.003 # Giảm ngưỡng cho nhạy hơn
91
+ MIN_AUDIO_DURATION = 0.8 # Tăng thời gian tối thiểu
92
+ MAX_AUDIO_DURATION = 15.0 # Tăng thời gian tối đa
93
 
94
+ # SpeechBrain VAD Settings - TỐI ƯU HÓA QUAN TRỌNG
95
  VAD_MODEL = "snakers4/silero-vad"
96
+ VAD_THRESHOLD = 0.3 # Tăng threshold để ổn định hơn
97
+ VAD_MIN_SPEECH_DURATION = 1.0 # Thời gian speech tối thiểu
98
+ VAD_MIN_SILENCE_DURATION = 2.0 # Thời gian silence tối thiểu để kết thúc
99
+ VAD_SPEECH_PAD_DURATION = 0.5 # Tăng padding
100
+ VAD_PRE_SPEECH_BUFFER = 0.3 # Thêm buffer trước khi speech
101
 
102
  settings = Settings()