Spaces:
Runtime error
Runtime error
Update app.py
Browse files
app.py
CHANGED
|
@@ -27,10 +27,10 @@ DEFAULT_MODEL = 'wangchanberta-hyp'
|
|
| 27 |
DEFAULT_SENTENCE_EMBEDDING_MODEL = 'intfloat/multilingual-e5-base'
|
| 28 |
|
| 29 |
MODEL_DICT = {
|
| 30 |
-
'wangchanberta': '
|
| 31 |
-
'wangchanberta-hyp': '
|
| 32 |
-
'mdeberta': '
|
| 33 |
-
'mdeberta-hyp': '
|
| 34 |
}
|
| 35 |
|
| 36 |
DATA_PATH = 'models/dataset.xlsx'
|
|
@@ -138,40 +138,26 @@ class Chatbot:
|
|
| 138 |
similar_questions, similar_contexts, distances, indices = self.faiss_search(question_vector)
|
| 139 |
context = similar_contexts[0]
|
| 140 |
Answer = self.model_pipeline(str(message), context)
|
| 141 |
-
start_index = context.find(Answer)
|
| 142 |
-
end_index = start_index + len(Answer)
|
| 143 |
-
output = {
|
| 144 |
-
|
| 145 |
-
|
| 146 |
-
|
| 147 |
-
|
| 148 |
-
|
| 149 |
-
}
|
| 150 |
-
return output
|
| 151 |
-
|
| 152 |
-
|
| 153 |
-
def highlight_text(text, start_index, end_index):
|
| 154 |
-
if start_index < 0:
|
| 155 |
-
start_index = 0
|
| 156 |
-
if end_index > len(text):
|
| 157 |
-
end_index = len(text)
|
| 158 |
-
highlighted_text = ""
|
| 159 |
-
for i, char in enumerate(text):
|
| 160 |
-
if i == start_index:
|
| 161 |
-
highlighted_text += "<mark>"
|
| 162 |
-
highlighted_text += char
|
| 163 |
-
if i == end_index - 1:
|
| 164 |
-
highlighted_text += "</mark>"
|
| 165 |
-
return highlighted_text
|
| 166 |
-
|
| 167 |
|
| 168 |
if __name__ == "__main__":
|
| 169 |
bot = ChatbotModel()
|
| 170 |
|
| 171 |
def chat_interface(question, history):
|
| 172 |
response = bot._chatbot.predict(question)
|
| 173 |
-
highlighted_answer = highlight_text(response["answer"], response["highlight_start"], response["highlight_end"])
|
| 174 |
-
return highlighted_answer
|
|
|
|
| 175 |
|
| 176 |
EXAMPLE = ["หลิน ไห่เฟิง มีชื่อเรียกอีกชื่อว่าอะไร" , "ใครเป็นผู้ตั้งสภาเศรษฐกิจโลกขึ้นในปี พ.ศ. 2514 โดยทุกปีจะมีการประชุมที่ประเทศสวิตเซอร์แลนด์", "โปรดิวเซอร์ของอัลบั้มตลอดกาล ของวงคีรีบูนคือใคร", "สกุลเดิมของหม่อมครูนุ่ม นวรัตน ณ อยุธยา คืออะไร"]
|
| 177 |
|
|
|
|
| 27 |
DEFAULT_SENTENCE_EMBEDDING_MODEL = 'intfloat/multilingual-e5-base'
|
| 28 |
|
| 29 |
MODEL_DICT = {
|
| 30 |
+
'wangchanberta': 'powerpuf-bot/wangchanberta-th-wiki-qa_ref-params',
|
| 31 |
+
'wangchanberta-hyp': 'powerpuf-bot/wangchanberta-th-wiki-qa_hyp-params',
|
| 32 |
+
'mdeberta': 'powerpuf-bot/mdeberta-v3-th-wiki-qa_ref-params',
|
| 33 |
+
'mdeberta-hyp': 'powerpuf-bot/mdeberta-v3-th-wiki-qa_hyp-params',
|
| 34 |
}
|
| 35 |
|
| 36 |
DATA_PATH = 'models/dataset.xlsx'
|
|
|
|
| 138 |
similar_questions, similar_contexts, distances, indices = self.faiss_search(question_vector)
|
| 139 |
context = similar_contexts[0]
|
| 140 |
Answer = self.model_pipeline(str(message), context)
|
| 141 |
+
# start_index = context.find(Answer)
|
| 142 |
+
# end_index = start_index + len(Answer)
|
| 143 |
+
# output = {
|
| 144 |
+
# "user_question": message,
|
| 145 |
+
# "answer": self.df['Answer'][indices[0][0]],
|
| 146 |
+
# "distance": round(distances[0][0], 4),
|
| 147 |
+
# "highlight_start": start_index,
|
| 148 |
+
# "highlight_end": end_index
|
| 149 |
+
# }
|
| 150 |
+
# return output
|
| 151 |
+
return Answer
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 152 |
|
| 153 |
if __name__ == "__main__":
|
| 154 |
bot = ChatbotModel()
|
| 155 |
|
| 156 |
def chat_interface(question, history):
|
| 157 |
response = bot._chatbot.predict(question)
|
| 158 |
+
# highlighted_answer = highlight_text(response["answer"], response["highlight_start"], response["highlight_end"])
|
| 159 |
+
# return highlighted_answer
|
| 160 |
+
return response
|
| 161 |
|
| 162 |
EXAMPLE = ["หลิน ไห่เฟิง มีชื่อเรียกอีกชื่อว่าอะไร" , "ใครเป็นผู้ตั้งสภาเศรษฐกิจโลกขึ้นในปี พ.ศ. 2514 โดยทุกปีจะมีการประชุมที่ประเทศสวิตเซอร์แลนด์", "โปรดิวเซอร์ของอัลบั้มตลอดกาล ของวงคีรีบูนคือใคร", "สกุลเดิมของหม่อมครูนุ่ม นวรัตน ณ อยุธยา คืออะไร"]
|
| 163 |
|