Spaces:

kassaby
/

recitation-segmenter-app

Sleeping

App Files Files Community

kassaby commited on 15 days ago

Commit

382faa1

verified ·

1 Parent(s): d98c022

Update app.py

Browse files

Files changed (1) hide show

app.py +54 -16

app.py CHANGED Viewed

@@ -8,6 +8,9 @@ from transformers import AutoFeatureExtractor, AutoModelForAudioFrameClassificat
 from recitations_segmenter import segment_recitations, clean_speech_intervals
 import io
 from PIL import Image
 # Setup device and model
 device = 'cuda' if torch.cuda.is_available() else 'cpu'
@@ -93,7 +96,7 @@ def process_audio(audio_file, min_silence_ms, min_speech_ms, pad_ms):
     """معالجة الملف الصوتي وتقطيعه"""
     if audio_file is None:
-        return None, "⚠️ من فضلك ارفع ملف صوتي", []
     try:
         # قراءة الملف
@@ -125,7 +128,6 @@ def process_audio(audio_file, min_silence_ms, min_speech_ms, pad_ms):
         plot_img, stats_text = plot_signal(wav, intervals)
         # استخراج المقاطع الصوتية
-        audio_segments = []
         num_segments = len(intervals)
         result_text = f"✅ تم التقطيع بنجاح!\n\n"
@@ -135,6 +137,10 @@ def process_audio(audio_file, min_silence_ms, min_speech_ms, pad_ms):
         result_text += stats_text
         result_text += "=" * 50 + "\n\n"
         for idx in range(num_segments):
             audio_seg = get_interval(
                 x=wav,
@@ -150,12 +156,34 @@ def process_audio(audio_file, min_silence_ms, min_speech_ms, pad_ms):
             duration = len(audio_seg) / 16000
             result_text += f"مقطع {idx + 1}: من {intervals[idx][0]:.2f}s إلى {intervals[idx][1]:.2f}s (المدة: {duration:.2f}s)\n"
-            audio_segments.append((16000, audio_seg))
-        return plot_img, result_text, audio_segments
     except Exception as e:
-        return None, f"❌ حدث خطأ: {str(e)}", []
 # إنشاء واجهة Gradio
 with gr.Blocks(title="تقطيع التلاوات القرآنية") as demo:
@@ -210,19 +238,27 @@ with gr.Blocks(title="تقطيع التلاوات القرآنية") as demo:
                 max_lines=20
             )
-    gr.Markdown("### 🎵 المقاطع الصوتية المستخرجة")
-    audio_outputs = []
-    for i in range(20):  # عدد أقصى من المقاطع
-        audio_outputs.append(gr.Audio(label=f"مقطع {i+1}", visible=False))
     def process_and_show(audio, min_sil, min_sp, pad):
-        plot, text, segments = process_audio(audio, min_sil, min_sp, pad)
-        outputs = [plot, text]
-        for i in range(20):
             if i < len(segments):
-                outputs.append(gr.Audio(value=segments[i], visible=True))
             else:
                 outputs.append(gr.Audio(visible=False))
@@ -231,7 +267,7 @@ with gr.Blocks(title="تقطيع التلاوات القرآنية") as demo:
     process_btn.click(
         fn=process_and_show,
         inputs=[audio_input, min_silence, min_speech, padding],
-        outputs=[plot_output, result_text] + audio_outputs
     )
     gr.Markdown("""
@@ -240,8 +276,10 @@ with gr.Blocks(title="تقطيع التلاوات القرآنية") as demo:
     - الأداة تستخدم نموذج AI مدرب خصيصاً لتقطيع التلاوات القرآنية
     - يتم اكتشاف فترات الكلام والسكوت تلقائياً
-    - يمكنك تعديل الإعدادات للحصول على نتائج أفضل
     """)
 if __name__ == "__main__":
-    demo.launch()

 from recitations_segmenter import segment_recitations, clean_speech_intervals
 import io
 from PIL import Image
+import tempfile
+import os
+import zipfile
 # Setup device and model
 device = 'cuda' if torch.cuda.is_available() else 'cpu'
     """معالجة الملف الصوتي وتقطيعه"""
     if audio_file is None:
+        return None, "⚠️ من فضلك ارفع ملف صوتي", None, []
     try:
         # قراءة الملف
         plot_img, stats_text = plot_signal(wav, intervals)
         # استخراج المقاطع الصوتية
         num_segments = len(intervals)
         result_text = f"✅ تم التقطيع بنجاح!\n\n"
         result_text += stats_text
         result_text += "=" * 50 + "\n\n"
+        # إنشاء مجلد مؤقت للمقاطع
+        temp_dir = tempfile.mkdtemp()
+        segment_files = []
         for idx in range(num_segments):
             audio_seg = get_interval(
                 x=wav,
             duration = len(audio_seg) / 16000
             result_text += f"مقطع {idx + 1}: من {intervals[idx][0]:.2f}s إلى {intervals[idx][1]:.2f}s (المدة: {duration:.2f}s)\n"
+            # حفظ المقطع
+            segment_path = os.path.join(temp_dir, f"segment_{idx+1:03d}.wav")
+            sf.write(segment_path, audio_seg, 16000)
+            segment_files.append(segment_path)
+        # إنشاء ملف ZIP
+        zip_path = os.path.join(temp_dir, "segments.zip")
+        with zipfile.ZipFile(zip_path, 'w') as zipf:
+            for seg_file in segment_files:
+                zipf.write(seg_file, os.path.basename(seg_file))
+        # إنشاء HTML لعرض المقاطع
+        audio_html = "<div style='max-height: 500px; overflow-y: auto;'>"
+        for idx, seg_file in enumerate(segment_files):
+            audio_html += f"""
+            <div style='margin: 10px 0; padding: 10px; border: 1px solid #ddd; border-radius: 5px;'>
+                <h4 style='margin: 5px 0;'>🎵 مقطع {idx + 1}</h4>
+                <audio controls style='width: 100%;'>
+                    <source src='file/{seg_file}' type='audio/wav'>
+                </audio>
+            </div>
+            """
+        audio_html += "</div>"
+        return plot_img, result_text, zip_path, segment_files
     except Exception as e:
+        return None, f"❌ حدث خطأ: {str(e)}", None, []
 # إنشاء واجهة Gradio
 with gr.Blocks(title="تقطيع التلاوات القرآنية") as demo:
                 max_lines=20
             )
+    gr.Markdown("### 💾 تحميل المقاطع")
+    zip_download = gr.File(label="📦 حمل كل المقاطع (ZIP)")
+    gr.Markdown("### 🎵 استماع للمقاطع")
+    # عرض المقاطع الصوتية
+    segment_outputs = []
+    for i in range(50):  # حد أقصى 50 مقطع
+        audio_out = gr.Audio(label=f"مقطع {i+1}", visible=False)
+        segment_outputs.append(audio_out)
     def process_and_show(audio, min_sil, min_sp, pad):
+        plot, text, zip_file, segments = process_audio(audio, min_sil, min_sp, pad)
+        outputs = [plot, text, zip_file]
+        # إظهار المقاطع
+        for i in range(50):
             if i < len(segments):
+                outputs.append(gr.Audio(value=segments[i], visible=True, label=f"مقطع {i+1}"))
             else:
                 outputs.append(gr.Audio(visible=False))
     process_btn.click(
         fn=process_and_show,
         inputs=[audio_input, min_silence, min_speech, padding],
+        outputs=[plot_output, result_text, zip_download] + segment_outputs
     )
     gr.Markdown("""
     - الأداة تستخدم نموذج AI مدرب خصيصاً لتقطيع التلاوات القرآنية
     - يتم اكتشاف فترات الكلام والسكوت تلقائياً
+    - يمكنك تحميل كل المقاطع دفعة واحدة من ملف ZIP
+    - أو الاستماع لكل مقطع على حدة
     """)
 if __name__ == "__main__":
+    demo.launch()