Spaces:

Photon08
/

speech_to_text

Runtime error

App Files Files Community

speech_to_text / app.py

Photon08

Update app.py

fb8c0b6 almost 3 years ago

raw

history blame

2.25 kB

	import torch
	import whisper
	import pytube
	import librosa
	import streamlit as st
	import numpy as np
	from fpdf import FPDF
	from reportlab.pdfgen.canvas import Canvas



	def predict(url=None, translation="No",tran_lang="en"):

	model_m = whisper.load_model("tiny")

	#file_path = 'https://cf-courses-data.s3.ujs.cloud-object-storage.appdomain.cloud/IBM-GPXX0EPMEN/20220627_140242.mp4'
	file_path = 'https://www.youtube.com/watch?v=-WbN61qtTGQ'
	data = pytube.YouTube(file_path)
	speech = data.streams.get_audio_only()
	audio_file = speech.download()
	audio_35 = whisper.load_audio(audio_file)

	audio = whisper.pad_or_trim(audio_35)

	mel = whisper.log_mel_spectrogram(audio).to(model_m.device)

	_,probs = model_m.detect_language(mel)

	lang_dict = sorted(probs)
	video_url = url
	v_data = pytube.YouTube(video_url)
	speech = v_data.streams.get_audio_only()
	test_audio_file = speech.download()

	transcription = model_m.transcribe(test_audio_file,fp16=False)["text"]

	if translation == "Yes":
	trans = model_m.transcribe(test_audio_file,language=tran_lang,fp16=False)["text"]
	return lang_dict, transcription, trans
	else:
	return lang_dict, transcription

	url = st.text_input(value="Please enter the YouTube url: ", label="YouTube URL")
	tran_req = st.selectbox(label="Do you want to translate the transcript?",options=("Yes","No"))

	if tran_req=="Yes":
	lang = st.selectbox(label="Please select the required language: ", options=("en","fr","jp","bn","de","ga"))
	else:
	lang = "en"

	if st.button("Generate"):
	lang_d,transcription,trans = predict(url,translation=tran_req,tran_lang=lang)

	st.write(lang_d)
	pdf = FPDF()
	pdf.add_page()

	pdf.set_font("Arial", size = 15)

	'''
	for words in transcription:
	pdf.cell(200, 10, txt = x, ln = 1, align = 'L')
	output = pdf.output("transcript.pdf")
	st.download(label="Click here to download the transcript", data=output, mime='pdf',file_name="transcript.pdf")
	'''
	canvas = Canvas("transcript.pdf")
	canvas.drawString(72, 72, transcription)
	canvas.save()
	st.download(label="Click here to download the transcript", data=canvas, mime='pdf',file_name="transcript.pdf")