Spaces:

noblebarkrr
/

mvsepless_zero_gpu

Running on Zero

File size: 10,283 Bytes

import os
import sys
import time
try:
    import yt_dlp
    import validators
except ImportError:
    os.system("pip install validators")
    os.system("pip install yt-dlp")
    import validators
    import yt_dlp

# Обновление базы при запуске
os.system("wget -nv -O models.json https://github.com/noblebarkrr/mvsepless/raw/refs/heads/beta/models.json")
os.system("wget -nv -O assets/translations.py https://github.com/noblebarkrr/mvsepless/raw/refs/heads/beta/assets/translations.py")
os.system("wget -nv -O multi_inference.py https://github.com/noblebarkrr/mvsepless/raw/refs/heads/beta/multi_inference.py")

import spaces 
import shutil
import argparse
from datetime import datetime
import gradio as gr
os.system("wget -nv https://github.com/noblebarkrr/mvsepless/raw/bd611441e48e918650e6860738894673b3a1a5f1/fixed/fairseq_fixed-0.13.0-cp311-cp311-linux_x86_64.whl && pip install ./fairseq_fixed-0.13.0-cp311-cp311-linux_x86_64.whl")
os.system("wget -nv https://github.com/noblebarkrr/mvsepless/raw/bd611441e48e918650e6860738894673b3a1a5f1/fixed/audio_separator-0.32.0-py3-none-any.whl && pip install ./audio_separator-0.32.0-py3-none-any.whl")
from multi_inference import MVSEPLESS, OUTPUT_FORMATS
from assets.translations import TRANSLATIONS, TRANSLATIONS_STEMS

COOKIE_FILE = None
DOWNLOAD_DIR = os.path.join(os.getcwd(), "downloaded")
OUTPUT_DIR = os.path.join(os.getcwd(), "output")
plugins_dir = os.path.join(os.getcwd(), "plugins")
os.makedirs(plugins_dir, exist_ok=True)

def load_cookie(file):
    global COOKIE_FILE
    COOKIE_FILE = file
    gr.Warning(t("cookie_loaded"))

def download_file(url):

    ydl_opts = {
        'format': 'bestaudio/best',
        'outtmpl': os.path.join(DOWNLOAD_DIR, '%(title)s.%(ext)s'),
        'postprocessors': [{
            'key': 'FFmpegExtractAudio',
            'preferredcodec': 'mp3',
            'preferredquality': '320',
        }],
        'noplaylist': True,  # Скачивать только одно видео, не плейлист
        'quiet': True,       # Отключить вывод в консоль
        'no_warnings': True, # Скрыть предупреждения
    }
    
    # Добавляем cookies если указаны
    if COOKIE_FILE and os.path.exists(COOKIE_FILE):
        ydl_opts['cookiefile'] = COOKIE_FILE
    
    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
        info = ydl.extract_info(url, download=True)
        
        # Получаем имя файла из метаданных
        if '_type' in info and info['_type'] == 'playlist':
            # Для плейлистов берем первое видео
            entry = info['entries'][0]
            filename = ydl.prepare_filename(entry)
        else:
            # Для одиночного видео
            filename = ydl.prepare_filename(info)
        
        # Заменяем оригинальное расширение на .mp3
        base, _ = os.path.splitext(filename)
        audio_file = base + '.mp3'
        
        return os.path.abspath(audio_file)

CURRENT_LANG = "ru"

def t(key, **kwargs):
    """Функция для получения перевода с подстановкой значений"""
    lang = CURRENT_LANG
    translation = TRANSLATIONS.get(lang, {}).get(key, key)
    return translation.format(**kwargs) if kwargs else translation

def t_stem(key, **kwargs):
    """Функция для получения перевода с подстановкой значений"""
    lang = CURRENT_LANG
    translation = TRANSLATIONS_STEMS.get(lang, {}).get(key, key)
    return translation.format(**kwargs) if kwargs else translation

def gen_out_dir():
    return os.path.join(OUTPUT_DIR, datetime.now().strftime("%Y%m%d_%H%M%S"))

mvsepless = MVSEPLESS()

@spaces.GPU
def sep_wrapper(a, b, c, d, e, f, g, h):
    if a is not None:
        if validators.url(a) and not os.path.exists(a):
            a = download_file(a)
    if not g:
        g = 128
    results = mvsepless.separator(input_file=a, output_dir=gen_out_dir(), model_type=b, model_name=c, ext_inst=d, vr_aggr=e, output_format=f, output_bitrate=f'{g}k', call_method="cli", selected_stems=h)
    stems = []
    if results:
        for i, (stem, output_file) in enumerate(results[:20]):
            stems.append(gr.update(
                visible=True,
                label=t_stem(stem),
                value=output_file
            ))
    
    while len(stems) < 20:
        stems.append(gr.update(visible=False, label=None, value=None))
        
    return tuple(stems)


theme = gr.themes.Default(
        primary_hue="violet",
        secondary_hue="cyan",
        neutral_hue="blue",
        spacing_size="sm",
        font=[gr.themes.GoogleFont("Tektur"), 'ui-sans-serif', 'system-ui', 'sans-serif'],
    ).set(
        body_text_color='*neutral_950',
        body_text_color_subdued='*neutral_500',
        background_fill_primary='*neutral_200',
        background_fill_primary_dark='*neutral_800',
        border_color_accent='*primary_950',
        border_color_accent_dark='*neutral_700',
        border_color_accent_subdued='*primary_500',
        border_color_primary='*primary_800',
        border_color_primary_dark='*neutral_400',
        color_accent_soft='*primary_100',
        color_accent_soft_dark='*neutral_800',
        link_text_color='*secondary_700',
        link_text_color_active='*secondary_700',
        link_text_color_hover='*secondary_800',
        link_text_color_visited='*secondary_600',
        link_text_color_visited_dark='*secondary_700',
        block_background_fill='*background_fill_secondary',
        block_background_fill_dark='*neutral_950',
        block_label_background_fill='*secondary_400',
        block_label_text_color='*neutral_800',
        panel_background_fill='*background_fill_primary',
        checkbox_background_color='*background_fill_secondary',
        checkbox_label_background_fill_dark='*neutral_900',
        input_background_fill_dark='*neutral_900',
        input_background_fill_focus='*neutral_100',
        input_background_fill_focus_dark='*neutral_950',
        button_small_radius='*radius_sm',
        button_secondary_background_fill='*neutral_400',
        button_secondary_background_fill_dark='*neutral_500',
        button_secondary_background_fill_hover_dark='*neutral_950'
    )


def create_app():
    with gr.Row():
        with gr.Column():
            input_audio = gr.Audio(label=t("select_file"), interactive=True, type="filepath")
            input_audio_path = gr.Textbox(label=t("audio_path"), info=t("audio_path_info"), interactive=True)
            use_cookies = gr.UploadButton(label=t("use_cookies"), size="sm", file_count="single", file_types=[".txt"])
        with gr.Column():
            with gr.Row():
                model_type = gr.Dropdown(label=t("model_type"), choices=mvsepless.get_mt(), value=mvsepless.get_mt()[0], interactive=True, filterable=False)
                model_name = gr.Dropdown(label=t("model_name"), choices=mvsepless.get_mn(mvsepless.get_mt()[0]), value=mvsepless.get_mn(mvsepless.get_mt()[0])[0], interactive=True, filterable=False)
            target_instrument = gr.Textbox(label=t("target_instrument"), value=mvsepless.get_tgt_inst(mvsepless.get_mt()[0], mvsepless.get_mn(mvsepless.get_mt()[0])[0]), interactive=False)
            vr_aggr = gr.Slider(0, 100, step=1, label=t("vr_aggressiveness"), visible=False, value=5, interactive=True)
            extract_instrumental = gr.Checkbox(label=t("extract_instrumental"), value=True, interactive=True)
            stems_list = gr.CheckboxGroup(label=t("stems_list"), info=t("stems_info", target_instrument="vocals"), choices=mvsepless.get_stems(mvsepless.get_mt()[0], mvsepless.get_mn(mvsepless.get_mt()[0])[0]), value=None, interactive=False)
            with gr.Row():
                output_format, output_bitrate = gr.Dropdown(label=t("output_format"), choices=OUTPUT_FORMATS, value="mp3", interactive=True, filterable=False), gr.Slider(32, 320, step=1, label=t("bitrate"), value=320, interactive=True)
            separate_btn = gr.Button(t("separate_btn"), variant="primary", interactive=True)
    download_via_zip_btn = gr.DownloadButton(label="Download via zip", visible=False, interactive=True)
    output_stems = []
    for _ in range(10):
        with gr.Row():
            audio1 = gr.Audio(visible=False, interactive=False, type="filepath", show_download_button=True)
            audio2 = gr.Audio(visible=False, interactive=False, type="filepath", show_download_button=True)
            output_stems.extend([audio1, audio2])

    input_audio.upload(fn=(lambda x: gr.update(value=x)), inputs=input_audio, outputs=input_audio_path)
    model_type.change(fn=(lambda x: gr.update(choices=mvsepless.get_mn(x), value=mvsepless.get_mn(x)[0])), inputs=model_type, outputs=model_name).then(fn=(lambda x: (gr.update(visible=False if x in ["vr", "mdx"] else True), gr.update(visible=True if x == "vr" else False))), inputs=model_type, outputs=[extract_instrumental, vr_aggr])
    model_name.change(fn=(lambda x, y: gr.update(choices=mvsepless.get_stems(x, y), value=None)), inputs=[model_type, model_name], outputs=stems_list).then(fn=(lambda x, y: (gr.update(interactive=True if mvsepless.get_tgt_inst(x, y) == None else None, info=t("stems_info", target_instrument=mvsepless.get_tgt_inst(x, y)) if mvsepless.get_tgt_inst(x, y) is not None else t("stems_info2")), gr.update(value=mvsepless.get_tgt_inst(x, y)), gr.update(value=True if mvsepless.get_tgt_inst(x, y) is not None else False))), inputs=[model_type, model_name], outputs=[stems_list, target_instrument, extract_instrumental])
    separate_btn.click(fn=sep_wrapper, inputs=[input_audio_path, model_type, model_name, extract_instrumental, vr_aggr, output_format, output_bitrate, stems_list], outputs=output_stems, show_progress_on=input_audio)

    use_cookies.upload(fn=load_cookie, inputs=use_cookies)

CURRENT_LANG = "ru"
css = """
.fixed-height { height: 160px !important; min-height: 160px !important; }
.fixed-height2 { height: 250px !important; min-height: 250px !important; }
"""

with gr.Blocks(theme=theme, css=css) as app:
    create_app()

app.launch(allowed_paths=["/"], server_port=7860, share=False)