WillHeld
/

DiVA-llama-3-v0-8b

Feature Extraction

Model card Files Files and versions

Helw150 commited on Jun 20, 2024

Commit

cd5984d

·

1 Parent(s): c583d87

Try and get this custom stuff working

Files changed (2) hide show

__init__.py +0 -0
modeling_diva.py +4 -2

__init__.py ADDED Viewed

File without changes

modeling_diva.py CHANGED Viewed

@@ -11,11 +11,11 @@ import torch.nn.functional as F
 from datasets import Audio
 from safetensors.torch import load, load_model
 from torch import nn
 from transformers import (
     AutoProcessor,
     AutoTokenizer,
     LlamaForCausalLM,
-    PretrainedConfig,
     PreTrainedModel,
     WhisperForConditionalGeneration,
 )
@@ -44,10 +44,12 @@ class WhisperConnector(nn.Module):
 class DiVAModel(PreTrainedModel):
     def __init__(
         self, via_path=None, config_dict={}, device_map=None, speech_encoder_device=None
     ):
-        super().__init__(PretrainedConfig.from_dict(config_dict))
         if speech_encoder_device is None:
             speech_encoder_device = "cuda:0"
         whisper = WhisperForConditionalGeneration.from_pretrained(

 from datasets import Audio
 from safetensors.torch import load, load_model
 from torch import nn
+from .configuring_diva import DiVAConfig
 from transformers import (
     AutoProcessor,
     AutoTokenizer,
     LlamaForCausalLM,
     PreTrainedModel,
     WhisperForConditionalGeneration,
 )
 class DiVAModel(PreTrainedModel):
+    config_class = DiVAConfig
     def __init__(
         self, via_path=None, config_dict={}, device_map=None, speech_encoder_device=None
     ):
+        super().__init__(DiVAConfig.from_dict(config_dict))
         if speech_encoder_device is None:
             speech_encoder_device = "cuda:0"
         whisper = WhisperForConditionalGeneration.from_pretrained(