prince-canuma commited on 3 days ago

Commit

39159bd

verified ·

1 Parent(s): 8dae1fa

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

README.md +8 -236
config.json +20 -964
model-00001-of-00046.safetensors +2 -2
model-00002-of-00046.safetensors +2 -2
model-00003-of-00046.safetensors +2 -2
model-00004-of-00046.safetensors +2 -2
model-00005-of-00046.safetensors +2 -2
model-00006-of-00046.safetensors +2 -2
model-00007-of-00046.safetensors +2 -2
model-00008-of-00046.safetensors +2 -2
model-00009-of-00046.safetensors +2 -2
model-00010-of-00046.safetensors +2 -2
model-00011-of-00046.safetensors +2 -2
model-00012-of-00046.safetensors +2 -2
model-00013-of-00046.safetensors +2 -2
model-00014-of-00046.safetensors +2 -2
model-00015-of-00046.safetensors +2 -2
model-00016-of-00046.safetensors +2 -2
model-00017-of-00046.safetensors +2 -2
model-00018-of-00046.safetensors +2 -2
model-00019-of-00046.safetensors +2 -2
model-00020-of-00046.safetensors +2 -2
model-00021-of-00046.safetensors +2 -2
model-00022-of-00046.safetensors +2 -2
model-00023-of-00046.safetensors +2 -2
model-00024-of-00046.safetensors +2 -2
model-00025-of-00046.safetensors +2 -2
model-00026-of-00046.safetensors +2 -2
model-00027-of-00046.safetensors +2 -2
model-00028-of-00046.safetensors +2 -2
model-00029-of-00046.safetensors +2 -2
model-00030-of-00046.safetensors +2 -2
model-00031-of-00046.safetensors +2 -2
model-00032-of-00046.safetensors +2 -2
model-00033-of-00046.safetensors +2 -2
model-00034-of-00046.safetensors +2 -2
model-00035-of-00046.safetensors +2 -2
model-00036-of-00046.safetensors +2 -2
model-00037-of-00046.safetensors +2 -2
model-00038-of-00046.safetensors +2 -2
model-00039-of-00046.safetensors +2 -2
model-00040-of-00046.safetensors +2 -2
model-00041-of-00046.safetensors +2 -2
model-00042-of-00046.safetensors +2 -2
model-00043-of-00046.safetensors +2 -2
model-00044-of-00046.safetensors +2 -2
model-00045-of-00046.safetensors +2 -2
model-00046-of-00046.safetensors +2 -2
model.safetensors.index.json +335 -3
preprocessor_config.json +21 -0

README.md CHANGED Viewed

@@ -1,249 +1,21 @@
 ---
-library_name: mlx
 license: apache-2.0
 license_link: https://huggingface.co/Qwen/Qwen3.5-397B-A17B/blob/main/LICENSE
-base_model: Qwen/Qwen3.5-397B-A17B
-pipeline_tag: text-generation
 tags:
 - mlx
-- 4bit
-- quantized
-- qwen3_5_moe
-- moe
-- mixture-of-experts
-- text-generation
-- conversational
-- apple-silicon
-language:
-- multilingual
 ---
-# Qwen3.5-397B-A17B-4bit (MLX)
-4-bit [MLX](https://github.com/ml-explore/mlx) quantized version of the **text** model from [Qwen/Qwen3.5-397B-A17B](https://huggingface.co/Qwen/Qwen3.5-397B-A17B).
-Portions of this card were copied or adapted from the original model card, authored by the Qwen team.
-## Model Overview
-Qwen3.5-397B-A17B is Alibaba's latest flagship language model, featuring a hybrid architecture that combines Gated DeltaNet (linear attention) with sparse Mixture-of-Experts for high-throughput inference. Despite having 397B total parameters, only ~17B are activated per token, making it remarkably efficient for its capability level.
-This conversion provides a **text-only** 4-bit quantized version optimized for local inference on Apple Silicon Macs via the MLX framework. The vision encoder from the original multimodal model is not included — for image/video understanding, refer to the original [Qwen/Qwen3.5-397B-A17B](https://huggingface.co/Qwen/Qwen3.5-397B-A17B).
-### Key Capabilities
-- **201 languages and dialects** with deep cultural and regional understanding
-- **262K native context** (extensible to 1M+ with YaRN)
-- **Thinking mode** with chain-of-thought reasoning (`<think>...</think>`)
-- **Tool use and agentic workflows** (MCP, function calling)
-- **Competitive benchmarks**: MMLU-Pro 87.8, SuperGPQA 70.4, C-Eval 93.0
-## Architecture
-| Parameter | Value |
-|---|---|
-| Total Parameters | 397B |
-| Active Parameters | ~17B |
-| Hidden Size | 4,096 |
-| Layers | 60 |
-| Layer Layout | 15 × (3 × Gated DeltaNet + 1 × Full Attention), all with MoE FFN |
-| Total Experts | 512 |
-| Active Experts per Token | 10 routed + 1 shared |
-| Expert Intermediate Size | 1,024 |
-| Full Attention Heads | 32 Q / 2 KV (GQA), head dim 256 |
-| Linear Attention Heads | 16 QK / 64 V, head dim 128 |
-| Context Length | 262,144 tokens |
-| Vocab Size | 248,320 |
-## Quantization Details
-| Parameter | Value |
-|---|---|
-| Method | Affine quantization |
-| Bits | 4-bit (weights) |
-| Group Size | 64 |
-| MoE Router Gates | 8-bit (preserved at higher precision) |
-| Model Size on Disk | ~223 GB |
-The MoE router gates (`mlp.gate` and `mlp.shared_expert_gate` for all 60 layers) are kept at 8-bit precision to preserve routing accuracy, which is critical for Mixture-of-Experts models.
-## Requirements
-- Apple Silicon Mac with **at least 256 GB unified memory** (e.g., Mac Studio M3 Ultra 256GB+)
-- Python 3.10+
-- [`mlx-lm`](https://github.com/ml-explore/mlx-lm) from the `main` branch
-## Installation
 ```bash
-pip install git+https://github.com/ml-explore/mlx-lm
 ```
-## Usage
-### Quick Start — Python API
-```python
-from mlx_lm import load, generate
-model, tokenizer = load("mlx-community/Qwen3.5-397B-A17B-4bit")
-messages = [{"role": "user", "content": "Explain the Riemann hypothesis in simple terms."}]
-prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True)
-response = generate(
-    model,
-    tokenizer,
-    prompt=prompt,
-    max_tokens=4096,
-    verbose=True,
-    temp=0.6,
-    top_p=0.95,
-)
-```
-### Thinking Mode (Default)
-The model defaults to thinking mode, producing chain-of-thought reasoning inside `<think>...</think>` tags before the final answer:
-```python
-from mlx_lm import load, generate
-model, tokenizer = load("mlx-community/Qwen3.5-397B-A17B-4bit")
-messages = [
-    {"role": "user", "content": "How many r's are in the word 'strawberry'?"}
-]
-prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True)
-response = generate(
-    model,
-    tokenizer,
-    prompt=prompt,
-    max_tokens=8192,
-    verbose=True,
-    temp=0.6,
-    top_p=0.95,
-)
-```
-### Non-Thinking Mode
-For faster, more direct responses without chain-of-thought reasoning:
-```python
-from mlx_lm import load, generate
-model, tokenizer = load("mlx-community/Qwen3.5-397B-A17B-4bit")
-messages = [
-    {"role": "user", "content": "Write a haiku about machine learning."}
-]
-prompt = tokenizer.apply_chat_template(
-    messages,
-    add_generation_prompt=True,
-    enable_thinking=False,
-)
-response = generate(
-    model,
-    tokenizer,
-    prompt=prompt,
-    max_tokens=2048,
-    verbose=True,
-    temp=0.7,
-    top_p=0.8,
-)
-```
-### Command Line
-```bash
-# Thinking mode (default)
-mlx_lm.generate \
-    --model mlx-community/Qwen3.5-397B-A17B-4bit \
-    --prompt "What are the key differences between TCP and UDP?" \
-    --max-tokens 4096 \
-    --temp 0.6 \
-    --top-p 0.95
-# Start a local chat server (OpenAI-compatible)
-mlx_lm.server --model mlx-community/Qwen3.5-397B-A17B-4bit
-```
-### Local OpenAI-Compatible Server
-Start the server:
-```bash
-mlx_lm.server --model mlx-community/Qwen3.5-397B-A17B-4bit --port 8080
-```
-Then query it with any OpenAI-compatible client:
-```python
-from openai import OpenAI
-client = OpenAI(base_url="http://localhost:8080/v1", api_key="unused")
-response = client.chat.completions.create(
-    model="mlx-community/Qwen3.5-397B-A17B-4bit",
-    messages=[
-        {"role": "system", "content": "You are a helpful assistant."},
-        {"role": "user", "content": "Write a Python function to find all prime numbers up to n using the Sieve of Eratosthenes."},
-    ],
-    max_tokens=4096,
-    temperature=0.6,
-    top_p=0.95,
-)
-print(response.choices[0].message.content)
-```
-Or with `curl`:
 ```bash
-curl http://localhost:8080/v1/chat/completions \
-  -H "Content-Type: application/json" \
-  -d '{
-    "model": "mlx-community/Qwen3.5-397B-A17B-4bit",
-    "messages": [{"role": "user", "content": "Hello!"}],
-    "max_tokens": 512,
-    "temperature": 0.6
-  }'
-```
-## Recommended Generation Parameters
-| Parameter | Thinking Mode | Non-Thinking Mode |
-|---|---|---|
-| `temperature` | 0.6 | 0.7 |
-| `top_p` | 0.95 | 0.8 |
-| `top_k` | 20 | 20 |
-| `presence_penalty` | 0.0 | 1.5 |
-| `repetition_penalty` | 1.0 | 1.0 |
-| `max_tokens` (general) | 32,768 | 32,768 |
-| `max_tokens` (math/code) | 81,920 | — |
-## Tips
-- **Thinking mode** is best for complex reasoning, math, and coding tasks. The model will produce internal reasoning before answering.
-- **Non-thinking mode** is better for straightforward Q&A, creative writing, and conversational use where latency matters.
-- For **math problems**, append: *"Please reason step by step, and put your final answer within \boxed{}."*
-- For **multi-turn conversations**, the default chat template automatically strips thinking content from prior turns.
-- If running into **memory pressure**, consider closing other applications to free unified memory.
-## Original Model
-This is a quantized version of [Qwen/Qwen3.5-397B-A17B](https://huggingface.co/Qwen/Qwen3.5-397B-A17B). Refer to the original model card for full benchmark results, training details, and the technical report.
-## Citation
-```bibtex
-@misc{qwen3.5,
-    title  = {{Qwen3.5}: Towards Native Multimodal Agents},
-    author = {{Qwen Team}},
-    month  = {February},
-    year   = {2026},
-    url    = {https://qwen.ai/blog?id=qwen3.5}
-}
 ```

 ---
+library_name: transformers
 license: apache-2.0
 license_link: https://huggingface.co/Qwen/Qwen3.5-397B-A17B/blob/main/LICENSE
+pipeline_tag: image-text-to-text
 tags:
 - mlx
 ---
+# mlx-community/Qwen3.5-397B-A17B-4bit
+This model was converted to MLX format from [`Qwen/Qwen3.5-397B-A17B`]() using mlx-vlm version **0.3.12**.
+Refer to the [original model card](https://huggingface.co/Qwen/Qwen3.5-397B-A17B) for more details on the model.
+## Use with mlx
 ```bash
+pip install -U mlx-vlm
 ```
 ```bash
+python -m mlx_vlm.generate --model mlx-community/Qwen3.5-397B-A17B-4bit --max-tokens 100 --temperature 0.0 --prompt "Describe this image." --image <path_to_image>
 ```

config.json CHANGED Viewed

@@ -11,972 +11,12 @@
     "quantization": {
         "group_size": 64,
         "bits": 4,
-        "mode": "affine",
-        "language_model.model.layers.0.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.0.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.1.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.1.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.2.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.2.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.3.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.3.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.4.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.4.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.5.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.5.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.6.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.6.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.7.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.7.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.8.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.8.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.9.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.9.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.10.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.10.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.11.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.11.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.12.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.12.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.13.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.13.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.14.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.14.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.15.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.15.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.16.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.16.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.17.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.17.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.18.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.18.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.19.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.19.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.20.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.20.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.21.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.21.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.22.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.22.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.23.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.23.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.24.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.24.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.25.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.25.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.26.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.26.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.27.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.27.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.28.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.28.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.29.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.29.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.30.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.30.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.31.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.31.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.32.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.32.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.33.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.33.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.34.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.34.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.35.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.35.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.36.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.36.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.37.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.37.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.38.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.38.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.39.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.39.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.40.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.40.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.41.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.41.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.42.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.42.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.43.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.43.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.44.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.44.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.45.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.45.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.46.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.46.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.47.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.47.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.48.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.48.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.49.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.49.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.50.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.50.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.51.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.51.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.52.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.52.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.53.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.53.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.54.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.54.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.55.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.55.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.56.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.56.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.57.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.57.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.58.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.58.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.59.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.59.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        }
     },
     "quantization_config": {
         "group_size": 64,
         "bits": 4,
-        "mode": "affine",
-        "language_model.model.layers.0.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.0.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.1.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.1.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.2.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.2.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.3.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.3.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.4.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.4.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.5.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.5.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.6.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.6.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.7.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.7.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.8.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.8.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.9.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.9.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.10.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.10.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.11.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.11.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.12.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.12.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.13.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.13.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.14.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.14.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.15.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.15.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.16.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.16.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.17.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.17.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.18.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.18.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.19.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.19.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.20.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.20.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.21.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.21.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.22.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.22.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.23.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.23.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.24.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.24.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.25.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.25.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.26.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.26.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.27.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.27.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.28.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.28.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.29.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.29.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.30.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.30.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.31.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.31.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.32.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.32.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.33.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.33.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.34.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.34.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.35.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.35.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.36.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.36.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.37.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.37.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.38.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.38.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.39.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.39.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.40.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.40.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.41.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.41.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.42.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.42.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.43.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.43.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.44.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.44.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.45.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.45.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.46.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.46.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.47.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.47.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.48.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.48.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.49.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.49.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.50.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.50.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.51.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.51.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.52.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.52.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.53.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.53.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.54.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.54.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.55.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.55.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.56.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.56.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.57.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.57.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.58.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.58.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.59.mlp.gate": {
-            "group_size": 64,
-            "bits": 8
-        },
-        "language_model.model.layers.59.mlp.shared_expert_gate": {
-            "group_size": 64,
-            "bits": 8
-        }
     },
     "text_config": {
         "attention_bias": false,
@@ -1080,14 +120,30 @@
                 11,
                 10
             ],
             "rope_theta": 10000000,
-            "partial_rotary_factor": 0.25,
-            "type": "default"
         }
     },
     "tie_word_embeddings": false,
     "transformers_version": "4.57.0.dev0",
     "video_token_id": 248057,
     "vision_end_token_id": 248054,
     "vision_start_token_id": 248053
 }

     "quantization": {
         "group_size": 64,
         "bits": 4,
+        "mode": "affine"
     },
     "quantization_config": {
         "group_size": 64,
         "bits": 4,
+        "mode": "affine"
     },
     "text_config": {
         "attention_bias": false,
                 11,
                 10
             ],
+            "rope_type": "default",
             "rope_theta": 10000000,
+            "partial_rotary_factor": 0.25
         }
     },
     "tie_word_embeddings": false,
     "transformers_version": "4.57.0.dev0",
     "video_token_id": 248057,
+    "vision_config": {
+        "deepstack_visual_indexes": [],
+        "depth": 27,
+        "hidden_act": "gelu_pytorch_tanh",
+        "hidden_size": 1152,
+        "in_channels": 3,
+        "initializer_range": 0.02,
+        "intermediate_size": 4304,
+        "model_type": "qwen3_5_moe",
+        "num_heads": 16,
+        "num_position_embeddings": 2304,
+        "out_hidden_size": 4096,
+        "patch_size": 16,
+        "spatial_merge_size": 2,
+        "temporal_patch_size": 2
+    },
     "vision_end_token_id": 248054,
     "vision_start_token_id": 248053
 }

model-00001-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c9a28b5750dc17c9f1cf5d8c8a9a5682839a17680179362f163200c76dd4240
-size 4340497198

 version https://git-lfs.github.com/spec/v1
+oid sha256:361799676d080074e65b29ce20cae9cde05b56831c372d487ed4887b301b26a8
+size 5250456685

model-00002-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5dcf840a69486fc1a1d7f5a66e54bb1227e1887b0f68cbc11e38417734fc5ff8
-size 4907625691

 version https://git-lfs.github.com/spec/v1
+oid sha256:b032c716ed386ef8ee090c1a1915b46c3c53b3899bca3be42cbd9885d4f991e8
+size 4906575065

model-00003-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:596c6caf10767f1908374ee29d296050621e64071677381c692cf43cec988950
-size 4900154294

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce73c3ca05a82486f4112e46a5fe80d965590c0527a5e6bd3b1fc2f0c95e3e5e
+size 4899103668

model-00004-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9c7f89207ac733e4c46637e87b0eaaa438bcd65f8939581e0391cb1f069b8ced
-size 4983411456

 version https://git-lfs.github.com/spec/v1
+oid sha256:182b3b9461f573e73d4d27696346ca3634216234c113bf3ea7c2fda32a77fa6c
+size 4981310204

model-00005-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c0ff1ec39982dc9dd393fdf529e25ec751a7ff5f62633f1d0f95b8515303a2f3
-size 4907625683

 version https://git-lfs.github.com/spec/v1
+oid sha256:c8452e7513c569caece2916750d6adf22bf1a8fb17c1bd7e2de72197c905098d
+size 4906575057

model-00006-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e3261a10f09f2d7f6940e487fa386d0a6e28a099a303725ea3ad99b9756b995e
-size 4900154304

 version https://git-lfs.github.com/spec/v1
+oid sha256:1647865d9f3a10eada5923056000a960c6c5c15d32b9e2fdaabfcc0498b984c7
+size 4899103678

model-00007-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:32b7b731e4f701864f7dc4fa436f2fbb433445aae3b788492ca1804801b7c170
-size 4983411398

 version https://git-lfs.github.com/spec/v1
+oid sha256:32246ab4ff7a98e06ad6c0be7dde31aae0e75665fe3cc9bc8aa55bda16f0fcbd
+size 4981310146

model-00008-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f01243846c0a73797d9b71805d447e97fe360a52b091b7a46091c1d7bfe7f170
-size 4907625736

 version https://git-lfs.github.com/spec/v1
+oid sha256:c9cf28f7d83015f239fdfd9a8f4570c0623a9b9eaf848d2ab174675c40302eb5
+size 4906575110

model-00009-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:07cf03eeb0e5330be24517bfd174b74fa390496fa7ad34f2a333ff0448078a94
-size 4900154335

 version https://git-lfs.github.com/spec/v1
+oid sha256:758f63d945a298653219c151ab8e474b587db4b8db29d08f1a17aafa1e845644
+size 4899103709

model-00010-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dd812620470986741e852979b36204cf4d6662c5cc4ebd8fe58ab97863f68d69
-size 4983411534

 version https://git-lfs.github.com/spec/v1
+oid sha256:fae3b1d52e103cac7bc7ada1db8d8513d5fe9131833b832256cc0fbbae2ad596
+size 4981310282

model-00011-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:35d94cd7575ccfc5de47304e352ca48b9e2cb070a9d30c695f129ca1ff26b9d0
-size 4907625787

 version https://git-lfs.github.com/spec/v1
+oid sha256:e6cfec296e8ce24e3782a56eb5bbba256eb0e9749a06806431870654476430a6
+size 4906575161

model-00012-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4b41683da8a88716fc09a276ffbc6d5f586b51aab4b50b699d7d92a0382ee68d
-size 4900154341

 version https://git-lfs.github.com/spec/v1
+oid sha256:46deac6ed7bf0f54dc32a0f7168cc3a63093847f0086fb375db7fbbfcd553185
+size 4899103715

model-00013-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf76e4844b40ddbada0c73b0b9293efcdfb4c17b524aaab8eee5f5449dcb2d26
-size 4983411496

 version https://git-lfs.github.com/spec/v1
+oid sha256:727767e29695e06e7041570c070b3a89835ac7a5dcff3fc907e0722319f7bd3a
+size 4981310244

model-00014-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d17bf0f5160a667abe7882ec579be4190b7a9d49a34e2d1575a608b147165747
-size 4907625727

 version https://git-lfs.github.com/spec/v1
+oid sha256:7c5b5666e91fa8424c69d85378faa92adb65d3682726f0e4c83b877bfff23544
+size 4906575101

model-00015-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0835c4b9255019cf18953e5ddb53cf9ea4b859fb075e123dced68d92006d8ae7
-size 4900154347

 version https://git-lfs.github.com/spec/v1
+oid sha256:a9b17bce9a5beb74ebede9dbe993abf2b435024fc3d63930959ccc7869553b73
+size 4899103721

model-00016-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4ad763e4f81c670b0b541a8bd235a3c6dc8baaae387cbf618866cb79ff2562cf
-size 4983411512

 version https://git-lfs.github.com/spec/v1
+oid sha256:9fd2152c2bd7e1344151b3364b64fe522bd27e7e461c5f422202cb3a5da4df3c
+size 4981310260

model-00017-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab8dffc66afe56d3e0854e015cad6c5804a253e3a0c2aa5d06a759b5de5abf79
-size 4907625723

 version https://git-lfs.github.com/spec/v1
+oid sha256:41480b57a8f6675b750d286b80800ac56875055df06224fb6a62eb4f2497c8ed
+size 4906575097

model-00018-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6c6cf934936edc29c7e8ecb9ab269e19d0b372134e20608c17bc6fd0ab90e9fe
-size 4900154337

 version https://git-lfs.github.com/spec/v1
+oid sha256:cdcebab30ff3fbfd288efeb0ac582c35c98188689e267d020e365bdc88cf729c
+size 4899103711

model-00019-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ba53cf84edc7ad5aa7f7c320980667a5a581a4803c48ce89ae0b7965f8c65c08
-size 4983411516

 version https://git-lfs.github.com/spec/v1
+oid sha256:6948f546257ed4b09cf53782d36d193907e8ecf22f528729c66c66cbf09f2115
+size 4981310264

model-00020-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:305d58849d3703a9546b25c4150ca5bb845824aba3cc5e87f74340e4c3d211b4
-size 4907625775

 version https://git-lfs.github.com/spec/v1
+oid sha256:f727102dd2c400483f56e319425c15a7b48ceabbf60515fba7a6f68bdc90a75f
+size 4906575149

model-00021-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:30b4207945236e718ecf672a027caea75a681ae18675fd0a7380fb7552a28cdb
-size 4900154317

 version https://git-lfs.github.com/spec/v1
+oid sha256:1ce671cbba6e5a7d97513d08511269592b7f5f916375a75b4d4545b90a2c9822
+size 4899103691

model-00022-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b25f41f408d9b126b434989a108f9af3afb0506872d7f13a193664fbaa4bd8f9
-size 4983411510

 version https://git-lfs.github.com/spec/v1
+oid sha256:33ef1bc5e7658a63a38f8223d4adc889df80c6cfed4abe07709e1e2280f803f2
+size 4981310258

model-00023-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fff7a036434adf442f85fa6f35118879a41cbd6c48d82ae2a7cada2c35c0f2b2
-size 4907625783

 version https://git-lfs.github.com/spec/v1
+oid sha256:ca6c64a485e6c01aab595e35e30c5e4f6e58dc27d8d959fd3185d07bb3c5444d
+size 4906575157

model-00024-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:da885e4fc646e7f6f07e4d17f8adf430041bc352eb446a0b3eb15e994c4f75b6
-size 4900154347

 version https://git-lfs.github.com/spec/v1
+oid sha256:80a1f2a69d7ac8ba1d116ba9abb3627cd522b10f894170f829a750ce128b8885
+size 4899103721

model-00025-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cc581b9184114a9188f360cf93b39c5ac6d2e5bd2caa36ee017666f15f9ed1f9
-size 4983411532

 version https://git-lfs.github.com/spec/v1
+oid sha256:a57048a75c863b353b02c55ed61ac408e22d935db6bc4530f2cbdf75018d504c
+size 4981310280

model-00026-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:654b46a75961997c606b1106bb3e027b3922830037dd6ef5de342a3cffa1c461
-size 4907625775

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0ad2519dce9ddfaa76f6a0379ba7c4f4549513fe7cd3310d94b74e0560417bf
+size 4906575149

model-00027-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14d5f543cae9d2632bc3047c9b0de42ae64f6e481ddf31019ab21f34cd009da6
-size 4900154347

 version https://git-lfs.github.com/spec/v1
+oid sha256:407d0d0ef6d01fd5138538dd8badbcc59f13c3261277d75a12cb4185acc9c613
+size 4899103721

model-00028-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3ed47f3ef71f5d679ef8561b857af336c4ceab90a845b235a440d86e091ebae1
-size 4983411506

 version https://git-lfs.github.com/spec/v1
+oid sha256:5bb4c6166f10203a29e309c9473b8d8a1929007ffc754770cdaec6fc6c9c5f7c
+size 4981310254

model-00029-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8ad458c1dba5c70a9afefb2ee054a48ab66d1aed30f2f7e058f297ebe059e1bc
-size 4907625779

 version https://git-lfs.github.com/spec/v1
+oid sha256:124c156fa19aeca7f721a88fc894b1bc7d36bf2f03c026c5698c0b76d947af06
+size 4906575153

model-00030-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cd257dff03daa1c8405ab9c1d3c3496c4818a9b0926bcd8bf404d4b4f6d8c18b
-size 4900154331

 version https://git-lfs.github.com/spec/v1
+oid sha256:562544a4d7d6203b1c0fe24aac470767f4564ba1399424d679be2af46bc00e6a
+size 4899103705

model-00031-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b7f10d09732b6319fc4aa4260b420552d46a3eac4bde38aa5c7d98144607e8d6
-size 4983411506

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b785e123019df25ff40009f2fb308d53307fd830765238003284f356e6ca387
+size 4981310254

model-00032-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3cee68ddecb3e6d641741538cc4c97350642ab96f89ec13e686525804be20807
-size 4907625715

 version https://git-lfs.github.com/spec/v1
+oid sha256:d6a09d9ad648fbb2ef4db5ef090a4bff11c5dd188920868d721514fd1e07f1ed
+size 4906575089

model-00033-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:75a5add9b57b9c94412c67571cda2156ffe15a505fc5943e582eb9b1d493452b
-size 4900154343

 version https://git-lfs.github.com/spec/v1
+oid sha256:d8dca928a363a3e8e763ab11e622b59f09a940f44cc537d600a267403a9b8084
+size 4899103717

model-00034-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:313ba37d3d18228c319561a4fb44e380ca1fd8e7a7c01c0f67f48cbc5556ce5a
-size 4983411486

 version https://git-lfs.github.com/spec/v1
+oid sha256:90642ea0d7b03c10083682eefd2341b2d8b3630e845befe7e1344f0734cef0dd
+size 4981310234

model-00035-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:85588835585f95f5eaba7d922af13522497b7f0d1aa22c44679c81822c626f7c
-size 4907625761

 version https://git-lfs.github.com/spec/v1
+oid sha256:4ca3580b7cf5fe11f3b18b1a0e1305493bee6a00a17b96dfbb53481a2c5017ea
+size 4906575135

model-00036-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b54a7d707f3f4a7d05c855afab589ac8064b1528ce5afc4eb7a1e2e54079a44c
-size 4900154277

 version https://git-lfs.github.com/spec/v1
+oid sha256:b08ef8225099efef7015208279301e0bc3613f524ff86177d22e320089036723
+size 4899103651

model-00037-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9ab3cf7d734763ff7987c764248e1e2a38e6eea24a783e8c755d1ffc1e58956f
-size 4983411508

 version https://git-lfs.github.com/spec/v1
+oid sha256:f2e70e7e4e1c66adcf3982307dee354852331eb80416207a65d64c986bde9a66
+size 4981310256

model-00038-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1333e4841ca56979defd12ef6e4994e45553ad89680c91c260f56ae1d786f53e
-size 4907625703

 version https://git-lfs.github.com/spec/v1
+oid sha256:e1e2af6748394a0acee2c750cf8bcc88970014f3f9fa14bc891edb1c931fc4d2
+size 4906575077

model-00039-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e9eb67fc3e83bd0b2381872d2d98c2dad7c4d06647dbf09ef177f1f2f330a7af
-size 4900154343

 version https://git-lfs.github.com/spec/v1
+oid sha256:c58e1f29f2cb616a312f2bb05b9a6d6ca2da2ea953a6fd2228e7af5f0a0cfb6b
+size 4899103717

model-00040-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:588d875aaa0fd42472c6ef81491b3e2e76d705a4e3c0b1620181fb054b69815c
-size 4983411540

 version https://git-lfs.github.com/spec/v1
+oid sha256:02422272717572c7ce2c1eb4513103e9e688f2c8da52838f464d3f2a4c39eac9
+size 4981310288

model-00041-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ba08212f76413dda6e1c8fe578edf21c93a8f6519fa49dc71f3b78a69b8f232e
-size 4907625721

 version https://git-lfs.github.com/spec/v1
+oid sha256:be64e70bdb7e383cae9a523b077127ab70098a697262498dc66f7cc7d4fc6017
+size 4906575095

model-00042-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:13e94fabe68719c6b9a0c14ef94d1dd557409adafc366abd9a6f4c62234e7505
-size 4900154343

 version https://git-lfs.github.com/spec/v1
+oid sha256:5083ca46270bf3ced3a025f47f9c11dccb7cd20a37890fb81e08f9d14f55c71d
+size 4899103717

model-00043-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b9dd628b31d0fa64cf7450dc93e4520e4dcebc1e1e585db325a8a269ff8fe558
-size 4983411498

 version https://git-lfs.github.com/spec/v1
+oid sha256:46cd310c0b15a95477097fe9943a66c5f3f26b629d215dad9e79b64eeeebdf5a
+size 4981310246

model-00044-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ae90fcfbd7bdf0c3048dea983631a8f895f674db49a55ad5ffbed285145fc33d
-size 4907625783

 version https://git-lfs.github.com/spec/v1
+oid sha256:655e1157645305f0dd81ae64e55ee33cc387ead90c0f3a565011301318203bd0
+size 4906575157

model-00045-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cd995517c9460cf792adc9a96a4b5ecc95e23f72c0d60602b10110d4ef3b7a1d
-size 4900154347

 version https://git-lfs.github.com/spec/v1
+oid sha256:e78b2adc5bcca197eef3b96fdcb126f52c14d26e68ee9b994cf0e320329aaeaa
+size 4899103721

model-00046-of-00046.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:726cda5891e13d726197cd592f7586d11560db314e1adae6fcd270dddfaaab31
-size 1787181790

 version https://git-lfs.github.com/spec/v1
+oid sha256:0a008c67647f5487518fa7148905fbe2b4536c37c000fece03b322732daaa0ec
+size 1787179741

model.safetensors.index.json CHANGED Viewed

@@ -1,7 +1,6 @@
 {
     "metadata": {
-        "total_size": 223011784832,
-        "total_parameters": 396346344576
     },
     "weight_map": {
         "language_model.lm_head.biases": "model-00046-of-00046.safetensors",
@@ -2635,6 +2634,339 @@
         "language_model.model.layers.9.mlp.switch_mlp.up_proj.scales": "model-00008-of-00046.safetensors",
         "language_model.model.layers.9.mlp.switch_mlp.up_proj.weight": "model-00008-of-00046.safetensors",
         "language_model.model.layers.9.post_attention_layernorm.weight": "model-00007-of-00046.safetensors",
-        "language_model.model.norm.weight": "model-00046-of-00046.safetensors"
     }
 }

 {
     "metadata": {
+        "total_size": 223860768352
     },
     "weight_map": {
         "language_model.lm_head.biases": "model-00046-of-00046.safetensors",
         "language_model.model.layers.9.mlp.switch_mlp.up_proj.scales": "model-00008-of-00046.safetensors",
         "language_model.model.layers.9.mlp.switch_mlp.up_proj.weight": "model-00008-of-00046.safetensors",
         "language_model.model.layers.9.post_attention_layernorm.weight": "model-00007-of-00046.safetensors",
+        "language_model.model.norm.weight": "model-00046-of-00046.safetensors",
+        "vision_tower.blocks.0.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.0.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.1.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.10.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.11.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.12.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.13.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.14.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.15.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.16.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.17.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.18.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.19.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.2.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.20.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.21.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.22.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.23.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.24.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.25.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.26.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.3.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.4.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.5.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.6.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.7.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.8.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.attn.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.attn.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.attn.qkv.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.attn.qkv.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.mlp.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.mlp.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.mlp.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.mlp.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.norm1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.norm1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.norm2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.blocks.9.norm2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.merger.linear_fc1.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.merger.linear_fc1.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.merger.linear_fc2.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.merger.linear_fc2.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.merger.norm.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.merger.norm.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.patch_embed.proj.bias": "model-00001-of-00046.safetensors",
+        "vision_tower.patch_embed.proj.weight": "model-00001-of-00046.safetensors",
+        "vision_tower.pos_embed.weight": "model-00001-of-00046.safetensors"
     }
 }

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+    "size": {
+        "longest_edge": 16777216,
+        "shortest_edge": 65536
+    },
+    "patch_size": 16,
+    "temporal_patch_size": 2,
+    "merge_size": 2,
+    "image_mean": [
+        0.5,
+        0.5,
+        0.5
+    ],
+    "image_std": [
+        0.5,
+        0.5,
+        0.5
+    ],
+    "processor_class": "Qwen3VLProcessor",
+    "image_processor_type": "Qwen2VLImageProcessorFast"
+}