NVIDIA-Nemotron-Nano-9B-v2-Japanese-gguf
nvidiaさんが公開しているNVIDIA-Nemotron-Nano-9B-v2-Japaneseのggufフォーマット変換版です。
imatrixのデータはTFMC/imatrix-dataset-for-japanese-llmを使用して作成しました。
Usage
git clone https://github.com/ggml-org/llama.cpp.git
cd llama.cpp
cmake -B build -DGGML_CUDA=ON
cmake --build build --config Release
build/bin/llama-cli -m 'NVIDIA-Nemotron-Nano-9B-v2-Japanese-gguf' -n 128 -c 128 -p 'あなたはプロの料理人です。レシピを教えて'
- Downloads last month
- 4,456
Hardware compatibility
Log In
to add your hardware
3-bit
4-bit
5-bit
6-bit
8-bit
Model tree for mmnga-o/NVIDIA-Nemotron-Nano-9B-v2-Japanese-gguf
Base model
nvidia/NVIDIA-Nemotron-Nano-12B-v2-Base
Finetuned
nvidia/NVIDIA-Nemotron-Nano-12B-v2
Finetuned
nvidia/NVIDIA-Nemotron-Nano-9B-v2