ai-sage
/

GigaChat3-702B-A36B-preview-bf16

Text Generation

Mixture of Experts

Model card Files Files and versions

vltnmmdv commited on 19 days ago

Commit

7334e23

·

verified ·

1 Parent(s): f28495f

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ tags:
 Архитектура включает **Multi-head Latent Attention (MLA)** и **Multi-Token Prediction (MTP)**, за счет чего модель оптимизирована для высокой пропускной способности (throughput) при инференсе.
 Для высокопроизводительного инференса доступна версия модели в fp8 - [GigaChat3-702B-A36B-preview](https://huggingface.co/ai-sage/GigaChat3-702B-A36B-preview).
-Больше подробностей в хабр статье (to do).
 ## Архитектура модели

 Архитектура включает **Multi-head Latent Attention (MLA)** и **Multi-Token Prediction (MTP)**, за счет чего модель оптимизирована для высокой пропускной способности (throughput) при инференсе.
 Для высокопроизводительного инференса доступна версия модели в fp8 - [GigaChat3-702B-A36B-preview](https://huggingface.co/ai-sage/GigaChat3-702B-A36B-preview).
+Больше подробностей [в хабр статье](https://habr.com/en/companies/sberdevices/articles/968904/).
 ## Архитектура модели