Update README.md
Browse files
README.md
CHANGED
|
@@ -9,12 +9,60 @@ base_model:
|
|
| 9 |
- ai-forever/rugpt3large_based_on_gpt2
|
| 10 |
pipeline_tag: text-generation
|
| 11 |
library_name: transformers
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 12 |
---
|
| 13 |
|
| 14 |
-
|
| 15 |
|
| 16 |
-
|
| 17 |
|
| 18 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
| 19 |
|
| 20 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 9 |
- ai-forever/rugpt3large_based_on_gpt2
|
| 10 |
pipeline_tag: text-generation
|
| 11 |
library_name: transformers
|
| 12 |
+
tags:
|
| 13 |
+
- text-adaptation
|
| 14 |
+
- russian
|
| 15 |
+
- gpt3
|
| 16 |
+
- cefr
|
| 17 |
+
- ruadapt
|
| 18 |
+
- simplification
|
| 19 |
---
|
| 20 |
|
| 21 |
+
# 📝 RuAdapt-CEFR: Генерация адаптированного текста на русском 🇷🇺
|
| 22 |
|
| 23 |
+
**RuAdapt-CEFR** — это модель, разработанная студентами **ДГТУ "Школа Икс"**, предназначенная для упрощения и адаптации текстов на основе их сложности.
|
| 24 |
|
| 25 |
+
### 🚀 Особенности модели:
|
| 26 |
+
✅ Основана на **[ai-forever/rugpt3large_based_on_gpt2](https://huggingface.co/ai-forever/rugpt3large_based_on_gpt2)**
|
| 27 |
+
✅ Дообучена на **RuAdapt** и **RuSimpleSentEval**
|
| 28 |
+
✅ Позволяет адаптировать тексты под уровни **CEFR (A1–C2)**
|
| 29 |
+
✅ Генерирует тексты, сохраняя смысл оригинала, но упрощая лексику и грамматику
|
| 30 |
|
| 31 |
+
### 🎯 Использование
|
| 32 |
+
Модель принимает промпт следующего формата:
|
| 33 |
+
|
| 34 |
+
```
|
| 35 |
+
Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст: {target}
|
| 36 |
+
```
|
| 37 |
+
|
| 38 |
+
Пример запроса:
|
| 39 |
+
|
| 40 |
+
```python
|
| 41 |
+
from transformers import pipeline
|
| 42 |
+
|
| 43 |
+
model = "ваш_юзернейм/ruadapt-cefr"
|
| 44 |
+
pipe = pipeline("text-generation", model=model)
|
| 45 |
+
|
| 46 |
+
text = "Научно-технический прогресс оказывает огромное влияние на современный мир."
|
| 47 |
+
level = "A2"
|
| 48 |
+
|
| 49 |
+
prompt = f"Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст:"
|
| 50 |
+
result = pipe(prompt, max_length=100)
|
| 51 |
+
|
| 52 |
+
print(result[0]["generated_text"])
|
| 53 |
+
```
|
| 54 |
+
|
| 55 |
+
### 🔗 Ссылка на Google Colab
|
| 56 |
+
## 📌 [Открыть в Google Colab](https://colab.research.google.com/drive/1Cauh9O7HdkrEUs8NU69-zSkQwncS5wBG)
|
| 57 |
+
|
| 58 |
+
### 📚 Датасеты
|
| 59 |
+
* RuAdapt
|
| 60 |
+
|
| 61 |
+
* RuSimpleSentEval
|
| 62 |
+
|
| 63 |
+
### 🎨 Области применения
|
| 64 |
+
* Упрощение текстов для изучающих русский язык
|
| 65 |
+
|
| 66 |
+
* Автоматическая адаптация текстов под CEFR
|
| 67 |
+
|
| 68 |
+
* Образовательные и академические задачи
|