Продвинутый45 мин

Fine-tuning LLaMA 3 на собственных данных

Адаптация открытых моделей под специфические задачи бизнеса

## Подготовка данных Качество fine-tuning напрямую зависит от качества датасета. Требования: • Минимум 1000 примеров для задачи классификации • 5000+ для генеративных задач • Разнообразие формулировок • Очистка от дубликатов и ошибок ## Формат данных (Alpaca) ```json { "instruction": "Классифицируй тональность отзыва", "input": "Отличный сервис, быстрая доставка!", "output": "Позитивная" } ``` ## Обучение с LoRA ```python from peft import LoraConfig, get_peft_model config = LoraConfig( r=16, lora_alpha=32, target_modules=["q_proj", "v_proj"], lora_dropout=0.05, bias="none", task_type="CAUSAL_LM" ) model = get_peft_model(model, config) ``` ## Гиперпараметры • Learning rate: 2e-4 • Batch size: 4 (с gradient accumulation 4) • Epochs: 3 • Warmup steps: 100 ## Экспорт и деплой Объедините LoRA-веса с базовой моделью и конвертируйте в GGUF для inference на CPU.