LOAR Adaptador de configuração - Gera Configuração do Treinamento Fino-Limiar LLM
Calcule automaticamente rank, alpha, módulos de destino, taxa de aprendizado e tamanho da batch para fine-tuning o LoRA/QLoRA. Saída JSON pronto a usar do HuggingFace PEFT. Baseado no artigo LoRA (Hu et al., 2022) e melhores práticas Karpathy.
GratisLado do clienteNão faça o loginLoRaWAN (Long Range Wide Area Network)
Configuração heurstica baseada no artigo de LoRA, práticas recomendadas por Karpathy e documentação da PEFT do HuggingFace. Os valores são pontos de partida sugeridos — experimente sempre com a loss de validação para otimizar em seu conjunto específico de dados.
Presets rápidos
Configuration de LoRA gerada
Classificar (c)16
Alfa (α)32
Desligamento de treinamento0.05
Taxa de aprendizado2e-4
Gradiente de acumulação em lote4 × 4 = 16
Passos de aquecimento10
Épocas3
Módulos alvos
q_projk_projv_projo_proj
Configuração JSON do HuggingFace PEFT
{
"peft_type": "LORA",
"task_type": "CAUSAL_LM",
"r": 16,
"lora_alpha": 32,
"lora_dropout": 0.05,
"target_modules": [
"q_proj",
"k_proj",
"v_proj",
"o_proj"
],
"bias": "none",
"inference_mode": false
}