目录

1、下载训练脚本2、 下载模型2.1、申请下载权限2.2、模型下载

3、模型微调3.1、使用单卡微调3.2、使用多卡训练:

1、下载训练脚本

首先我们从github上下载Llama 2的微调代码:GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model

执行命令:

git clone https://github.com/facebookresearch/llama-recipes

cd llama-recipes

下载完成之后,安装对应环境,执行命令:

pip install -r requirements.txt

2、 下载模型

在这里我补充一下模型下载权限的申请

2.1、申请下载权限

需先在Meta上申请权限(国家选中国不行,要选其他国家) https://ai.meta.com/resources/models-and-libraries/llama-downloads/

申请的邮箱必须是跟huggingface注册邮箱一致

申请完权限之后你会收到邮件: 然后再去HuggingFace上submit权限申请,连接在下面 https://huggingface.co/meta-llama/Llama-2-7b-hf

打开后点击提交:

提交后还要等待仓库作者的确认,请求将在 1-2 天内得到处理

实测大概一个小时,会有邮件通知已授权,邮件如下: 然后回到HuggingFace

点击头像->setting->Access Tokens 里面获取tokens

没有的话就自己创建一个token,也就是点击new token,再把创建的token复制下来

2.2、模型下载

有了权限就可以从HuggingFace上下载模型:https://huggingface.co/meta-llama

打开可看到模型有多个:

这里我们选择:Llama-2-7b-hf

通过代码下载:

下面的your token就是要填从你自己的HuggingFace复制下来的token,根据上面的步骤走过来,你已经申请过权限了,所以token可用

import huggingface_hub

huggingface_hub.snapshot_download(

"meta-llama/Llama-2-7b-hf",

local_dir="./Llama-2-7b-hf",

token="your token"

)

import huggingface_hub

huggingface_hub.snapshot_download(

"meta-llama/Llama-2-7b-hf",

local_dir="./Llama-2-7b-hf",

token="**********************"

)

3、模型微调

3.1、使用单卡微调

#创建模型输出文件

mkdir output

# 使用单卡

export CUDA_VISIBLE_DEVICES=0

#开始训练

python llama_finetuning.py --use_peft --peft_method lora --quantization --model_name Llama-2-7b-hf --output_dir output

3.2、使用多卡训练:

比如多GPU单节点

torchrun --nnodes 1 --nproc_per_node 4 examples/finetuning.py --enable_fsdp --use_peft --peft_method lora --model_name /path_of_model_folder/7B --fsdp_config.pure_bf16 --output_dir path/to/save/PEFT/model

好文阅读

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: