网站首页 > 人工智能 > 正文

[玩转AIGC]LLaMA2之如何微调模型

ai写作助手官网人工智能 2024-03-20 8 0

1、下载训练脚本2、下载模型2.1、申请下载权限2.2、模型下载

3、模型微调3.1、使用单卡微调3.2、使用多卡训练：

1、下载训练脚本

首先我们从github上下载Llama 2的微调代码：GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model

执行命令：

git clone https://github.com/facebookresearch/llama-recipes

cd llama-recipes

下载完成之后，安装对应环境，执行命令：

pip install -r requirements.txt

2、下载模型

在这里我补充一下模型下载权限的申请

2.1、申请下载权限

需先在Meta上申请权限（国家选中国不行，要选其他国家） https://ai.meta.com/resources/models-and-libraries/llama-downloads/

申请的邮箱必须是跟huggingface注册邮箱一致

申请完权限之后你会收到邮件：然后再去HuggingFace上submit权限申请，连接在下面 https://huggingface.co/meta-llama/Llama-2-7b-hf

打开后点击提交：

提交后还要等待仓库作者的确认，请求将在 1-2 天内得到处理

实测大概一个小时，会有邮件通知已授权，邮件如下：然后回到HuggingFace

点击头像->setting->Access Tokens 里面获取tokens

没有的话就自己创建一个token，也就是点击new token，再把创建的token复制下来

2.2、模型下载

有了权限就可以从HuggingFace上下载模型：https://huggingface.co/meta-llama

打开可看到模型有多个：

这里我们选择：Llama-2-7b-hf

通过代码下载：

下面的your token就是要填从你自己的HuggingFace复制下来的token，根据上面的步骤走过来，你已经申请过权限了，所以token可用

import huggingface_hub

huggingface_hub.snapshot_download(

"meta-llama/Llama-2-7b-hf",

local_dir="./Llama-2-7b-hf",

token="your token"

)

import huggingface_hub

huggingface_hub.snapshot_download(

"meta-llama/Llama-2-7b-hf",

local_dir="./Llama-2-7b-hf",

token="**********************"

)

3、模型微调

3.1、使用单卡微调

#创建模型输出文件

mkdir output

# 使用单卡

export CUDA_VISIBLE_DEVICES=0

#开始训练

python llama_finetuning.py --use_peft --peft_method lora --quantization --model_name Llama-2-7b-hf --output_dir output

3.2、使用多卡训练：

比如多GPU单节点

torchrun --nnodes 1 --nproc_per_node 4 examples/finetuning.py --enable_fsdp --use_peft --peft_method lora --model_name /path_of_model_folder/7B --fsdp_config.pure_bf16 --output_dir path/to/save/PEFT/model

好文阅读

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

AIGC

本文由用户于 2024-03-20 发布在金钥匙，如有疑问，请联系我们。
本文链接：https://www.51969.com/post/18664738.html

金钥匙

[玩转AIGC]LLaMA2之如何微调模型

人工智能 [综述] Generative AI meets 3D: A Survey on Text-to-3D in AIGC Era

Java 云原生微服务分布式与集群，二者区别是什么？

发表评论取消回复

金钥匙

[玩转AIGC]LLaMA2之如何微调模型

人工智能 [综述] Generative AI meets 3D: A Survey on Text-to-3D in AIGC Era

Java 云原生 微服务 分布式与集群，二者区别是什么？

相关文章

发表评论取消回复

Java 云原生微服务分布式与集群，二者区别是什么？