当前位置: 首页 > news >正文

住建设部官方网站/深圳网站推广

住建设部官方网站,深圳网站推广,个人网站的设计,用香港服务器做网站违法吗文章目录 为什么要用LLaMa-Factory什么是LLaMa-FactoryLLaMa-Factory环境搭建微调LLaMA3参考博文 为什么要用LLaMa-Factory 如果你尝试过微调大模型,你就会知道,大模型的环境配置是非常繁琐的,需要安装大量的第三方库和依赖,甚至…

文章目录

  • 为什么要用LLaMa-Factory
  • 什么是LLaMa-Factory
  • LLaMa-Factory环境搭建
  • 微调LLaMA3
  • 参考博文

为什么要用LLaMa-Factory

如果你尝试过微调大模型,你就会知道,大模型的环境配置是非常繁琐的,需要安装大量的第三方库和依赖,甚至需要接入一些框架。
但是大模型微调的方法又是非常类似的,那有没有一种工具可以统一这些操作,让大模型微调变成一个简单易上手的事情,LLaMa-Factory就是为了解决这个问题应运而生


什么是LLaMa-Factory

本来不想说这么多废话的,想来想去还是简单介绍一下,也加深自己的了解:
LLaMA Factory是一款支持多种LLM微调方式的工具,包括预训练、指令监督微调和奖励模型训练等。它支持LoRA和QLoRA微调策略,广泛集成了业界前沿的微调方法。特点在于支持多种LLM模型,提供了WebUI页面,使非开发人员也能方便进行微调工作。
代码地址:LLaMA-Factory


LLaMa-Factory环境搭建

  1. 克隆项目
git clone https://github.com/hiyouga/LLaMA-Factory.git
  1. 创建环境
conda create -n llama_factory python=3.10
conda activate llama_factory
  1. 安装依赖
cd LLaMA-Factory
pip install -e .[torch,metrics]
  1. 启动web UI界面
export CUDA_VISIBLE_DEVICES=0
python src/webui.py

启动成功之后,游览器会打开如下界面:
在这里插入图片描述


微调LLaMA3

  1. 准备模型

方法一:克隆我们要微调的模型到本地,然后将在web UI界面填入我们的模型名称和本地的模型地址

git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B-Instruct.git

方法二:直接去魔塔Meta-Llama-3-8B-Instruct地址复制对应的文件名和路径,微调时,程序会自动​去魔搭下载模型!
(这个方法小编浅浅试了一下,没成功,还是下载到本地靠谱)
在这里插入图片描述

  1. 准备数据集

LLaMA-Factory项目内置了丰富的数据集,统一存储于data目录下。
如果你想基于自己的数据集微调,你需要
(1)将你的数据集也放到data目录下
注意:你需要将你的数据集改为一样的格式,具体可参考data下内置数据集的格式
这里提供一个小编基于LooksJuicy/ruozhiba数据集改好的一个数据集:

https://pan.baidu.com/s/1FYYlBIXWy697xdagrHiIeg
提取码:2333

(2)修改data下的dataset_info.json文件,添加如下内容:
其中my_data.json是我自己的数据集文件,my_data是对应的数据集文件名

"my_data": {"file_name": "my_data.json"},

添加到第一层大括号内的第一个元素前,也就是identity前面

  1. 微调

这里我直接通过web ui界面进行微调
在这里插入图片描述

训练需要二十分钟左右,训练完成之后,会出现下述界面:
左下角会显示训练完毕,右边会出现训练过程中损失变化的一个可视化

在这里插入图片描述

  1. 与微调之后的模型对话

在这里插入图片描述
这样看来,使用LLaMa-Factory微调确实很简单方便!!!


参考博文

  • 在Ubuntu上安装部署LLaMA-Factory,及微调大模型测试
  • 使用LLaMA Factory微调LlaMA 3模型
  • llama3 微调教程之 llama factory 的 安装部署与模型微调过程,模型量化和gguf转换
  • 动手微调Llama3!纯本地+手把手!ORPO偏好微调,数据集工具指南!base到chat模型微调方案!day01
  • Llama3 中文版模型微调笔记,小白也能学会
http://www.whsansanxincailiao.cn/news/32028654.html

相关文章:

  • 三网合一网站怎么做/深圳今日头条新闻
  • 为网站做外链的文章/2023知名品牌营销案例100例
  • 涟水县住房和城乡建设局网站/怎么做好网络营销
  • 别墅设计图纸及效果图大全/汕头seo网站推广
  • 阜城网站建设代理/贵阳网站建设
  • 做请帖网站/搜狗链接提交入口
  • 企业网站被转做非法用途/济南网站优化公司哪家好
  • 唐山网站建设哪家好/长春网站优化
  • 做网站 用哪个网盘好/杭州网站seo价格
  • 网站外推和优化/凡科建站和华为云哪个好
  • 谷歌官方建站服务/b站推广2023
  • 做网站的为什么一直拖/网站建站系统
  • python和java做网站/seo综合查询什么意思
  • 新鸿儒网站建设/广告推广方案怎么写
  • 泉州网站制作哪个好薇/seo顾问服务 品达优化
  • 幼儿园学校网站建设作用/百度账号购买网站
  • 烟台专门做网站的/营销推广公司
  • 焦作百姓网免费发布信息/公司以优化为理由裁员合法吗
  • 四川通信建设工程有限公司网站/友情链接代码
  • wordpress 代替cms/北京seo地址
  • 邵阳做网站/搜索引擎优化的定义是什么
  • 做情侣网站/第三方网络营销平台有哪些
  • 和田网站建设/seo一个关键词多少钱
  • 易语言编程软件做网站/seo排名计费系统
  • 陕西长城建设工程有限公司网站/优化大师免费版
  • 绥化网站建设公司/海外自媒体推广
  • 免费毕业设计网站建设/黄页88推广多少钱一年
  • 宁波市住房和城乡建设委员会网站/互联网推广好做吗
  • 广东建设中标网站/珠海网络推广公司
  • dede网站地图位置/网站定制