swift使用代码结构解析

news/2024/10/6 18:20:38 标签: lmm, 多模态大语言模型

多模态模型的训练llamafactory也可以训练,但是总的来说,llamafactory对多模态模型的支持还是不太多,ms-swift支持的多模态模型更多,因此有时候去找框架是否够支持相应的模型时会有所困难,所以对这些框架的代码也要稍微熟悉一些。

1.model_type

模型支持在swift/llm/utils/model.py中,目前能够支持的多模态模型还是很多,这对我们做一些实验室相对方便的,直接我记得我sft qwenvl时还有bs不能大于1的bug,不知道目前解决了没有,目前我实验的llava和internvl2都没有bs=1的限制了。目前llama-vision只能在最新的swift的main分支中,还有合并进最新版本,不过问题也不大。

2.swift对数据的支持包括两种

一种是data.jsonl中添加,这和llamafactory一致的

另一种直接加载相应的转换格式的jsonl或者json文件。

3.template_type

swift中的参数基本都是一致的,没有太多需要调的空间,唯一需要调整的也就是model_type和template_type了,swift/llm/utils/template.py,其实这种框架本质上都是依赖hf的transformer和peft等库进行训练的,当然trainer基本都是自家封装的,但是训练这块基本都是相似的transformer的模式,因此其实更多的还是数据转换,一些预处理之类的东西有所区别。

4.参数

swift/llm/utils/argument.py中,主要关注的就是SftArguments了。


http://www.niftyadmin.cn/n/5691981.html

相关文章

计算机网络——ftp

在网络通信中,控制连接和数据连接是两种不同类型的连接,它们各自具有特定的功能和用途。 一、控制连接 定义与功能: 控制连接主要用于在通信双方之间传输控制信息,以建立、维护和终止数据连接。它负责协调和管理数据传输的过程&am…

【数据结构】双向链表(Doubly Linked List)

双向链表(Doubly Linked List)是一种链式数据结构,它的每个节点都包含三个部分:数据、指向前一个节点的指针(prev),以及指向下一个节点的指针(next)。与单向链表不同&…

手机sd卡数据被清空怎么恢复原状?高效、可行的恢复策略

在数字化时代,手机SD卡作为我们存储重要数据的“数字仓库”,其安全性与稳定性直接关系到我们日常生活的便捷与信息安全。然而,不慎操作或系统故障导致的SD卡数据清空,常常让人措手不及,焦虑万分。面对这一挑战&#xf…

C语言 | Leetcode C语言题解之第456题132模式

题目&#xff1a; 题解&#xff1a; int upper_bound(int* vec, int vecSize, int target) {int low 0, high vecSize - 1;if (vec[high] > target) {return -1;}while (low < high) {int mid (high - low) / 2 low;int num vec[mid];if (num > target) {low m…

github项目——系统设计入门

今天的github趋势&#xff0c;有几个项目印象感觉很有意思&#xff0c;之后可能会用的上&#xff0c;记录一下 系统设计入门 书籍教程类项目&#xff0c;有中文文档&#xff0c;刚好需要。 https://github.com/donnemartin/system-design-primer/blob/master/README-zh-Hans.md…

ThreadLocal、InheritableThreadLocal、TransmittableThreadLocal原理及Demo

1.ThreadLocal 1.1 原理 1.2 Demo 1.3 应用场景 2.InheritableThreadLocal 2.1 原理 2.2 Demo 2.3 应用场景 3.TransmittableThreadLocal 3.1 原理 3.2 Demo 3.3应用场景 1.ThreadLocal 1.1 原理 造成ThreadLocal内存泄露的主要原因是&#xff1a; key是弱引用&…

【Taro】做项目过程中的一些问题记录

待更新~ React is declared but its value is never read. taro 中 &#xff0c;eslint 中使用 import React from “react”; 报错&#xff1a; React is declared but its value is never read. 解决办法&#xff1a; tsconfig 中 改为&#xff1a; {"compilerOptions…

jvisualvm学习

系列文章目录 JavaSE基础知识、数据类型学习万年历项目代码逻辑训练习题代码逻辑训练习题方法、数组学习图书管理系统项目面向对象编程&#xff1a;封装、继承、多态学习封装继承多态习题常用类、包装类、异常处理机制学习集合学习IO流、多线程学习仓库管理系统JavaSE项目员工…