模型管理 | 大装置帮助中心
跳到主要内容

模型管理

您需要经历 “创建模型空间 -> 生成密钥 -> 创建模型 -> 操作模型文件” 四个步骤来完成一次完整的快速入门体验。

1.创建模型空间

模型空间是您需要经过购买配额用于存储模型的空间。

(1)创建前准备

请确保您有AI模型空间创建者权限,请参考如何为用户授权,需要租户管理员为您添加AI模型空间创建者角色。

(2)创建模型空间

具有创建者权限后,在模型管理页面右上角点击【模型空间】,进入模型空间管理页面。

模型空间

在模型空间管理页面右上角点击【创建模型空间】进入下单页。

模型空间

模型空间

  • 计费模式: 可选择按月计费/按年计费/按量计费。
  • 版本选择: 选择“付费版”
  • 存储配额: 最小购买单位为 10GB,可切换单位为TB/PB进行购买。
  • 基本信息-模型空间名称: 输入模型空间名称,如“大语言模型专项空间”

点击【立即购买】即可成功创建模型空间并自动跳转到模型管理页面,便于直接进行模型创建。

(3) 模型空间总览

在模型管理页面右上角点击【模型空间】,进入模型空间管理页面,可显示您有权使用的模型空间列表,字段说明如下:

  • 模型空间: 显示创建时指定的模型空间名称。
  • ID: 系统自动生成用于唯一标识模型空间的ID
  • 全部模型体量/模型空间配额: 显示当前空间内所有用户使用的总存储大小/空间总配额
  • 全部模型数: 显示当前空间内所有用户创建的模型总数
  • 个人模型体量: 显示当前空间内登陆用户使用的总存储大小
  • 个人模型数: 显示当前空间内登陆用户创建的模型总数
  • 计费模式: 显示当前模型空间订单的计费模式,即“按月计费”/“按年计费”/“按量计费”
  • 状态: 显示当前模型空间订单状态,即“使用中”/“宽限期”/“保留期”
  • 到期时间: 显示当前模型空间订单到期时间
  • 创建者: 显示创建该空间的用户名称

模型空间

(4)模型空间授权

当您为某一具体模型空间实例的拥有者/维护者时,您可以对模型空间进行管理。

  • 授权: 将当前模型空间授权给其他用户使用或管理。具体角色说明详见权限设置
  • 调整配额: 修改当前模型空间的容量大小,仅预付费模式支持。
  • 续订: 延长当前模型空间的使用期限,仅预付费模式支持。
  • 退订: 退订并释放空间资源。

模型空间

2.生成密钥

密钥是您用于通过git cli操作模型文件时唯一鉴权凭证,请妥善保管。

点击左侧导航栏下方的【密钥】弹出弹窗,点击【生成】可将您的密钥下载到本地,一旦泄露或丢失可通过平台重新生成,历史密钥会立即失效。

密钥

3.创建模型

模型是您创建后可用于存储和管理模型文件的仓库,拥有唯一的远端地址。

点击模型管理页面右上角的【创建模型】可进入配置页面。

模型

  • 模型名称: 输入模型名称如“gpt2-大”,支持中文,用于模型名称显示,可通过名称进行模型检索。
  • 模型标识: 输入模型标识如“gpt2-big”,不支持中文,用于模型远端地址生成,不可修改。
  • 模型URL: 即模型远端地址,唯一且自动生成。
  • 所属空间: 下拉选择有权限存储模型的模型空间。
  • 权限: 模型创建成功后,可在其详情页的设置模块下进行角色权限分配。

点击【创建模型】进入该模型详情页,初始化时会自动创建 master 分支。

4.操作模型文件

您可通过原生git cli命令对模型文件进行上传,并在模型详情页对上传文件进行查看。

📣 Tips:您可点击模型详情部分的【如何操作模型】查看操作步骤提示。

(1)git clone

请确保您的电脑已经安装git,并准备任意本地文件夹作为clone模型的保存文件夹。 在模型平台前端可查看模型URL,点击【复制】

模型

请使用您熟悉的命令行终端输入

$ git lfs install #安装lfs
$ git clone https://amp-git.sensecoreapi.dev/sensetime/gpt2-large.git #替换为您在创建模型时生成的模型url

按照提示输入步骤3中生成的密钥,clone成功后可在本地文件夹中查看初始化的文件列表。

📋 Notes:LFS 全称 Large File Storge,即大文件存储,是一个开源的 git 大文件版本控制的解决方案和工具集,可以用于管理比较大的文件。

(2)git push

📣 Tips:超过15M的模型文件需要使用lfs标记。更多关于lfs介绍可参考:https://git-lfs.com/

[可选] 当存在单个模型文件 > 4GB 时,需要先执行以下步骤,配置平台提供的自动分块工具

# 0. 环境确认: 请确保您已经安装 scoamp 工具, 安装方式 < pip install scoamp >
# 1. 进入模型目录:请确保您进入通过 git clone 获取的本地模型仓库目录下
cd <your-model-name>
# 2. 添加模型文件:在当前模型仓库下添加模型文件
# 3. 设置 lfs:设置后通过 git push 上传模型文件时,系统可以自动分块传输大文件
scoamp lfs setup .

再使用原生 git 命令上传模型文件即可。

$ git add . #添加当前目录下的所有文件到暂存区
$ git commit -m "first commit" #将暂存区内容提交到版本库
$ git push origin master #上传到远端合并

上传后在 web 上点击【刷新】文件列表,可查看模型文件。

模型管理

(3)git pull

$ git pull origin master #从远端拉取代码合并到本地

5.模型详情

模型是您创建后可用于存储和管理模型文件的仓库,拥有唯一的远端地址。

(1)模型总览

在模型管理页面,支持以卡片形式显示用户有权限的模型列表。卡片显示字段说明如下:

  • 模型名称: 创建模型时填写的模型名称。
  • 用户名: 创建该模型的用户名称。
  • 性能信息: 从该模型的 master/README.md 中解析出的模型性能信息,若指定了数据集链接则可直接点击数据集名称跳转查看,规范参考模型描述文件
  • 标签信息: 从该模型的 master/README.md 中解析出的标签信息,规范参考模型描述文件
  • 权限信息: 登陆用户对该模型的操作权限。

平台支持模型筛选,可点击【展开全部】从模型空间、训练框架、任务类型三个维度对模型进行筛选。

模型

(2)模型详情

点击卡片即可进入模型详情页面,可查看模型基本信息、模型简介、模型文件三部分内容。

  • 模型基本信息: 显示所属模型空间、创建时间、模型URL、参数量。
  • 模型简介: 左侧显示 master/README.md 中模型说明部分内容,右侧显示 master/README.md 中模型性能部分内容。
  • 模型文件: 可切换分支/版本查看对应模型文件列表,支持在线查看代码。

数据集查看

模型管理

(3)模型设置

设置: 可修改模型名称,删除模型,配置模型权限。详细角色说明参考模型角色介绍

📣 Tips:模型空间的拥有者和维护者默认拥有空间内模型的完全访问权限,无需单独配置。

模型管理

(4) 模型描述文件

该文件用于定义模型的描述信息,对于特殊字段,平台前端可自动渲染样式,并支持检索、跳转等特殊交互。

平台将自动从模型 master/README.md 文件内解析特定字段并展示,支持的保留字段及格式模版参考如下:

---
训练框架: #支持筛选
- PyTorch
- Transformers
任务类型:
类别: 自然语言处理 #支持筛选
算法: Text Generation #支持筛选
行业: 智能助手
其他标签: #支持搜索
- exbert
- en
参数量: 1700000000
开源协议: mit #支持搜索
性能信息:
- 数据集:
名称: LAMBADA #支持搜索
权限: 公开
链接:
性能指标:
PPL: 35.13
ACC: 45.99
- 数据集:
名称: CBT_CN
权限: 公开
链接:
性能指标:
ACC: 87.65
训练数据:
- 数据集:
名称: WebText #支持搜索
权限: 公开
链接: https://github.com/openai/gpt-2/blob/master/domains.txt #支持跳转
---
其他模型说明...
  • 训练框架: 支持配置 PyTorch, TensorFlow, Keras, Caffe, Theano, CNTK, MXNet, PaddlePaddle, Deeplearning4j, ONNX, JAX, Transformers, Diffusers, Adapter Transformers, AllenNLP, Asteroid, docTR, ESPnet, fastai, Flair, ML_Agents, NeMo, PaddleNLP, Pyannote, PyCTCDecode, Pythae, RL-Baselines3-Zoo, Sample Factory, Sentence Transformers, spaCy, Scikit Learn, Speechbrain, Stable-Baselines3, TensorFlowTTS, Timm, 其他

  • 任务类型: 仅可以在平台支持的范围中选择填写

类别算法
多模态Feature Extraction, Text-to-Image, Image-to-Text, Visual Question Answering, Document Question Answering, Graph Machine Learning, 其他
计算机视觉Depth Estimation,Image Classification, Object Detection, Image Segmentation, Image-to-Image, Unconditional Image Generation, Video Classification, Zero-Shot Image Classification, 其他
自然语言处理Text Classification, Token Classification,Table Question Answering, Question Answering, Zreo-Shot Classification, Translation, Summarization, Conversational, Text Generation, Text2Text Generation, Fill-Mask, Sentence Similarity, 其他
音频Text-to-Speech, Automatic Speech Recognition,Audio-to-Audio, Audio Classification, Voice Activity Detection, 其他
表格Tabular Classification, Tabular Regression, 其他
强化学习Reinforcement Learning, Robotics, 其他
📣 Tips:"---"为平台解析模型描述信息的重要依据: 1. 请注意 "---" 所在行不能存在其他字符。 2. 首个"---"前仅可以存在空白字符。

根据 schema 解析保留字并筛选出模型的效果图如下:

模型筛选

6.安全扫描工具

平台提供了安全扫描工具,对常见的代码漏洞、密钥泄露风险等进行识别,保障模型安全。

在模型详情页右上角,点击【安全扫描】按钮,选择想扫描的分支/版本/具体 commitID。

安全扫描

点击【开始扫描】启动扫描任务,并在 任务管理/安全扫描任务 列表内查看进度。

安全扫描任务

当安全扫描结束后,在模型文件列表页可以查看扫描结果。

安全扫描结果

7.模型同步工具

系统支持将用户模型同步到其他地区/可用区内,以便后续通过其他子产品(如AI推理服务等)使用时缩短模型下载速度。

在模型详情页右上角,点击【模型同步】按钮,选择目的可用区模型空间,及同步分支/版本/具体 commitID。

模型同步

点击【开始同步】启动同步任务,并在 任务管理/模型同步任务 列表内查看进度。

模型同步任务

且当模型同步成功后,在该模型详情页会显示相应模型副本标签。

模型副本

8.推理服务打通

模型平台支持对用户模型和公开模型一键拉起推理服务,快速验证模型效果。

点击进入待部署的模型详情页,点击右上角的【一键部署】按钮,跳转至推理服务的创建页面。

模型部署

按照下单页要求配置推理服务参数,默认会选中该模型,支持修改,或调整特定的分支/版本。

推理服务下单

创建成功后,模型详情页会显示对应推理服务的关键信息:推理服务名称、推理实例名称、状态、副本数,以及所采用的模型 commit id、版本/分支。

推理服务实例展示

权限设置

模型空间级别的权限控制,具体角色及支持的操作范围如下表:

角色角色说明创建模型空间使用模型空间授权/取消授权
模型空间创建者作用于资源/资源组/管理组,可配置--
模型空间拥有者作用于某一模型空间实例,不可配置,默认为创建该资源的用户-
模型空间维护者作用于某一模型空间实例,可配置-
模型空间用户作用于某一模型空间实例,可配置--

模型级别的权限控制,具体角色及支持的操作范围如下表:

角色角色说明查看模型检索模型读模型文件写模型文件编辑模型删除模型
模型拥有者作用于某一模型实例,不可配置,默认为创建该模型的用户
模型维护者作用于某一模型实例,可配置
模型开发者作用于某一模型实例,可配置--
模型使用者作用于某一模型实例,可配置---
模型访客作用于某一模型实例,可配置----

常见问题

1、每次下载模型都需要输入密钥很麻烦,如何能缓存?

git config --global credential.helper 'store --file ~/.git-credentials' #缓存 secret