Skip to content

AI 智能描述生成 (AI Description)

Sharp Stock 深度集成了先进的多模态大语言模型,可将图像或音频资产的内容自动转化为可检索的高质量文字描述。

1. 核心逻辑说明

当您在详情面板点击带 蓝色 AI 图标 的「自动」按钮时,系统将执行以下流程:

  1. 源文件读取:系统将直接读取磁盘上的原始资产文件。
  2. 模型调用:根据资产类型,自动调用您在 [设置] → [AI 模型配置] 中定义的接口。图像类资产将发送至视觉模型,音频类资产则发送至音频识别模型。
  3. 内容生成:模型返回的原始描述将经过系统优化处理后,自动填充至备注文本框中。

NOTE

当前版本优先支持独立的文件资产。Spine 或 Sprites 聚合资产的 AI 生成需作用于其关联的底层源文件。


2. 操作指南

  1. 接口配置:进入 [设置] → [AI 模型配置],填写 API 地址、模型名称及访问令牌(API Key)。支持接入本地 Ollama 服务以保障内网数据隐私。
  2. 发起分析:在右侧详情面板展开 「备注」 栏目,点击 「自动」 按钮。
  3. 结果持久化:生成成功后,描述信息将自动写入数据库。若您在生成的基础上进行了手动二次修改,请务必点击 「保存」 按钮。

限制说明:

  • 格式支持:PSD、ICO 及 Sprites 虚拟资产暂不支持 AI 描述入口。
  • 批量处理:当前版本仅支持针对单条选中资产进行 AI 生成,暂不支持多选后的批量排队处理。

3. 典型应用场景

  • 资产快速建档:为场景截图、角色立绘或环境音效快速补全可读性说明,方便团队成员理解。
  • 自然语言检索:AI 生成的描述将完全纳入全局搜索索引。您可以直接输入“蔚蓝的天空”等自然语言关键词来定位资产,即使文件名中并未包含此类信息。

4. 性能与隐私策略

  • 本地隐私保障:通过接入本地部署的模型(如 Ollama),您可以确保资产素材不经过公网传输,实现最高级别的隐私保护。
  • 流量优化:在 AI 模型配置 页面,您可以自定义上传至 AI 接口的图像最大分辨率,以平衡识别准确度与网络流量消耗。

NOTE

描述生成的质量主要取决于所选模型的能力。当前版本暂不支持自定义提示词 (System Prompt)。