AI 智能描述生成 (AI Description)
Sharp Stock 深度集成了先进的多模态大语言模型,可将图像或音频资产的内容自动转化为可检索的高质量文字描述。
1. 核心逻辑说明
当您在详情面板点击带 蓝色 AI 图标 的「自动」按钮时,系统将执行以下流程:
- 源文件读取:系统将直接读取磁盘上的原始资产文件。
- 模型调用:根据资产类型,自动调用您在 [设置] → [AI 模型配置] 中定义的接口。图像类资产将发送至视觉模型,音频类资产则发送至音频识别模型。
- 内容生成:模型返回的原始描述将经过系统优化处理后,自动填充至备注文本框中。
NOTE
当前版本优先支持独立的文件资产。Spine 或 Sprites 聚合资产的 AI 生成需作用于其关联的底层源文件。
2. 操作指南
- 接口配置:进入 [设置] → [AI 模型配置],填写 API 地址、模型名称及访问令牌(API Key)。支持接入本地 Ollama 服务以保障内网数据隐私。
- 发起分析:在右侧详情面板展开 「备注」 栏目,点击 「自动」 按钮。
- 结果持久化:生成成功后,描述信息将自动写入数据库。若您在生成的基础上进行了手动二次修改,请务必点击 「保存」 按钮。
限制说明:
- 格式支持:PSD、ICO 及 Sprites 虚拟资产暂不支持 AI 描述入口。
- 批量处理:当前版本仅支持针对单条选中资产进行 AI 生成,暂不支持多选后的批量排队处理。
3. 典型应用场景
- 资产快速建档:为场景截图、角色立绘或环境音效快速补全可读性说明,方便团队成员理解。
- 自然语言检索:AI 生成的描述将完全纳入全局搜索索引。您可以直接输入“蔚蓝的天空”等自然语言关键词来定位资产,即使文件名中并未包含此类信息。
4. 性能与隐私策略
- 本地隐私保障:通过接入本地部署的模型(如 Ollama),您可以确保资产素材不经过公网传输,实现最高级别的隐私保护。
- 流量优化:在 AI 模型配置 页面,您可以自定义上传至 AI 接口的图像最大分辨率,以平衡识别准确度与网络流量消耗。
NOTE
描述生成的质量主要取决于所选模型的能力。当前版本暂不支持自定义提示词 (System Prompt)。