AI 智能描述生成 (AI Description)

Sharp Stock 深度集成了先进的多模态大语言模型，可将图像或音频资产的内容自动转化为可检索的高质量文字描述。

1. 核心逻辑说明

当您在详情面板点击带 蓝色 AI 图标 的「自动」按钮时，系统将执行以下流程：

源文件读取：系统将直接读取磁盘上的原始资产文件。
模型调用：根据资产类型，自动调用您在 [设置] → [AI 模型配置] 中定义的接口。图像类资产将发送至视觉模型，音频类资产则发送至音频识别模型。
内容生成：模型返回的原始描述将经过系统优化处理后，自动填充至备注文本框中。

NOTE

当前版本优先支持独立的文件资产。Spine 或 Sprites 聚合资产的 AI 生成需作用于其关联的底层源文件。

2. 操作指南

接口配置：进入 [设置] → [AI 模型配置]，填写 API 地址、模型名称及访问令牌（API Key）。支持接入本地 Ollama 服务以保障内网数据隐私。
发起分析：在右侧详情面板展开 「备注」 栏目，点击 「自动」 按钮。
结果持久化：生成成功后，描述信息将自动写入数据库。若您在生成的基础上进行了手动二次修改，请务必点击 「保存」 按钮。

限制说明：

格式支持：PSD、ICO 及 Sprites 虚拟资产暂不支持 AI 描述入口。
批量处理：当前版本仅支持针对单条选中资产进行 AI 生成，暂不支持多选后的批量排队处理。

3. 典型应用场景

资产快速建档：为场景截图、角色立绘或环境音效快速补全可读性说明，方便团队成员理解。
自然语言检索：AI 生成的描述将完全纳入全局搜索索引。您可以直接输入“蔚蓝的天空”等自然语言关键词来定位资产，即使文件名中并未包含此类信息。

4. 性能与隐私策略

本地隐私保障：通过接入本地部署的模型（如 Ollama），您可以确保资产素材不经过公网传输，实现最高级别的隐私保护。
流量优化：在 AI 模型配置 页面，您可以自定义上传至 AI 接口的图像最大分辨率，以平衡识别准确度与网络流量消耗。

NOTE

描述生成的质量主要取决于所选模型的能力。当前版本暂不支持自定义提示词 (System Prompt)。