AI 自动生成描述
AssetLibrary 集成了先进的大语言模型 (LLM) 视觉识别技术,能够主动理解您的图形资产内容,并将视觉信息转化为可搜索、可理解的文字描述。
1. 技术原理
当您触发 AI 描述生成时,系统会执行以下后台操作:
- 内容捕获:
- 对于静态图片,直接发送原图。
- 对于 Spine 动画 或 序列帧 (Sprites),预览引擎会智能捕获当前动作的最具代表性的画面(通常是第一帧或包含骨骼边界最多的帧)。
- 多模态语义分析:将捕获的图像通过安全通道发送给您配置的视觉模型(如 Qwen-VL 或 GPT-4o-mini)。
- 文本生成:模型返回对画面内容、配色风格、角色属性的文本总结。
2. 操作流程
- 配置模型:在使用前,请确保在 「设置 -> AI 模型」 中配置了有效的 API 地址(推荐使用本地部署的 Ollama)。
- 发起分析:选中资产,在右侧详情面板的「描述」区域点击 魔法棒图标 (🪄)。
- 查看与保存:分析完成后,描述框中会显示识别出的文字。您可以点击「保存」按钮将其持久化到数据库。
[App截图:AI 自动生成描述前后的对比效果]
3. 核心应用场景
- 海量素材初筛:无需人工撰写,自动为成千上万个 Spine 动作命名(如:“一个持剑奔跑的男性战士”)。
- 无障碍搜索:生成的描述文字会被全文索引,您可以直接搜索“赛博朋克”、“森林”等关键字找到对应的视觉资源,即使文件名中没有这些词。
4. 性能与隐私
- 本地优先:我们强烈建议配合 Ollama 进行本地部署。这样您的所有资产图片都不会离开您的局域网,确保了极高的隐私安全性。
- 批量并发:系统支持多选资产后批量请求 AI 描述,通过队列管理避免 API 拥塞。
TIP
如果生成的描述不符合预期,您可以在「设置」中调整 AI 的 System Prompt (提示词),告诉它以特定的语气或重点(如“更关注美术风格”)进行总结。