AI 自动生成描述

AssetLibrary 集成了先进的大语言模型 (LLM) 视觉识别技术，能够主动理解您的图形资产内容，并将视觉信息转化为可搜索、可理解的文字描述。

1. 技术原理

当您触发 AI 描述生成时，系统会执行以下后台操作：

内容捕获：
- 对于静态图片，直接发送原图。
- 对于 Spine 动画 或 序列帧 (Sprites)，预览引擎会智能捕获当前动作的最具代表性的画面（通常是第一帧或包含骨骼边界最多的帧）。
多模态语义分析：将捕获的图像通过安全通道发送给您配置的视觉模型（如 Qwen-VL 或 GPT-4o-mini）。
文本生成：模型返回对画面内容、配色风格、角色属性的文本总结。

2. 操作流程

配置模型：在使用前，请确保在 「设置 -> AI 模型」 中配置了有效的 API 地址（推荐使用本地部署的 Ollama）。
发起分析：选中资产，在右侧详情面板的「描述」区域点击 魔法棒图标 (🪄)。
查看与保存：分析完成后，描述框中会显示识别出的文字。您可以点击「保存」按钮将其持久化到数据库。

[App截图：AI 自动生成描述前后的对比效果]

3. 核心应用场景

海量素材初筛：无需人工撰写，自动为成千上万个 Spine 动作命名（如：“一个持剑奔跑的男性战士”）。
无障碍搜索：生成的描述文字会被全文索引，您可以直接搜索“赛博朋克”、“森林”等关键字找到对应的视觉资源，即使文件名中没有这些词。

4. 性能与隐私

本地优先：我们强烈建议配合 Ollama 进行本地部署。这样您的所有资产图片都不会离开您的局域网，确保了极高的隐私安全性。
批量并发：系统支持多选资产后批量请求 AI 描述，通过队列管理避免 API 拥塞。

TIP

如果生成的描述不符合预期，您可以在「设置」中调整 AI 的 System Prompt (提示词)，告诉它以特定的语气或重点（如“更关注美术风格”）进行总结。