sd-webui-infinite-image-bro.../README-zh.md

15 KiB
Raw Blame History

🌐 在线体验: http://39.105.110.128:0721 这是我一个空闲的2c2g3m的云主机没有cdn

无边图像浏览

查看近期更新

安装/运行

主要特性

🔥 极佳性能

  • 存在缓存的情况下后,图像可以在几毫秒内显示。
  • 默认使用缩略图显示图像默认大小为512像素您可以在全局设置页中调整缩略图分辨率。
  • 你还可以控制网格图像的宽度允许以64px到1024px的宽度范围进行显示
  • 支持通过--generate_video_cover--generate_image_cache来预先生成缩略图和视频封面,以提高性能。
  • 支持通过IIB_CACHE_DIR环境变量来指定缓存目录。

🔍 图像搜索和收藏

  • 将会把Prompt、Model、Lora等信息转成标签将根据使用频率排序以供进行精确的搜索。
  • 支持标签自动完成、翻译和自定义。
  • 可通过在右键菜单切换自定义标签来实现图像收藏。
  • 支持类似谷歌的高级搜索。
  • 同样支持模糊搜索,您可以使用文件名或生成信息的一部分进行搜索。
  • 支持添加自定义搜索路径,方便管理自己创建的文件夹集合。
  • 支持媒体类型筛选、视频标签搜索与随机排序。
  • 支持按规则自动打标签。

🎵 TikTok 风格浏览

  • TikTok 式纵向刷图/刷视频体验。
  • 信息面板与背景遮罩持续优化,预览返回更顺畅。
  • 删除操作在 TikTok 视图中保持同步。

🖼️ 查看图像/视频和“发送到”

  • 支持查看图像生成信息。全屏预览下同样支持。
  • EXIF/元数据集成在全屏预览中,支持分层浏览与高亮显示。
  • 支持将图像发送到其他选项卡和其他插件,例如 ControlNet, openOutpaint。
  • 支持全屏预览,并且支持在全屏预览下使用自定义快捷键进行操作
  • 支持在全屏预览模式下通过按下方向键或点击按钮移动到前一个或后一个图像。
  • 支持播放远程服务器上的视频文件
  • 支持 WebM 视频与音频文件播放。
  • 优化视频流 Range 处理,改善大文件吞吐。

💻 多种使用方法

  • 您可以将其作为 SD-webui 的扩展安装。
  • 您可以使用 Python 独立运行它。
  • 还提供桌面应用程序版本。
  • 支持多种流行的AI软件

🚶‍♀️ Walk模式

  • 自动加载下一个文件夹 (类似于 os.walk),可让您无需分页浏览所有图像。
  • 已测试可正常处理超过 27,000 个文件。
  • 当存在文件夹的情况下你可以通过右上角的walk按钮从其他模式切换到walk模式它会将所有的文件夹打平避免来回进出文件夹的繁琐操作。

🌳 基于文件树结构的预览和文件操作

  • 支持基于文件树结构的预览。
  • 支持自动刷新。
  • 支持基本文件操作以及多选删除/移动/复制,新建文件夹等。
  • 按住 Ctrl、Shift 或 Cmd 键可选择多个项目。
    • 支持多选的操作有:删除、移动、复制、打包下载、添加标签、移除标签,移动到其他文件夹,复制到其他文件夹,拖拽
    • 你可以通过右下角的保持多选按钮来保持多选的状态,对选中的文件集合可以很方便的进行多次操作
  • 支持拖拽到文件夹,移动/复制支持“出错继续”。

🆚 图像对比 (类似ImgSli)

  • 提供两张图片的并排比较
  • 同时提供图像生成信息的比较

🧠 Topic/Tag 分析

  • 标签关系图可视化与主题聚类联动。

🗂️ 智能整理

AI 驱动的自动文件整理

  • 语义聚类:基于 AI 向量化技术,自动将语义相似的图片分组
  • 智能命名AI 自动生成有意义的文件夹名称,支持多语言
  • 预览确认:执行前可预览整理方案,支持跳过或调整特定分组
  • 后台处理:大文件夹在后台异步处理,不影响继续使用
  • 灵活配置:支持移动/复制、设置最小聚类大小、递归处理子文件夹

使用方法:

  1. 进入需要整理的文件夹
  2. 点击地址栏中的「智能整理」按钮
  3. 配置选项(目标文件夹、最小聚类大小等)
  4. 等待 AI 分析完成
  5. 预览整理方案
  6. 确认执行

前置条件:与自然语言搜索相同 - 需要配置 OPENAI_BASE_URLOPENAI_API_KEY,以及 Python 依赖 numpyhnswlib

📸 查看下方智能整理预览获取截图和视频演示

🌐 多语言支持

  • 目前支持简体中文/繁体中文/英文/德语。
  • 如果您希望添加新的语言,请参考 i18n.ts 并提交相关的代码。

🔐 隐私和安全

  • 支持自定义secret key来进行身份验证
  • 支持配置对文件系统的访问控制,默认将在服务允许公开访问时启用(仅限作为sd-webui的拓展时)
  • 支持自定义访问控制允许的路径。
  • 支持控制访问权限。你可以让IIB以只读模式运行
  • 点击这里查看详情

⌨️ 快捷键

  • 支持删除和添加/移除Tag在全局设置页进行自定义触发按钮

📦 打包 / 批量下载

  • 允许你一次性打包下载多个图像
  • 数据来源可以是搜索结果/普通的图像网格查看页面/walk模式等。使用拖拽或者“发送到”都可将图片添加待处理列表

如果您喜欢这个项目并且觉得它对您有帮助,请考虑给我点个。这将对我持续开发和维护这个项目非常重要。如果您有任何建议或者想法请随时在issue中提出我会尽快回复。再次感谢您的支持

在微信上赞助我

Buy Me a Coffee at ko-fi.com

视频演示可以在Bilibili上观看

安装/运行

作为SD-webui的扩展程序:

  1. 在SD-webui中打开扩展选项卡。
  2. 选择从URL安装选项。
  3. 输入 https://github.com/zanllp/sd-webui-infinite-image-browsing
  4. 点击安装按钮。
  5. 等待安装完成,然后点击应用并重启UI

作为使用Python运行的独立程序不需要SD-webui:

请参考Can the extension function without the web UI?

如果需要查看ComfyUI/Fooocus/NovelAI生成的图片相关请先参考 https://github.com/zanllp/sd-webui-infinite-image-browsing/issues/202#issuecomment-1655764627

如果你需要dockerfile 参考 https://github.com/zanllp/sd-webui-infinite-image-browsing/discussions/366

作为桌面应用程序不需要SD-webui和Python:

exe版本同样支持ComfyUI/Fooocus/NovelAI

从仓库页面右侧的releases部分下载并安装程序。如果提示检测到病毒忽略即可这是误报。在windows下的编译有两个版本, pyinstaller版本拥有比较低的误报率。

如果你需要自行编译请参考 https://github.com/zanllp/sd-webui-infinite-image-browsing/blob/main/.github/workflows/tauri_app_build.yml

作为库使用

使用iframe接入IIB将IIB作为你应用的文件浏览器使用。 参考 https://github.com/zanllp/sd-webui-infinite-image-browsing/blob/main/vue/usage.md

预览

image

图像搜索

在第一次使用时你需要点击等待索引的生成我2万张图像的情况下大概需要15秒配置是amd 5600x和pcie ssd。后续使用他会检查文件夹是否发生变化如果发生变化则需要重新生成索引,通常这个过程极快。

图像搜索支持翻译,具体看这个 https://github.com/zanllp/sd-webui-infinite-image-browsing/issues/39image image

图像比较

ezgif com-video-to-gif

全屏预览 (并排布局)

11

全屏预览

image

在全屏预览下同样可以查看图片信息和进行上下文菜单上的的操作,支持拖拽/调整/展开收起

https://user-images.githubusercontent.com/25872019/235327735-bfb50ea7-7682-4e50-b303-38159456e527.mp4

如果你和我一样不需要查看生成信息,你可以选择直接缩小这个面板,所有上下文操作仍然可用

image

右键菜单

image

也可以通过右上角的图标来触发 image

Walk模式

https://user-images.githubusercontent.com/25872019/230768207-daab786b-d4ab-489f-ba6a-e9656bd530b8.mp4

深色模式

image

智能整理

AI 驱动的自动文件整理 - 自动将相似图片分组并创建有意义的文件夹。

智能整理配置弹窗 智能整理生成标题 智能整理预览 智能整理预览列表

https://github.com/user-attachments/assets/c1279556-d255-4e71-b230-48523a4859bf

自然语言分类&搜索(实验性)

这个功能用于把图片按提示词语义相似度自动分组(主题),并支持用一句自然语言做语义检索(类似 RAG 的召回阶段)。
它是实验性功能:效果强依赖模型与提示词质量,适合快速找回/整理生成图片。

使用方式(面向使用者)

  1. 打开首页「自然语言分类&搜索(实验性)
  2. 点击「范围」选择要处理的文件夹(可多选,来源于 QuickMovePaths
  3. 归类:点「刷新」会在所选范围内生成主题列表(标题会按前端语言输出)
  4. 搜索输入一句话点「搜索」会自动打开结果页TopK 相似图片)

选择的范围会持久化到后端 KVapp_fe_setting["topic_search_scope"]),下次打开会自动恢复并自动刷新一次结果。

接口(给高级用户/二次开发)

  • 构建/刷新向量POST /infinite_image_browsing/db/build_iib_output_embeddings
    • 入参:folder, model, force, batch_size, max_chars
  • 归类(聚类)POST /infinite_image_browsing/db/cluster_iib_output_job_start,然后轮询 GET /infinite_image_browsing/db/cluster_iib_output_job_status?job_id=...
    • 入参:folder_paths(必填,数组)、threshold, min_cluster_size, force_embed, title_model, force_title, use_title_cache, assign_noise_threshold, lang
  • 语义检索RAG 召回)POST /infinite_image_browsing/db/search_iib_output_by_prompt
    • 入参:query, folder_paths(必填,数组)、top_k, min_score, ensure_embed, model, max_chars

原理(简单版)

  • 1提示词抽取与清洗
    • image.exif 中抽取提示词文本(只取 Negative prompt: 之前)
    • 可选做“语义清洗”:去掉无意义的高频模板词(画质/摄影参数等),更聚焦主题语义(见 IIB_PROMPT_NORMALIZE*
  • 2向量化Embedding
    • 调用 OpenAI 兼容的 /embeddings 得到向量
    • 写入 SQLite 表 image_embedding(增量更新,避免重复花费)
  • 3主题聚类
    • 用“簇向量求和方向”的增量聚类(近似在线聚类),再把高相似簇做一次合并(减少同主题被切碎)
    • 可选把小簇成员重新分配到最相近的大簇,降低噪声
  • 4主题命名LLM
    • 对每个簇取代表提示词样本,调用 /chat/completions 生成短标题与关键词
    • 通过 tool/function calling 强制结构化输出JSON并写入 topic_title_cache
  • 5语义检索
    • 把用户 query 向量化,然后和范围内所有图片向量做余弦相似度排序,返回 TopK

缓存与增量更新

1向量缓存image_embedding

  • 存储位置SQLite 表 image_embedding(以 image_id 为主键)
  • 增量跳过条件:满足以下条件则跳过重新向量化:
    • model 相同
    • text_hash 相同
    • 已存在 vec
  • “重新向量化”的缓存键text_hash = sha256(f"{normalize_version}:{prompt_text}")
    • prompt_text:用于 embedding 的最终文本(抽取 + 可选清洗)
    • normalize_version:由代码对清洗规则/模式计算出的指纹(不允许用户用环境变量手动覆盖)
  • 强制刷新:在 build_iib_output_embeddingsforce=true,或在 cluster_iib_output_job_startforce_embed=true

2标题缓存topic_title_cache

  • 存储位置SQLite 表 topic_title_cache(主键 cluster_hash
  • 命中条件use_title_cache=trueforce_title=false 时复用历史标题/关键词
  • 缓存键 cluster_hash 包含
    • 成员图片 id排序后
    • embedding modelthresholdmin_cluster_size
    • title_model、输出语言 lang
    • 语义清洗指纹(normalize_version)与清洗模式
  • 强制重新生成标题force_title=true

配置(环境变量)

所有 AI 调用都基于 OpenAI 兼容 的服务:

  • OPENAI_BASE_URL:例如 https://your-host/v1
  • OPENAI_API_KEY:你的 Key
  • EMBEDDING_MODEL:用于聚类的 embedding 模型
  • AI_MODEL:默认 chat 模型(兜底默认)
  • TOPIC_TITLE_MODEL:用于主题标题的 chat 模型(不配则回退到 AI_MODEL
  • IIB_PROMPT_NORMALIZE1/0 是否开启提示词清洗
  • IIB_PROMPT_NORMALIZE_MODEbalanced(推荐)/ theme_only(更激进)

注意AI 调用没有 mock 兜底。只要服务端/模型返回异常或不符合约束,就会直接报错,避免产生“看似能跑但其实不可信”的结果。