add model parallel load option

Signed-off-by: Vladimir Mandic <mandic00@live.com>
2025-08-13 21:18:57 -04:00 · 2025-08-13 21:18:57 -04:00 · 068f63badc
parent 706bc9e2e7
commit 068f63badc
4 changed files with 16 additions and 7 deletions
--- a/modules/models_hf.py
+++ b/modules/models_hf.py
@ -8,7 +8,7 @@ def hf_init():
    os.environ.setdefault('HF_HUB_DISABLE_SYMLINKS_WARNING', '1')
    os.environ.setdefault('HF_HUB_DISABLE_IMPLICIT_TOKEN', '1')
    os.environ.setdefault('HUGGINGFACE_HUB_VERBOSITY', 'warning')
-    os.environ.setdefault('HF_ENABLE_PARALLEL_LOADING', 'true')
+    os.environ.setdefault('HF_ENABLE_PARALLEL_LOADING', 'true' if opts.sd_parallel_load else 'false')


 def hf_search(keyword):
--- a/modules/sd_models.py
+++ b/modules/sd_models.py
@ -73,6 +73,16 @@ def copy_diffuser_options(new_pipe, orig_pipe):
        set_accelerate(new_pipe)


+def set_huggingface_options(op: str, model_type: str):
+    if shared.opts.diffusers_to_gpu: # and model_type.startswith('Stable Diffusion'):
+        shared.log.debug(f'Setting {op}: component=accelerate direct={shared.opts.diffusers_to_gpu}')
+        sd_hijack_accelerate.hijack_accelerate()
+    else:
+        sd_hijack_accelerate.restore_accelerate()
+    if shared.opts.sd_parallel_load:
+        shared.log.debug(f'Setting {op}: component=huggingface parallel={shared.opts.sd_parallel_load}')
+
+
 def set_vae_options(sd_model, vae=None, op:str='model', quiet:bool=False):
    ops = {}
    if hasattr(sd_model, "vae"):
@ -498,11 +508,6 @@ def load_diffuser_file(model_type, pipeline, checkpoint_info, diffusers_load_con
            if shared.opts.disable_accelerate:
                from diffusers.utils import import_utils
                import_utils._accelerate_available = False # pylint: disable=protected-access
-            if shared.opts.diffusers_to_gpu and model_type.startswith('Stable Diffusion'):
-                shared.log.debug(f'Setting {op}: component=accelerate direct={shared.opts.diffusers_to_gpu}')
-                sd_hijack_accelerate.hijack_accelerate()
-            else:
-                sd_hijack_accelerate.restore_accelerate()
            sd_model = pipeline.from_single_file(checkpoint_info.path, **diffusers_load_config)
            # sd_model = patch_diffuser_config(sd_model, checkpoint_info.path)
        elif hasattr(pipeline, 'from_ckpt'):
@ -607,6 +612,7 @@ def load_diffuser(checkpoint_info=None, op='model', revision=None): # pylint: di

        # detect pipeline
        pipeline, model_type = sd_detect.detect_pipeline(checkpoint_info.path, op)
+        set_huggingface_options(op, model_type)

        # preload vae so it can be used as param
        vae = None
--- a/modules/shared.py
+++ b/modules/shared.py
@ -142,7 +142,7 @@ options_templates.update(options_section(('sd', "Model Loading"), {

    "advanced_sep": OptionInfo("<h2>Advanced Options</h2>", "", gr.HTML),
    "sd_checkpoint_autoload": OptionInfo(True, "Model auto-load on start"),
-    "sd_parallel_load": OptionInfo(True, "Model auto-load on start"),
+    "sd_parallel_load": OptionInfo(True, "Model load using multiple threads"),
    "sd_checkpoint_autodownload": OptionInfo(True, "Model auto-download on demand"),
    "stream_load": OptionInfo(False, "Model load using streams", gr.Checkbox),
    "diffusers_to_gpu": OptionInfo(False, "Model load model direct to GPU"),
--- a/webui.py
+++ b/webui.py
@ -121,6 +121,9 @@ def initialize():
    modules.extra_networks.register_default_extra_networks()
    timer.startup.record("networks")

+    from modules.models_hf import hf_init
+    hf_init()
+
    if shared.cmd_opts.tls_keyfile is not None and shared.cmd_opts.tls_certfile is not None:
        try:
            if not os.path.exists(shared.cmd_opts.tls_keyfile):