stable-diffusion-aws-extension/middleware_api/comfy/execute_async_events.py

import json
import logging
import os
from datetime import datetime

import boto3
from aws_lambda_powertools import Tracer

from common.ddb_service.client import DynamoDbUtilsService
from common.util import s3_scan_files, load_json_from_s3, record_count_metrics, \
    record_latency_metrics, record_queue_latency_metrics
from libs.comfy_data_types import InferenceResult
from libs.enums import ServiceType

tracer = Tracer()
s3_resource = boto3.resource('s3')

sns_topic = os.environ['NOTICE_SNS_TOPIC']
bucket_name = os.environ['S3_BUCKET_NAME']

logger = logging.getLogger(__name__)
logger.setLevel(os.environ.get('LOG_LEVEL') or logging.ERROR)

ddb_service = DynamoDbUtilsService(logger=logger)

job_table = os.environ['EXECUTE_TABLE']
ddb_client = boto3.resource('dynamodb')
inference_table = ddb_client.Table(job_table)


@tracer.capture_lambda_handler
def handler(event, context):
    logger.info(json.dumps(event))
    message = event['Records'][0]['Sns']['Message']
    message = json.loads(message)

    logger.info(message)

    if 'invocationStatus' not in message:
        # maybe a message from SNS for test
        logger.error("Not a valid sagemaker inference result message")
        return

    results = load_json_from_s3(message['responseParameters']['outputLocation'])

    logger.info(results)

    for item in results:
        result = InferenceResult(**item)
        logger.info(result)

        resp = inference_table.get_item(Key={"prompt_id": result.prompt_id})
        if 'Item' not in resp:
            logger.error(f"Cannot find inference job with prompt_id: {result.prompt_id}")
            continue

        result = s3_scan_files(result)

        if message["invocationStatus"] != "Completed":
            result.status = "failed"

        logger.info(result)

        record_queue_latency_metrics(create_time=resp['Item']['create_time'],
                                     start_time=result.start_time,
                                     ep_name=result.endpoint_name,
                                     service=ServiceType.Comfy.value)

        if result.message:
            update_execute_job_table(prompt_id=result.prompt_id, key="message", value=result.message)

        if result.device_id:
            update_execute_job_table(prompt_id=result.prompt_id, key="device_id", value=result.device_id)

        if result.endpoint_instance_id:
            update_execute_job_table(prompt_id=result.prompt_id, key="endpoint_instance_id",
                                     value=result.endpoint_instance_id)

        update_execute_job_table(prompt_id=result.prompt_id, key="status", value=result.status)
        update_execute_job_table(prompt_id=result.prompt_id, key="output_path", value=result.output_path)
        update_execute_job_table(prompt_id=result.prompt_id, key="output_files", value=result.output_files)
        update_execute_job_table(prompt_id=result.prompt_id, key="temp_path", value=result.temp_path)
        update_execute_job_table(prompt_id=result.prompt_id, key="temp_files", value=result.temp_files)
        update_execute_job_table(prompt_id=result.prompt_id, key="complete_time", value=datetime.now().isoformat())

        if message["invocationStatus"] != "Completed":
            record_count_metrics(ep_name=result.endpoint_name,
                                 metric_name='InferenceFailed',
                                 workflow=result.workflow,
                                 service=ServiceType.Comfy.value)
        else:
            record_count_metrics(ep_name=result.endpoint_name,
                                 metric_name='InferenceSucceed',
                                 workflow=result.workflow,
                                 service=ServiceType.Comfy.value)
            record_latency_metrics(start_time=result.start_time,
                                   ep_name=result.endpoint_name,
                                   metric_name='InferenceLatency',
                                   workflow=result.workflow,
                                   service=ServiceType.Comfy.value)

    return {}


def update_execute_job_table(prompt_id, key, value):
    logger.info(f"Update job with prompt_id: {prompt_id}, key: {key}, value: {value}")
    try:
        inference_table.update_item(
            Key={
                "prompt_id": prompt_id,
            },
            UpdateExpression=f"set #k = :r",
            ExpressionAttributeNames={'#k': key},
            ExpressionAttributeValues={':r': value},
            ConditionExpression="attribute_exists(prompt_id)",
            ReturnValues="UPDATED_NEW"
        )
    except Exception as e:
        logger.error(f"Update execute job table error: {e}")
        raise e