Amazon Bedrock 上线 Stable Diffusion 3.5 Large模型，助力高质量图像生成

前言

在2024 AWS re:Invent大会上预先宣布的重大更新现已上线！用户现可通过Amazon Bedrock访问Stable Diffusion 3.5 Large模型，生成高质量的图像，从文字描述中快速创作出丰富多样的艺术风格图像，为媒体、游戏、广告和零售行业客户提供概念设计、视觉特效及精美产品图的强大支持。

Stable Diffusion 3.5 Large

2024年10月，Stability AI发布了Stable Diffusion 3.5 Large，这款模型拥有81亿参数，是Stable Diffusion系列中最强大的版本，并在Amazon SageMaker HyperPod上完成训练。相比前代模型，它在图像质量与对提示的响应度上显著提升，特别适合以下场景：

故事版设计：加速制作故事版和概念设计图。
视觉特效：实现快速的效果原型开发。
高效创作：生成1百万像素的高质量图像，用于广告、社交媒体内容和宣传活动。

Stable Diffusion 3.5 Large 特点

多样风格：支持生成包括3D、摄影、绘画、线条画等多种视觉风格，满足无限创意需求。
精准提示响应：高级提示响应能力，精确实现用户的文本描述。
多元化输出：生成反映多样化世界的图像，无需复杂的提示设置。

Stable Image Ultra

Amazon Bedrock 已更新Stable Image Ultra 1.1模型，集成了Stable Diffusion 3.5 Large技术。新的Stable Image Ultra在图像生成上实现了以下突破：

优异的版式设计
复杂场景的创意构图
动态灯光与鲜艳色彩呈现
艺术风格的整体协调性

Amazon Bedrock 快速上手指南

1. 启用模型访问权限

通过Amazon Bedrock控制台开启Stability AI模型的访问权限，选择“Stable Diffusion 3.5 Large”。

要在 Amazon Bedrock 中测试 Stability AI 模型，请在左侧菜单窗格中选择Playgrounds下的图像。然后选择选择模型，并选择Stability AI作为类别，并选择Stable Diffusion 3.5 Large作为模型。

您可以使用提示生成图像。以下是生成图像的示例提示：

High-energy street scene in a neon-lit Tokyo alley at night, where steam rises from food carts, and colorful neon signs illuminate the rain-slicked pavement.

2. 使用示例命令生成图像

以下命令展示了如何通过AWS CLI生成一个霓虹东京街景的示例图像：

aws bedrock-runtime invoke-model \
   --model-id stability.sd3-5-large-v1:0 \
   --body "{\"text_prompts\":[{\"text\":\"High-energy street scene in a neon-lit Tokyo alley at night, where steam rises from food carts, and colorful neon signs illuminate the rain-slicked pavement.\",\"weight\":1}],\"cfg_scale\":0,\"steps\":10,\"seed\":0,\"width\":1024,\"height\":1024,\"samples\":1}" \
   --cli-binary-format raw-in-base64-out \
   --region us-west-2 \
/dev/stdout | jq -r '.images[0]' | base64 --decode > img.jpg

以下是如何使用 Stable Image Ultra 1.1 将 Stable Diffusion 3.5 Large 与AWS SDK for Python (Boto3)stability.stable-image-ultra-v1:1一起包含在模型的底层架构中。

这个简单的应用程序以交互方式请求文本到图像提示，然后调用 Amazon Bedrock 以生成具有模型 ID 的图像。

import base64
import boto3
import json
import os

MODEL_ID = "stability.stable-image-ultra-v1:1"

bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-west-2")

print("Enter a prompt for the text-to-image model:")
prompt = input()

body = {
    "prompt": prompt,
    "mode": "text-to-image"
}
response = bedrock_runtime.invoke_model(modelId=MODEL_ID, body=json.dumps(body))

model_response = json.loads(response["body"].read())

base64_image_data = model_response["images"][0]

i, output_dir = 1, "output"
if not os.path.exists(output_dir):
    os.makedirs(output_dir)
while os.path.exists(os.path.join(output_dir, f"img_{i}.png")):
    i += 1

image_data = base64.b64decode(base64_image_data)

image_path = os.path.join(output_dir, f"img_{i}.png")
with open(image_path, "wb") as file:
    file.write(image_data)

print(f"The generated image has been saved to {image_path}")

应用程序将生成的图像写入到output创建的目录中（如果不存在）。为了不覆盖现有文件，代码会检查现有文件以找到第一个符合该img_.png格式的文件名。

联系我们

工四科技 是一家前沿技术公司，提供云计算、大数据、信息安全和人工智能解决方案。我们致力于利用创新技术助力企业数字化转型，推动业务增长。我们的业务范围包括：

云服务：作为 AWS 和 Akamai 合作伙伴，提供全面的云计算和企业上云解决方案，帮助企业实现高效的云端部署和管理，满足各种规模的业务需求。
安全防护：通过安全托管应对未知的网络威胁，通过SOC安全运营中心提供一个全面的网络安全解决方案，集成了资产管理、入侵检测、调查响应、风险防范等多项功能，旨在为企业提供全方位的网络安全保护和管理服务。
RPA（机器人流程自动化）：通过自动化技术，提高业务流程效率，降低运营成本。
PWA（渐进式 Web 应用）：开发跨平台的 Web 应用，为用户提供接近原生应用的体验。
短信服务：提供全球短信，语音短信，满足企业通信需求

Amazon Bedrock 上线 Stable Diffusion 3.5 Large模型，助力高质量图像生成

Published by zheng on 2024 年 12 月 24 日2024 年 12 月 24 日

前言

Stable Diffusion 3.5 Large

Stable Image Ultra

Amazon Bedrock 快速上手指南

1. 启用模型访问权限

2. 使用示例命令生成图像

联系我们

0 Comments

发表回复取消回复

解决方案

Bedrock Marketplace 一站式访问上百款基础模型

解决方案

Amazon Bedrock 两大功能革新RAG应用体验

解决方案

deepseek-ai/DeepSeek-V3

Amazon Bedrock 上线 Stable Diffusion 3.5 Large模型，助力高质量图像生成

Published by zheng on 2024 年 12 月 24 日2024 年 12 月 24 日

前言

Stable Diffusion 3.5 Large

Stable Image Ultra

Amazon Bedrock 快速上手指南

1. 启用模型访问权限

2. 使用示例命令生成图像

联系我们

0 Comments

发表回复 取消回复

Related Posts

解决方案

Bedrock Marketplace 一站式访问上百款基础模型

解决方案

Amazon Bedrock 两大功能革新RAG应用体验

解决方案

deepseek-ai/DeepSeek-V3

发表回复取消回复