前言

2024 AWS re:Invent大会上预先宣布的重大更新现已上线!用户现可通过Amazon Bedrock访问Stable Diffusion 3.5 Large模型,生成高质量的图像,从文字描述中快速创作出丰富多样的艺术风格图像,为媒体、游戏、广告和零售行业客户提供概念设计、视觉特效及精美产品图的强大支持。


Stable Diffusion 3.5 Large

2024年10月,Stability AI发布了Stable Diffusion 3.5 Large,这款模型拥有81亿参数,是Stable Diffusion系列中最强大的版本,并在Amazon SageMaker HyperPod上完成训练。相比前代模型,它在图像质量与对提示的响应度上显著提升,特别适合以下场景:

  • 故事版设计:加速制作故事版和概念设计图。
  • 视觉特效:实现快速的效果原型开发。
  • 高效创作:生成1百万像素的高质量图像,用于广告、社交媒体内容和宣传活动。

Stable Diffusion 3.5 Large 特点

  1. 多样风格:支持生成包括3D、摄影、绘画、线条画等多种视觉风格,满足无限创意需求。
  2. 精准提示响应:高级提示响应能力,精确实现用户的文本描述。
  3. 多元化输出:生成反映多样化世界的图像,无需复杂的提示设置。

Stable Image Ultra

Amazon Bedrock 已更新Stable Image Ultra 1.1模型,集成了Stable Diffusion 3.5 Large技术。新的Stable Image Ultra在图像生成上实现了以下突破:

  • 优异的版式设计
  • 复杂场景的创意构图
  • 动态灯光与鲜艳色彩呈现
  • 艺术风格的整体协调性

Amazon Bedrock 快速上手指南

1. 启用模型访问权限

通过Amazon Bedrock控制台开启Stability AI模型的访问权限,选择“Stable Diffusion 3.5 Large”。

要在 Amazon Bedrock 中测试 Stability AI 模型,请在左侧菜单窗格中选择Playgrounds下的图像。然后选择选择模型,并选择Stability AI作为类别,并选择Stable Diffusion 3.5 Large作为模型。

您可以使用提示生成图像。以下是生成图像的示例提示:

High-energy street scene in a neon-lit Tokyo alley at night, where steam rises from food carts, and colorful neon signs illuminate the rain-slicked pavement.

2. 使用示例命令生成图像

以下命令展示了如何通过AWS CLI生成一个霓虹东京街景的示例图像:

aws bedrock-runtime invoke-model \
   --model-id stability.sd3-5-large-v1:0 \
   --body "{\"text_prompts\":[{\"text\":\"High-energy street scene in a neon-lit Tokyo alley at night, where steam rises from food carts, and colorful neon signs illuminate the rain-slicked pavement.\",\"weight\":1}],\"cfg_scale\":0,\"steps\":10,\"seed\":0,\"width\":1024,\"height\":1024,\"samples\":1}" \
   --cli-binary-format raw-in-base64-out \
   --region us-west-2 \
/dev/stdout | jq -r '.images[0]' | base64 --decode > img.jpg

以下是如何使用 Stable Image Ultra 1.1 将 Stable Diffusion 3.5 Large 与AWS SDK for Python (Boto3)stability.stable-image-ultra-v1:1一起包含在模型的底层架构中。

这个简单的应用程序以交互方式请求文本到图像提示,然后调用 Amazon Bedrock 以生成具有模型 ID 的图像。

import base64
import boto3
import json
import os

MODEL_ID = "stability.stable-image-ultra-v1:1"

bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-west-2")

print("Enter a prompt for the text-to-image model:")
prompt = input()

body = {
    "prompt": prompt,
    "mode""text-to-image"
}
response = bedrock_runtime.invoke_model(modelId=MODEL_ID, body=json.dumps(body))

model_response = json.loads(response["body"].read())

base64_image_data = model_response["images"][0]

i, output_dir = 1, "output"
if not os.path.exists(output_dir):
    os.makedirs(output_dir)
while os.path.exists(os.path.join(output_dir, f"img_{i}.png")):
    i += 1

image_data = base64.b64decode(base64_image_data)

image_path = os.path.join(output_dir, f"img_{i}.png")
with open(image_path, "wb") as file:
    file.write(image_data)

print(f"The generated image has been saved to {image_path}")

应用程序将生成的图像写入到output创建的目录中(如果不存在)。为了不覆盖现有文件,代码会检查现有文件以找到第一个符合该img_.png格式的文件名。

联系我们

工四科技 是一家前沿技术公司,提供云计算大数据信息安全人工智能解决方案。我们致力于利用创新技术助力企业数字化转型,推动业务增长。我们的业务范围包括:

  • 云服务:作为 AWS 和 Akamai 合作伙伴,提供全面的云计算和企业上云解决方案,帮助企业实现高效的云端部署和管理,满足各种规模的业务需求。
  • 安全防护:通过安全托管应对未知的网络威胁,通过SOC安全运营中心提供一个全面的网络安全解决方案,集成了资产管理、入侵检测、调查响应、风险防范等多项功能,旨在为企业提供全方位的网络安全保护和管理服务。
  • RPA(机器人流程自动化):通过自动化技术,提高业务流程效率,降低运营成本
  • PWA(渐进式 Web 应用):开发跨平台的 Web 应用,为用户提供接近原生应用的体验。
  • 短信服务:提供全球短信语音短信,满足企业通信需求

Categories: 解决方案

0 Comments

发表回复

Avatar placeholder

您的邮箱地址不会被公开。 必填项已用 * 标注