前言

亚马逊云科技正式推出Amazon Bedrock Marketplace,支持用户通过Amazon Bedrock访问上百个热门、新兴和专业的基础模型(FM),包括查看、测试和部署来自IBM和Nvidia等企业提供商的新模型、韩语处理模型Solar Pro等专业模型,以及部署来自Anthropic和Meta等提供商的Amazon Bedrock通用基础模型。

使用与Serverless模型相同的标准API,即可访问通过Amazon Bedrock Marketplace部署的模型,并且模型若与Converse API兼容,还可配合Amazon Bedrock Agents和Amazon Bedrock知识库等工具一起使用。

同时Amazon Bedrock Marketplace通过提供单一接口访问专业模型和通用FM,极大降低了企业寻找和评估优化特定领域、语言或任务的专业模型的难度与成本。

使用指南

首先在Amazon Bedrock控制台中,选择导航面板的基础模型部分的“模型目录”,在此您可以搜索有助于处理特定用例或语言的模型,搜索结果包括Serverless模型和Amazon Bedrock Marketplace中可用的模型。您可以按提供商、模态(如文本、图像或音频)或任务(如分类或文本摘要)来筛选结果。

本文演示选择了Granite 3.0 2B Instruct,这是一个专为企业应用程序设计的语言模型。选择该模型后会打开模型详细信息页面,将展示模型提供商提供的模型亮点、定价和使用情况(包括示例API调用)等更多信息。

首先在Amazon Bedrock控制台中,选择导航面板的基础模型部分的“模型目录”,在此您可以搜索有助于处理特定用例或语言的模型,搜索结果包括Serverless模型和Amazon Bedrock Marketplace中可用的模型。您可以按提供商、模态(如文本、图像或音频)或任务(如分类或文本摘要)来筛选结果。

本文演示选择了Granite 3.0 2B Instruct,这是一个专为企业应用程序设计的语言模型。选择该模型后会打开模型详细信息页面,将展示模型提供商提供的模型亮点、定价和使用情况(包括示例API调用)等更多信息。

这一特定模型需要订阅,选择“查看订阅选项”,随后选择“订阅”,以继续使用该模型。

通常只需几分钟即可完成订阅,之后便可以部署模型。关于部署详情,本文演示使用了默认设置和推荐的实例类型。

展开可选的“高级设置”,您可以选择部署在虚拟私有云(Amazon VPC)中,或者指定部署所使用的Amazon Identity and Access Management(Amazon IAM)服务角色。Amazon Bedrock Marketplace会自动创建一个服务角色来访问存储模型权重的Amazon S3存储桶,但您也可以选择使用现有服务角色。

本文演示选择保留默认值并完成部署。

几分钟后,部署完成并进入服务状态,您可以在导航面板中的“Marketplace部署”页面查看。

在“Marketplace部署”页面,您可以选择一个端点来查看详细信息并编辑实例数量等配置。为了测试部署,本文演示选择“在测试环境中打开”并请求部分poetry

             

您也可以在测试环境的“聊天和文本”页面中使用新的“Marketplace”类别(其中列出了已部署的端点)来选择模型。

同样,您可以通过选择“选择模型”和“Marketplace模型端点”,来将该模型与其他工具一起使用,如Amazon Bedrock Agents、Amazon Bedrock知识库、Amazon Bedrock Prompt Management、Amazon Bedrock Guardrails以及模型评估工具。

本文演示使用的是文本到文本的模型,您也可以使用Amazon Bedrock Marketplace来部署具有不同模态的模型。例如部署Stability AI Stable Diffusion 3.5 Large之后,您可以在Amazon Bedrock Image的测试环境中进行快速测试。

现在可以通过Amazon Bedrock InvokeModel API来使用部署的模型。部署模型后,您可以借助亚马逊云科技命令行界面(Amazon CLI)和任何亚马逊云科技软件开发工具包(Amazon SDK),通过将端点Amazon Resource Name(ARN作为模型ID来使用模型。

联系我们

工四科技 是一家前沿技术公司,提供云计算大数据信息安全人工智能解决方案。我们致力于利用创新技术助力企业数字化转型,推动业务增长。 我们的业务范围包括:

  • 云服务:作为 AWS 和 Akamai 合作伙伴,提供全面的云计算和企业上云解决方案,帮助企业实现高效的云端部署和管理,满足各种规模的业务需求。
  • 安全防护:通过安全托管应对未知的网络威胁,通过SOC安全运营中心提供一个全面的网络安全解决方案,集成了资产管理、入侵检测、调查响应、风险防范等多项功能,旨在为企业提供全方位的网络安全保护和管理服务。
  • RPA(机器人流程自动化):通过自动化技术,提高业务流程效率,降低运营成本
  • PWA(渐进式 Web 应用):开发跨平台的 Web 应用,为用户提供接近原生应用的体验。
  • 短信服务:提供全球短信语音短信,满足企业通信需求

Categories: 解决方案

0 Comments

发表回复

Avatar placeholder

您的邮箱地址不会被公开。 必填项已用 * 标注