Stability.ai

1. 概述

Stability.ai 是一家专注于开发人工智能模型的公司,该公司的代表性模型是 Stable Diffusion,它是一个基于深度学习的图像生成模型,因其能够从文本描述生成高质量图像而广受关注。

说明:

  1. 该系列模型对中文支持不太友好,使用自然语言描述时尽量使用英文

模型列表:

  • sd-ultra

  • sd3-large

  • sd3.5-large

  • sd3-large-turbo

  • sd3.5-large-turbo

  • sd3-medium

  • sd3.5-medium

  • sd-core

2. 请求说明

  • 请求方法:POST

  • 请求地址:

    https://gateway.theturbo.ai/v1/images/generations


3. 请求参数

3.1 Header 参数

参数名称
类型
必填
说明
示例值

Content-Type

string

设置请求头类型,必须为 multipart/form-data

multipart/form-data; boundary=------------------------y0QNRDhXQUE3yHQi7DEbLz

Accept

string

设置响应类型,必须为 image/*

image/*

Authorization

string

身份验证所需的 API_KEY,格式 Bearer $YOUR_API_KEY

Bearer $YOUR_API_KEY


3.2 Body 参数 (multipart/form-data)

参数名称
类型
必填
说明
示例(默认值)

model

string

要使用的模型 ID。详见概述列出的可用版本,如 sd3-large

sd3-large

prompt

string

一段描述所需图像的文字。描述最大长度为 10000 字符。

A cute baby sea otter

mode

string

控制是text-to-image还是image-to-image,这会影响所需的参数:text-to-image仅需要prompt参数,image-to-image需要promptimagestrength参数。sd-core不支持image-to-image

text-to-image

image

string(binary)

用于作为生成起始点的图像,只用于image-to-image。支持的格式:jpeg png webp;支持的尺寸:每一边必须至少为 64 像素。

strength

number[0,1]

有时被称为去噪(denoising),此参数控制图像参数对生成图像的影响程度。值为0时,生成的图像与输入图像完全相同;值为1时,生成的图像就像没有传入任何图像一样。

0.9

negative_prompt

string

不希望在输出图像中看到的内容的关键词。sd3-large-turbo不支持这个参数。

a cat

seed

number[0,4294967294]

一个用于引导生成“随机性”的特定值。(如果省略此参数或传递 0,将使用随机种子)

0

aspect_ratio

string

控制生成图像的纵横比。支持16:9 1:1 21:9 2:3 3:2 4:5 5:4 9:16 9:21

1:1

output_format

string

jpegorpng

png

style_preset

string

引导图像模型朝向特定的风格。支持3d-model analog-film anime cinematic comic-book digital-art enhance fantasy-art isometric line-art low-poly modeling-compound neon-punk origami photographic pixel-art tile-texture。只有sd-core支持这个参数。


4. 请求示例

text-to-image

curl https://gateway.theturbo.ai/v1/images/generations \
	-H "Accept: image/*" \
	-H "Authorization: Bearer $YOUR_API_KEY" \
	-F model="sd3-large" \
	-F prompt="A cute baby sea otter wearing a beret"

image-to-image

curl https://gateway.theturbo.ai/v1/images/generations \
	-H "Accept: image/*" \
	-H "Authorization: Bearer $YOUR_API_KEY" \
	-F model="sd3-large" \
	-F prompt="A cute baby sea otter wearing a beret" \
	-F mode="image-to-image" \
	-F image="@input.png" \
	-F strength=0.9 \

5. 响应示例

HTTP/1.1 200 OK
Content-Type: image/png

图片二进制文件

最后更新于