OpenAI

1. 概述

OpenAI 的文本嵌入(Text Embeddings)用于衡量文本字符串之间的相关性。嵌入通常用于以下场景:

  • 搜索(Search):根据查询字符串的相关性对搜索结果进行排序。

  • 聚类(Clustering):将相似的文本字符串分组。

  • 推荐(Recommendations):推荐具有相关文本字符串的项目。

  • 异常检测(Anomaly Detection):识别与其他数据关联较低的异常文本。

  • 多样性测量(Diversity Measurement):分析文本的相似性分布。

  • 分类(Classification):根据最相似的标签对文本字符串进行分类。

模型列表:

  • text-embedding-3-small

  • text-embedding-3-large

  • text-embedding-ada-002

2. 请求说明

  • 请求方法:POST

  • 请求地址:

    https://gateway.theturbo.ai/v1/embeddings


3. 请求参数

3.1 Header 参数

参数名称
类型
必填
说明
示例值

Content-Type

string

设置请求头类型,必须为 application/json

application/json

Accept

string

设置响应类型,建议统一为 application/json

application/json

Authorization

string

身份验证所需的 API_KEY,格式 Bearer $YOUR_API_KEY

Bearer $YOUR_API_KEY


3.2 Body 参数 (application/json)

参数名称
类型
必填
说明
示例

model

string

要使用的模型 ID。详见概述列出的可用版本,如 text-embedding-ada-002

text-embedding-ada-002

input

string/array

输入内容。数组维度不得超过2048。输入token数不得超过8192

你好,请给我讲个笑话。

encoding_format

string

返回向量的格式。支付floatbase64

float


4. 请求示例

POST /v1/embeddings
Content-Type: application/json
Accept: application/json
Authorization: Bearer $YOUR_API_KEY

{
	"model": "text-embedding-ada-002",
	"input": "今天天气怎么样"
}

5. 响应示例

{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "embedding": [
        0.0023064255,
        -0.009327292,
        .... (1536 floats total for ada-002)
        -0.0028842222,
      ],
      "index": 0
    }
  ],
  "model": "text-embedding-ada-002",
  "usage": {
    "prompt_tokens": 8,
    "total_tokens": 8
  }
}

最后更新于