上下文缓存对话创建
1. 概述
创建上下文缓存,通过本接口获得缓存id
字段后,在上下文缓存对话生成接口中通过携带context_id
使用。
模型列表:
Doubao-1.5-pro-32k
Doubao-1.5-lite-32k
Doubao-pro-32k
2. 请求说明
请求方法:
POST
请求地址:
https://gateway.theturbo.ai/v1/context/create
3. 请求参数
3.1 Header 参数
参数名称
类型
必填
说明
示例值
Content-Type
string
是
设置请求头类型,必须为 application/json
application/json
Accept
string
是
设置响应类型,建议统一为 application/json
application/json
Authorization
string
是
身份验证所需的 API_KEY,格式 Bearer $YOUR_API_KEY
Bearer $YOUR_API_KEY
3.2 Body 参数 (application/json)
参数名称
类型
必填
说明
示例
messages
array
是
用于初始化或希望服务在缓存中存储的信息,格式与 OpenAI 兼容。数组中的每个对象包含 role
(角色) 与 content
(内容)。
[{"role": "system","content": "you are a helpful asssistant"}]
role
string
否
消息角色,可选值:system
、user
、assistant
。
system
content
string
否
消息的具体内容。
you are a helpful asssistant
ttl
number
否
过期时长,单位为秒。信息在创建后即开始计时,每次使用则重置为0。计时超过ttl,信息会被从缓存中删除。每次调用chat均根据ttl更新过期时间。过期时间可以设置的范围在1小时到7天,即[3600, 604800]。
86400
4. 请求示例
POST /v1/context/create
Content-Type: application/json
Accept: application/json
Authorization: Bearer $YOUR_API_KEY
{
"model": "Doubao-1.5-pro-32k",
"messages": [
{
"role": "system",
"content": "请扮演一位友好的客服"
},
{
"role": "user",
"content": "你好"
}
],
"mode":"session",
"ttl": 3600
}
5. 响应示例
{
"id": "ctx-20241211104333-12345",
"ttl": 3600,
"truncation_strategy": {
"type": "rolling_tokens",
"rolling_tokens": true
},
"usage": {
"prompt_tokens": 8,
"completion_tokens": 0,
"total_tokens": 8,
"prompt_tokens_details": {
"cached_tokens": 0
}
},
"mode": "session"
}
最后更新于