如何使用通义千问API_模型服务灵积(DashScope)-阿里云帮助中心

通义千问模型具有强大的自然语言处理能力，您可以使用DashScope SDK或HTTP接口调用通义千问模型，将通义千问模型集成到您的业务中。

模型概览

您可以通过SDK或HTTP调用的通义千问系列模型如下表所示：

模型名称	模型简介	模型输入/输出限制
qwen-turbo	通义千问超大规模语言模型，支持中文、英文等不同语言输入。	模型支持 8,000 tokens上下文，为了保证正常的使用和输出，API限定用户输入为 6,000 tokens。
qwen-plus	通义千问超大规模语言模型增强版，支持中文、英文等不同语言输入。	模型支持 32,000 tokens上下文，为了保证正常的使用和输出，API限定用户输入为30,000 tokens。
qwen-max	通义千问千亿级别超大规模语言模型，支持中文、英文等不同语言输入。随着模型的升级，qwen-max将滚动更新升级，如果希望使用固定版本，请使用下面的历史快照版本。当前qwen-max模型与qwen-max-0428快照版本等价，均为最新版本的qwen-max模型，也是当前通义千问2.5产品版本背后的API模型。	模型支持 8,000 tokens上下文，为了保证正常的使用和输出，API限定用户输入为 6,000 tokens。
qwen-max-0428	通义千问千亿级别超大规模语言模型，支持中文、英文等不同语言输入。该模型与当前的qwen-max版本对齐，为qwen-max的2024年4月28号的历史快照，预期维护到下个快照版本发布时间（待定）后一个月。
qwen-max-0403	通义千问千亿级别超大规模语言模型，支持中文、英文等不同语言输入。该模型为qwen-max的2024年4月3号的历史快照固定版本，预期维护到下个快照版本发布时间（待定）后一个月。
qwen-max-0107	通义千问千亿级别超大规模语言模型，支持中文、英文等不同语言输入。该模型为qwen-max的2024年1月7号的历史快照固定版本，仅推荐特定需求客户访问。
qwen-max-1201	通义千问千亿级别超大规模语言模型，支持中文、英文等不同语言输入。
qwen-max-longcontext	通义千问千亿级别超大规模语言模型，支持中文、英文等不同语言输入。	模型支持 30,000 tokens上下文，为了保证正常的使用和输出，API限定用户输入为 28,000 tokens。

{
    "status_code": 200,
    "request_id": "5d768057-2820-91ba-8c99-31cd520e7628",
    "code": "",
    "message": "",
    "output": {
        "text": null,
        "finish_reason": null,
        "choices": [
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": "材料：\n西红柿2个，鸡蛋3个，油适量，盐适量，糖适量，葱花适量。\n\n步骤：\n\n1. 鸡蛋打入碗中，加入少许盐，用筷子搅拌均匀，放置一会儿让蛋白和蛋黄充分融合。\n\n2. 西红柿洗净，切成小块。如果喜欢口感更沙一些，可以切得稍微大一些；如果喜欢口感细腻，可以切得小一些。\n\n3. 热锅凉油，油热后倒入打好的鸡蛋液，用铲子快速搅拌，炒至鸡蛋凝固并变成金黄色，盛出备用。\n\n4. 锅中再加一点油，放入切好的西红柿，用中小火慢慢翻煮，让西红柿出汁，这样炒出来的西红柿才会更甜。\n\n5. 西红柿出汁后，加入适量的糖，继续翻煮，直到西红柿变得软烂。\n\n6. 将炒好的鸡蛋倒回锅中，与西红柿一起翻煮均匀，让鸡蛋充分吸收西红柿的汁水。\n\n7. 最后，根据个人口味加入适量的盐调味，撒上葱花进行提香，翻炒均匀即可出锅。\n\n8. 如果喜欢汤汁多一些，可以适当加点水，调整一下浓稠度。\n\n西红柿炒鸡蛋就做好了，简单易做，营养美味，是一道家常菜的经典之作。"
    "usage": {
        "input_tokens": 25,
        "output_tokens": 289,
        "total_tokens": 314
}

{
    "status_code": 200,
    "request_id": "10b7f68b-f4a3-9798-8f1b-c2177eadf4b2",
    "code": "",
    "message": "",
    "output": {
        "text": null,
        "finish_reason": null,
        "choices": [
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": "材料：\n牛腩500克，西红柿3个，洋葱1个，大蒜4瓣，生姜2片，八角2颗，香叶2片，干辣椒2个，生抽、老抽、料酒、糖、盐适量，清水适量\n\n步骤：\n\n1. 牛腩切块，用清水浸泡半小时，去除血水和杂质。然后冲洗干净备用。\n\n2. 西红柿洗净，切成滚刀块。洋葱切块，大蒜和生姜切片。\n\n3. 热锅凉油，下入八角、香叶、干辣椒炒出香味。\n\n4. 加入洋葱块，翻炒至微黄。\n\n5. 倒入牛腩块，大火翻炒几分钟，使其表面微焦，这样可以锁住肉的鲜味。\n\n6. 加入大蒜和生姜片，继续翻炒均匀。\n\n7. 倒入料酒，煮一会儿去腥。\n\n8. 加入生抽、老抽上色，再加适量糖，翻炒均匀。\n\n9. 倒入足够的清水，水量要没过牛腩，大火烧开后撇去浮沫。\n\n10. 转小火，加入西红柿块，盖上锅盖慢慢炖煮，期间可适当调整火力，保持汤汁微微沸腾。\n\n11. 炖煮约1-1.5小时，直到牛腩变得软烂，汤汁浓稠。\n\n12. 最后根据个人口味加盐调味，收汁即可。\n\n13. 出锅前可撒些葱花或者香菜提香。\n\n这道西红柿炖牛腩就做好了，香气四溢，肉质酥烂，非常美味。"
    "usage": {
        "input_tokens": 26,
        "output_tokens": 361,
        "total_tokens": 387
    "status_code": 200,
    "request_id": "a00b67bd-f477-93ea-a648-862179d7d1fe",
    "code": "",
    "message": "",
    "output": {
        "text": null,
        "finish_reason": null,
        "choices": [
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": "当然可以，糖主要是为了中和牛肉的腥味并增加一些甜味。如果你不喜欢或不添加糖，也可以，只是口感可能会稍微偏重于牛肉本身的原味，而且可能没有那么甜润。你可以根据自己的口味来调整，如果牛腩本身比较嫩，或者你喜欢酸甜口，可以少放或者不放糖，如果牛腩较老，可能会需要一些糖来提升风味。"
    "usage": {
        "input_tokens": 403,
        "output_tokens": 88,
        "total_tokens": 491
}

```
{
    "name": "$工具名",
    "role": "tool",
    "content": "$工具输出"
}
```

参数	数据类型	默认值	说明
model（必选）	string	无	指定用于对话的通义千问模型名，目前可选择 `qwen-turbo` 、 `qwen-plus` 、 `qwen-max` 、 `qwen-max-0403` 、 `qwen-max-0107` 、 `qwen-max-1201` 和 `qwen-max-longcontext` 。
messages	array	无	`messages` ：用户与模型的对话历史。array中的每个元素形式为 `{"role":角色, "content": 内容}` ，角色当前可选值： `system` 、 `user` 、 `assistant` 和 `tool` 。 `system` ：表示系统级消息，用于指导模型按照预设的规范、角色或情境进行回应。是否使用 `system` 角色是可选的，如果使用则必须位于messages的最开始部分。 `user` 和 `assistant` ：表示用户和模型的消息。它们应交替出现在对话中，模拟实际对话流程。 `tool` ：表示工具的消息。在使用function call功能时，如果要传入工具的结果，需将元素的形式设为{"content":"工具返回的结果", "name":"工具的函数名", "role":"tool"}。其中name是工具函数的名称，需要和上轮response中的tool_calls[i]['function']['name']参数保持一致；content是工具函数的输出。参考代码给出了示例。 `prompt` ：用户输入的指令，用于指导模型生成回复。
prompt	string	无（与messages不可同时为空）
seed（可选）	integer		生成时使用的随机数种子，用于控制模型生成内容的随机性。seed支持无符号64位整数。
max_tokens（可选）	integer	1500或2000	指定模型可生成的最大token个数。 `qwen-turbo` 最大值和默认值为1500 tokens。 `qwen-max` 、 `qwen-max-1201` 、 `qwen-max-longcontext` 和 `qwen-plus` 模型，最大值和默认值均为2000 tokens。
top_p（可选）	float		生成过程中的核采样方法概率阈值，例如，取值为0.8时，仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的确定性越高。
top_k（可选）	integer		生成时，采样候选集的大小。例如，取值为50时，仅将单次生成中得分最高的50个token组成随机采样的候选集。取值越大，生成的随机性越高；取值越小，生成的确定性越高。取值为None或当top_k大于100时，表示不启用top_k策略，此时，仅有top_p策略生效。
repetition_penalty（可选）	float		用于控制模型生成时连续序列中的重复度。提高repetition_penalty时可以降低模型生成的重复度，1.0表示不做惩罚。没有严格的取值范围。
presence_penalty（可选）	float		用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度，取值范围[-2.0, 2.0]。
temperature（可选）	float		用于控制模型回复的随机性和多样性。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围：[0, 2)，不建议取值为0，无意义。
stop (可选）	string or array	None	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。以下为stop为array时的示例（tokenizer对应模型为qwen-turbo）： 1.元素为token_id： token_id为108386和104307分别对应token为“你好”和“天气”，设定stop为 `[108386,104307]` ，则模型将要生成“你好”或者“天气”时停止。 2.元素为字符串：设定stop为 `["你好","天气"]` ，则模型将要生成“你好”或者“天气”时停止。 3.元素为array： token_id为108386和103924分别对应token为“你好”和“啊”，token_id为35946和101243分别对应token为“我”和“很好”。设定stop为 `[[108386, 103924],[35946, 101243]]` ，则模型将要生成“你好啊”或者“我很好”时停止。
stream (可选）	boolean	False	用于控制是否使用流式输出。当以stream模式输出结果时，接口返回结果为generator，需要通过迭代获取结果，默认每次输出为当前生成的整个序列，最后一次输出为最终全部生成结果，可以通过设置参数incremental_output为False改变输出模式为非增量输出。
enable_search（可选）	boolean	False	用于控制模型在生成文本时是否使用互联网搜索结果进行参考。取值如下： True：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑判断是否使用互联网搜索结果。 False（默认）：关闭互联网搜索。
result_format（可选）	string	text	用于指定返回结果的格式，默认为text，也可选择message。当设置为message时，输出格式请参考返回结果。推荐您优先使用message格式。
incremental_output (可选）	boolean	False	控制在流式输出模式下是否开启增量输出，即后续输出内容是否包含已输出的内容。设置为True时，将开启增量输出模式，后面输出不会包含已经输出的内容，您需要自行拼接整体输出；设置为False则会包含已输出的内容。您可以参考流式输出代码。默认False： I I like I like apple True: I like apple 该参数只能在stream为True时使用。
tools	array	None	用于指定可供模型调用的工具库，一次function call流程模型会从中选择其中一个工具。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。参考代码中给出了参数描述的示例。如果parameters参数为空，表示function没有入参。使用tools时需要同时指定result_format为message。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。当前支持的模型包括qwen-turbo、qwen-plus、qwen-max和qwen-max-longcontext。
tool_choice	string or object	见说明	在使用tools参数时，用于控制模型调用指定工具。有四种取值： none表示不调用工具。tools参数为空时，默认值为none。 auto表示模型判断是否调用工具，可能调用也可能不调用。tools参数不为空时，默认值为auto。 object结构可以指定模型调用指定工具。例如 `{"type": "function", "function": {"name": "user_function"}}` type现在只支持function function name表示期望被调用的工具名称

{
    "status_code": 200,
    "request_id": "05dc83af-7185-9e14-9b0b-4466de159d6a",
    "code": "",
    "message": "",
    "output": {
        "text": null,
        "finish_reason": null,
        "choices": [
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": "首先，准备两个鸡蛋，一个西红柿，适量的盐、糖、料酒和生抽。将鸡蛋打入碗中，搅拌均匀，西红柿切块。锅中加油，油热后加入鸡蛋液，炒至金黄色，盛出备用。锅中加油，油热后加入西红柿块，翻炒均匀，加入适量的盐、糖、料酒和生抽，炒至西红柿软烂，加入炒好的鸡蛋，翻炒均匀即可。"
    "usage": {
        "input_tokens": 12,
        "output_tokens": 98,
        "total_tokens": 110
}

{
    "status_code": 200,
    "request_id": "a2b49cd7-ce21-98ff-87ac-b00cc590dc5e",
    "code": "",
    "message": "",
    "output": {
        "text": null,
        "finish_reason": null,
        "choices": [
                "finish_reason": "tool_calls",
                "message": {
                    "role": "assistant",
                    "content": "",
                    "tool_calls":[
                            'function': {
                                'name': 'get_current_weather',
                                'arguments': '{"properties": {"location": "北京市"}}'
                            'id': '',
                            'type': 'function'}]
    "usage": {
        "input_tokens": 12,
        "output_tokens": 98,
        "total_tokens": 110
}

返回参数	数据类型	说明	备注
status_code	integer	200（HTTPStatus.OK）表示请求成功，否则表示请求失败，可以通过code获取错误码，通过message字段获取错误详细信息。	无
request_id	string	系统生成的标志本次调用的id。	无
code	string	表示错误码，调用成功时为空值。仅适用于Python。	无
message	string	表示调用失败的详细信息，调用成功时为空值。仅适用于Python。	无
output	object	表示调用结果信息。	无
output.text	string	模型生成的回复。	在使用prompt传入指令时不为空
output.finish_reason	string	有四种情况：正在生成时为null；因触发输入参数中的stop条件而结束为stop；因生成长度过长而结束为length；因发生工具调用为tool_calls。	在使用prompt传入指令时不为空
output.choices	array	当result_format为message时输出choices。	当result_format为message时输出choices。
output.choices[i].finish_reason	string	有三种情况：正在生成时为null；因触发输入参数中的stop条件而结束为stop；因生成长度过长而结束为length。
output.choices[i].message	object	模型输出的消息。
output.choices[i].message.role	string	模型的角色，固定为assistant。
output.choices[i].message.content	string	模型生成的文本。
output.choices[i].message.tool_calls	object	如果模型需要调用工具，则会生成tool_calls参数，应用于function call场景。	包含三个参数：type、function和id。返回结果中给出了function_call的示例。type、function参数详情如下： type，类型为string，当前只能设置为function。 function，类型为object，包含name和arguments两个参数： name，类型为string，表示需要调用的工具的名称，如果是function call场景则表示要调用的工具函数名称。 arguments，类型为string，表示模型生成的要传入工具的参数。可以通过Python中的json.loads方法解析为字典。
usage	object	计量信息，表示本次请求所消耗的token数据。	无
usage.input_tokens	integer	用户输入文本转换成token后的长度。	您可以参考本地tokenizer统计token数据进行token的估计。
usage.output_tokens	integer	模型生成回复转换为token后的长度。	无
usage.total_tokens	integer	usage.input_tokens与usage.output_tokens的总和	无

POST https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation

{
    "output": {
        "choices": [
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": "通义千问，是阿里云自主研发的超大规模语言模型，能够回答问题、创作文字，还能表达观点、撰写代码。我是阿里云推出的一种超大规模语言模型，我是一个能够回答问题、创作文字，还能表达观点、撰写代码的AI助手。如果您有任何问题或需要帮助，请随时告诉我，我会尽力提供支持。"
    "usage": {
        "total_tokens": 97,
        "output_tokens": 73,
        "input_tokens": 24
    "request_id": "0105f672-d7b4-9172-9d03-51c669ec830a"
}

id:1
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"你好","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":28,"input_tokens":27,"output_tokens":1},"request_id":"c13ac6fc-9281-9ac4-9f1d-003a38c48e02"}
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"，","role":"assistant"},"finish_reason":"null"}]},"usage":{"total_tokens":29,"input_tokens":27,"output_tokens":2},"request_id":"c13ac6fc-9281-9ac4-9f1d-003a38c48e02"}
... ... ... ...
... ... ... ...
id:12
event:result
:HTTP_STATUS/200
data:{"output":{"choices":[{"message":{"content":"","role":"assistant"},"finish_reason":"stop"}]},"usage":{"total_tokens":91,"input_tokens":27,"output_tokens":64},"request_id":"c13ac6fc-9281-9ac4-9f1d-003a38c48e02"}

```
{
    "name": "$工具名",
    "role": "tool",
    "content": "$工具输出"
}
```

传参方式	字段	数据类型	必选	描述	示例值
Header	Content-Type	string	是	请求类型：application/json	"Content-Type":"application/json"
	Accept	string	否	选择text/event-stream则会开启SSE响应，默认无设置。	"Accept":"text/event-stream"
	Authorization	string	是	API-KEY，例如：Bearer d1**2a	"Authorization":"Bearer d1**2a"
	X-DashScope-SSE	string	否	设置为enable或者设置Accept: text/event-stream即可启用SSE响应。	"X-DashScope-SSE":"enable"
Body	model	string	是	指定用于对话的通义千问模型名，目前可选择 `qwen-turbo` 、 `qwen-plus` 、 `qwen-max` 、 `qwen-max-0403` 、 `qwen-max-0107` 、 `qwen-max-1201` 和 `qwen-max-longcontext` 。	"model":"qwen-turbo"
	input	object	是	输入模型的信息。	无
	input.prompt	string	否	用户当前输入的期望模型执行指令，支持中英文。与input.messages指定其中一个即可。	"input":{"prompt":"你好"}
	input.history	array	否	即将废弃，请使用messages字段。用户与模型的对话历史，array中的每个元素形式为{"user":"用户输入","bot":"模型输出"}的一轮对话，多轮对话按时间正序排列。	"input":{"history":[{"user":"今天天气好吗？", "bot":"今天天气不错，要出去玩玩嘛？"}, {"user":"那你有什么地方推荐？", "bot":"我建议你去公园，春天来了，花朵开了，很美丽。"}]}
	input.messages	array	否	表示用户与模型的对话历史。array中的每个元素形式为 `{"role":角色, "content": 内容}` ，如果role为tool，元素形式为： `{"role":"tool","content":内容,"name":工具函数名}` 角色可选值： `system` 、 `user` 、 `assistant` 和 `tool` 。	"input":{ "messages":[ { "role": "system", "content": "You are a helpful assistant." }, { "role": "user", "content": "你好，附近哪里有博物馆？" }] }
	input.messages.role	string	messages存在的时候不能省略。
	input.messages.content	string	messages存在的时候不能省略。
	input.messages.name	string	input.messages.role为tool时不能省略	role为 `tool` 表示当前message为function_call的调用结果，name是工具函数名，需要和上轮response中的tool_calls[i].function.name参数保持一致，content为工具函数的输出。参考代码的多轮调用给出了示例。
	parameters	object	否	用于控制模型生成的参数	无
	parameters.result_format	string	否	用于指定返回结果的格式，默认为text，也可设置为message。当设置为message时，输出格式请参考返回结果。推荐优先使用message格式。	"parameters":{"result_format":"message"}
	parameters.seed	integer	否	生成时使用的随机数种子，用户控制模型生成内容的随机性。seed支持无符号64位整数。在使用seed时，模型将尽可能生成相同或相似的结果，但目前不保证每次生成的结果完全相同。	"parameters":{"seed":666}
	parameters.max_tokens	integer	否	用于限制模型生成token的数量，表示生成token个数的上限。其中qwen-turbo最大值和默认值为1500，qwen-max、qwen-max-1201 、qwen-max-longcontext 和 qwen-plus最大值和默认值均为2000。	"parameters":{"max_tokens":1500}
	parameters.top_p	float	否	生成时，核采样方法的概率阈值。例如，取值为0.8时，仅保留累计概率之和大于等于0.8的概率分布中的token，作为随机采样的候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的随机性越低。注意，取值不要大于等于1。	"parameters":{"top_p":0.7}
	parameters.top_k	integer	否	生成时，采样候选集的大小。例如，取值为50时，仅将单次生成中得分最高的50个token组成随机采样的候选集。取值越大，生成的随机性越高；取值越小，生成的确定性越高。注意：如果top_k参数为空或者top_k的值大于100，表示不启用top_k策略，此时仅有top_p策略生效。	"parameters":{"top_k":50}
	parameters.repetition_penalty	float	否	用于控制模型生成时连续序列中的重复度。提高repetition_penalty时可以降低模型生成的重复度。1.0表示不做惩罚。没有严格的取值范围。	"parameters":{"repetition_penalty":1.0}
	parameters.presence_penalty	float	否	用户控制模型生成时整个序列中的重复度。提高presence_penalty时可以降低模型生成的重复度，取值范围 [-2.0, 2.0]。	"parameters":{"presence_penalty":1.0}
	parameters.temperature	float	否	用于控制随机性和多样性的程度。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围：[0, 2)，不建议取值为0，无意义。	"parameters":{"temperature":0.85}
	parameters.stop	string/array	否	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止，生成的内容不包含指定的内容。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。例如将stop指定为 `["你好","天气"]` 或者 `[108386,104307]` ，则模型将要生成“你好”或者“天气”时停止。如果将stop指定为 `[[108386, 103924],[35946, 101243]]` ，则模型将要生成“你好啊”或者“我很好”时停止。	"parameters":{"stop":["你好","天气"]}
	parameters.enable_search	boolean	否	模型内置了互联网搜索服务，该参数控制模型在生成文本时是否参考使用互联网搜索结果。取值如下： true：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑“自行判断”是否使用互联网搜索结果。 false（默认）：关闭互联网搜索。	"parameters":{"enable_search":false}
	parameters.incremental_output	boolean	否	控制在流式输出模式下是否开启增量输出，即后续输出内容是否包含已输出的内容。设置为True时，将开启增量输出模式，后面输出不会包含已经输出的内容，您需要自行拼接整体输出；设置为False则会包含已输出的内容。默认False： I I like I like apple True: I like apple 该参数只能在开启SSE响应时使用。	"parameters":{"incremental_output":false}
	parameters.tools	array	否	用于指定可供模型调用的工具列表。当输入多个工具时，模型会选择其中一个生成结果。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。参考代码中给出了一个参数描述的示例。如果parameters参数为空，表示function没有入参。使用tools时需要同时指定result_format为message。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。当前支持的模型包括qwen-turbo、qwen-plus、qwen-max和qwen-max-longcontext。	`"parameters":{"tools":[ "type": "function", "function": { "name": "get_current_weather", "description": "Get the current weather in a given location", "parameters": { "type": "object", "properties": { "location": { "type": "string", "description": "The city and state, e.g. San Francisco, CA" "unit": { "type": "string", "enum": [ "celsius", "fahrenheit" "required": [ "location" ]}`
	parameters.tool_choice	string/object	否	在使用tools参数时，用于控制模型调用指定工具。有四种取值： none表示不调用工具。tools参数为空时，默认值为none。 auto表示模型判断是否调用工具，可能调用也可能不调用。tools参数不为空时，默认值为auto。 object结构可以指定模型调用指定工具。例如 `{"type": "function", "function": {"name": "user_function"}}` type现在只支持function function name表示期望被调用的工具名称	`{"type": "function", "function": {"name": "user_function"}}`

字段	数据类型	描述	示例值
output.text	string	模型输出的内容。当result_format设置为text时返回该字段。	我建议你去颐和园
output.finish_reason	string	有三种情况：正在生成时为null，生成结束时如果由于停止token导致则为stop，生成结束时如果因为生成长度过长导致则为length。当result_format设置为text时返回该字段。	stop
output.choices	array	当result_format设置为message时返回该字段。	普通示例 `{ "choices": [ "finish_reason": "null", "message": { "role": "assistant", "content": "周围的咖啡馆在..." }` function call示例 `{ "choices": [ "finish_reason": "tool_calls", "message": { "role": "assistant", "content": "", "tool_calls": [ "function": { "name": "get_current_weather", "arguments": "{\"location\": \"Boston\", \"unit\": \"fahrenheit\"}" "type": "function" }`
output.choices[x].finish_reason	string	停止原因，null：生成过程中 stop：stop token导致结束 length：生成长度导致结束
output.choices[x].message	object	message每个元素形式为{"role":角色, "content": 内容}。角色可选值： `system` 、 `user` 、 `assistant` 。content为模型输出的内容。
output.choices[x].message.role	string
output.choices[x].message.content	string
output.choices[x].message.tool_calls	object	如果模型需要调用工具，则会生成tool_calls参数，应用于function_call场景。其中包含type和function两个参数，返回结果中给出了function_call的示例。参数详情如下：： type，类型为string，当前只可能为function function，类型为dict，包含name和arguments两个参数： name，类型为string，表示需要调用的工具的名称，如果是function_call场景则表示要调用的function名称 arguments，类型为string，表示模型生成的工具入参，在Python中可以使用json.loads方法转化为字典类型。
usage	object	本次调用使用的token信息。	无
usage.output_tokens	integer	模型输出内容的 token个数。	380
usage.input_tokens	integer	本次请求输入内容的token个数。在enable_search设置为true时，输入的 token 数目由于需要添加搜索相关内容，因此会比您在请求中的输入token个数多。	633
usage.total_tokens	integer	usage.output_tokens与usage.input_tokens的总和。	1013
request_id	string	本次请求的系统唯一码。	7574ee8f-38a3-4b1e-9280-11c33ab46e51

{
    "code":"InvalidApiKey",
    "message":"Invalid API-key provided.",
    "request_id":"fb53c4ec-1c12-4fc4-a580-cdb7c3261fc1"
}

API详情

模型概览

SDK使用

前提条件

单轮对话

多轮对话

流式输出

Asyncio接口

Function call

输入：杭州天气

输入：你好

输入参数配置

返回结果

HTTP调用接口

前提条件

提交接口调用

单轮对话

多轮对话

流式输出

Function call

入参描述

出参描述

异常响应示例

状态码说明