添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

GPT-4

与任何 OpenAI 以前的模型相比,GPT-4 可以更准确地解决难题。 与 GPT-3.5 Turbo 一样,GPT-4 针对聊天进行了优化,且能够很好地完成传统的补全任务。 使用聊天补全 API 来使用 GPT-4。 若要详细了解如何与 GPT-4 以及聊天补全 API 进行交互,请查看我们的 操作方法详解

要请求 GPT-4 访问权限,Azure OpenAI 客户可以 通过填写此表单来提出申请

  • gpt-4
  • gpt-4-32k
  • gpt-4 模型最多支持 8192 个输入令牌,而 gpt-4-32k 模型最多支持 32768 个令牌。

    GPT-3.5

    GPT-3.5 模型可以理解和生成自然语言或代码。 GPT-3.5 系列中功能最强大且最具成本效益的模型是 GPT-3.5 Turbo,该模型已针对聊天进行了优化,且能够很好地完成传统的补全任务。 我们建议使用 GPT-3.5 Turbo,而不是 GPT-3.5 和 GPT-3 两种旧模型

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo 模型最多支持 4096 个输入令牌,而 gpt-35-turbo-16k 模型最多支持 16,384 个令牌。

    与 GPT-4 一样,请使用聊天补全 API 来使用 GPT-3.5 Turbo。 若要详细了解如何与 GPT-3.5 Turbo 以及聊天补全 API 进行交互,请查看我们的 操作方法详解

    强烈建议使用 text-embedding-ada-002 (Version 2) 。 此模型/版本提供与 OpenAI 的 text-embedding-ada-002 的奇偶校验。 若要详细了解此模型提供的改进,请参阅 OpenAI 的博客文章 。 即使当前使用的是版本 1,也应迁移到版本 2 以利用最新的权重/更新的令牌限制。 版本 1 和版本 2 不可互换,因此必须使用同一版本的模型完成文档嵌入和文档搜索。

    目前,我们为不同的功能提供了三个嵌入模型系列:以下列表根据模型功能指示服务返回的数字矢量长度:

    1 该模型 只有在收到请求后才会提供
    2 版本 0314 gpt-4 和 gpt-4-32k 将于 2024 年 7 月 5 日后停用。 如需了解模型升级行为,请参阅 模型更新
    3 我们将逐步向客户推出新区域的可用性,以确保顺畅的体验。 在美国东部和法国中部,现有 GPT-4 部署的客户可以创建 GPT-4 版本 0613 的其他部署。 对于刚开始使用 Azure OpenAI 上的 GPT-4 的客户,请使用其他可用区域之一。

    GPT-3.5 模型

    GPT-3.5 Turbo 可与聊天补全 API 搭配使用。 GPT-3.5 Turbo (0301) 也可以与补全 API 搭配使用。 GPT3.5 Turbo (0613) 仅支持聊天补全 API。

    模型 ID 基本模型区域 最大请求(令牌) 训练数据(上限)

    1 版本 0301 gpt-35-turbo 将于 2024 年 7 月 5 日后停用。 如需了解模型升级行为,请参阅 模型更新

    这些模型只能与嵌入 API 请求一起使用。

    强烈建议使用 text-embedding-ada-002 (Version 2) 。 此模型/版本提供与 OpenAI 的 text-embedding-ada-002 的奇偶校验。 若要详细了解此模型提供的改进,请参阅 OpenAI 的博客文章 。 即使当前使用的是版本 1,也应迁移到版本 2 以利用最新的权重/更新的令牌限制。 版本 1 和版本 2 不可互换,因此必须使用同一版本的模型完成文档嵌入和文档搜索。

    可以使用 模型列表 API 获取 Azure OpenAI 资源可用于推理和微调的模型列表。

    Azure OpenAI 现在支持对选定模型部署进行自动更新。 在支持自动更新的模型中,Azure OpenAI Studio 中的“ 新建部署 ”和“ 编辑部署 ”下会显示模型版本下拉列表:

    自动更新为默认值

    选择“自动更新为默认值”后,模型部署将在新版本发布后的两周内自动更新。

    如果你的基于补全和基于聊天补全的模型还处于早期测试阶段,我们建议在部署模型时设置“ 自动更新为默认值 ”(如可用)。

    特定模型版本

    随着你对 Azure OpenAI 使用方式的演变,你开始生成和集成应用程序,你可能想要手动控制模型更新,以便可以在升级之前先测试和验证模型的性能是否在你的用例中保持一致。

    为部署选择特定模型版本时,此版本将保持选中状态,直到你选择自行手动更新,或者达到该模型的停用日期。 达到停用日期后,该模型将在停用日期自动升级到默认版本。

    GPT-35-Turbo 0301 和 GPT-4 0314 停用

    gpt-35-turbo ( 0301 ) 和两个 gpt-4 ( 0314 ) 模型都将在 2024 年 7 月 5 日之前停用。 部署将在停用日期自动升级到默认版本。 如果希望部署停止接受补全请求而不是升级,则可以将模型升级选项设置为通过 API 过期。 我们将在 9 月 1 日前发布相关指南。

    查看弃用日期

    对于当前部署的模型,在 Azure OpenAI Studio 中选择“ 部署 ”:

    若要在 Azure OpenAI Studio 中查看给定区域中所有可用模型的弃用/到期日期,请选择“ 模型 > 列选项 >”,然后选择“ 弃用微调 ”和“ 弃用推理 ”:

    通过 API 更新 & 部署模型

    PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2023-05-01
    versionUpgradeOption
    部署模型版本升级选项:
    OnceNewDefaultVersionAvailable
    OnceCurrentVersionExpired
    NoAutoUpgrade 这表示你要分配给此部署的配额量。 值 1 等于每分钟 1,000 个标记 (TPM)
    curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/text-embedding-ada-002-test-1?api-version=2023-05-01 \
      -H "Content-Type: application/json" \
      -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
      -d '{"sku":{"name":"Standard","capacity":1},"properties": {"model": {"format": "OpenAI","name": "text-embedding-ada-002","version": "2"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'
    

    可通过多种方式生成授权令牌。 初始测试的最简单方法是从 Azure 门户启动 Cloud Shell。 然后运行 az account get-access-token。 可以将此令牌用作 API 测试的临时授权令牌。

    "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/text-embedding-ada-002-test-1", "type": "Microsoft.CognitiveServices/accounts/deployments", "name": "text-embedding-ada-002-test-1", "sku": { "name": "Standard", "capacity": 1 "properties": { "model": { "format": "OpenAI", "name": "text-embedding-ada-002", "version": "2" "versionUpgradeOption": "OnceCurrentVersionExpired", "capabilities": { "embeddings": "true", "embeddingsMaxInputs": "1" "provisioningState": "Succeeded", "ratelimits": [ "key": "request", "renewalPeriod": 10, "count": 2 "key": "token", "renewalPeriod": 60, "count": 1000 "systemData": { "createdBy": "docs@contoso.com", "createdByType": "User", "createdAt": "2023-06-13T00:12:38.885937Z", "lastModifiedBy": "docs@contoso.com", "lastModifiedByType": "User", "lastModifiedAt": "2023-06-13T02:41:04.8410965Z" "etag": "\"{GUID}\""
  • 详细了解 Azure OpenAI
  • 详细了解如何微调 Azure OpenAI 模型
  •