我正在测试 OpenAI 的不同模型,我注意到并非所有模型都经过足够的开发或训练以给出可靠的响应。
我测试的型号如下:
model_engine = "text-davinci-003"
model_engine = "davinci"
model_engine = "curie"
model_engine = "babbage"
model_engine = "ada"
Run Code Online (Sandbox Code Playgroud)
davinci我需要了解和之间的区别text-davinci-003,以及如何改进响应以匹配使用 ChatGPT 时的响应。
长话短说
text-davinci-003是更新且功能更强大的型号davincitext-davinci-003支持比以下更长的上下文窗口davincitext-davinci-003在更新的数据集上进行训练davincitext-davinci-003比davincitext-davinci-003不可用于微调,davinci而正如OpenAI官方文章中所述:
虽然 和
davinci都是text-davinci-003强大的模型,但它们在一些关键方面有所不同。
text-davinci-003是更新且功能更强大的模型,专为遵循指令的任务而设计。这使得它能够简洁、更准确地响应 - 即使在零样本场景中,即不需要提示中给出任何示例。davinci另一方面,可以针对特定任务进行微调,如果您可以访问至少数百个训练示例,则可以使其非常有效。此外,
text-davinci-003支持比 davinci 更长的上下文窗口(最大提示+完成长度) - 4097 个令牌,而davinci2049 个令牌。最后,
text-davinci-003在更新的数据集上进行了训练,其中包含截至 2021 年 6 月的数据。这些更新及其对插入文本的支持,构成了text-davinci-003我们推荐用于大多数用例的特别通用且强大的模型。
使用是text-davinci-003因为您在问题中提到的其他模型的能力较差。
如果您购买 ChatGPT Plus 订阅,您还可以使用gpt-3.5-turbo或gpt-4。因此,要获得与 ChatGPT 类似的响应,取决于您是否订阅。当然,gpt-3.5-turbo而且gpt-4能力甚至比text-davinci-003。
text-davinci-003比OpenAIdavinci官方网站上所述的便宜:
| 模型 | 用法 |
|---|---|
| 达芬奇 | $0.1200 / 1K 代币 |
| 文本-达芬奇-003 | $0.0200 / 1K 代币 |
text-davinci-003不可用于微调,但如OpenAIdavinci官方文档所述:
微调目前仅适用于以下基本型号:
davinci、curie、babbage和ada。这些是原始模型,在训练后没有任何说明(例如text-davinci-003)。
| 模型 | 微调可用性 | 训练 |
|---|---|---|
| 达芬奇 | 是的 | $0.0300 / 1K 代币 |
| 文本-达芬奇-003 | 不 |
| 归档时间: |
|
| 查看次数: |
12603 次 |
| 最近记录: |