GPT-3.5 Turbo推出微调功能:支持用自己的数据训练模型,打造专属GPT

闪电发卡1年前ChatGPT935

OpenAI前几天推出了GPT-3.5 Turbo的微调功能(fine-tuning for GPT-3.5 Turbo),用户可以用自己的数据训练模型并大规模运行它,打造专属GPT,并且早期测试显示,经过微调的GPT-3.5 Turbo在特定任务上可以达到或超过GPT-4的表现!下面ChatGPT中文网就分享下这个资讯信息。

一、GPT-3.5 Turbo微调功能介绍

所谓的GPT微调功能就是用我们自己的数据去训练已有的GPT模型,以达到增强GPT在某一方面的能力,得到我们自己的专属GPT模型。例如我们用自己的医学数据来训练GPT模型,以增强GPT在处理医学相关问题的能力,得到一个“医学版GPT”。

结合微调功能,GPT的能力可以在以下实例中得到增强:

  • 改进的可控性:微调允许企业使模型更好地遵循指令,例如使输出简洁或始终以指定语言回应。例如,开发者可以利用微调确保模型在被提示使用该语言时总是用德语回应。

  • 可靠的输出格式:微调提高了模型一致格式化响应的能力——这对于要求特定响应格式的应用至关重要,如代码补全或组成API调用。开发者可以使用微调更可靠地将用户提示转换为可用于他们自己系统的高质量JSON片段。

  • 定制的语调:微调是优化模型输出的质量感觉的绝佳方式,如其语调,使其更适合企业的品牌声音。拥有可识别品牌声音的企业可以使用微调使模型的语调更一致。

目前OpenAI推出了GPT-3.5 Turbo的微调功能,而GPT-4和gpt-3.5-turbo-16k的微调功能也将在这个秋天上线!

二、GPT-3.5 Turbo微调功能步骤

根据OpenAI官方说明,GPT微调的步骤有4步。

1、准备数据

{
  "messages": [
    { "role": "system", "content": "You are an assistant that occasionally misspells words" },
    { "role": "user", "content": "Tell me a story." },
    { "role": "assistant", "content": "One day a student went to schoool." }
  ]}

2、上传文件

curl https://api.openai.com/v1/files \
  -H "Authorization: Bearer $OPENAI_API_KEY" \  -F "purpose=fine-tune" \  -F "file=@path_to_your_file"

3、创建微调作业

curl https://api.openai.com/v1/fine_tuning/jobs \-H "Content-Type: application/json" \-H "Authorization: Bearer $OPENAI_API_KEY" \-d '{
  "training_file": "TRAINING_FILE_ID",
  "model": "gpt-3.5-turbo-0613"
}'

4、使用微调后的模型

curl https://api.openai.com/v1/chat/completions \-H "Content-Type: application/json" \-H "Authorization: Bearer $OPENAI_API_KEY" \-d '{
  "model": "ft:gpt-3.5-turbo:org_id",
  "messages": [
    {
      "role": "system",
      "content": "You are an assistant that occasionally misspells words"
    },
    {
      "role": "user",
      "content": "Hello! What is fine-tuning?"
    }
  ]
}'


相关文章

ChatGPT不懂幽默,25个笑话来回讲千次,查重率达90%

ChatGPT不懂幽默,25个笑话来回讲千次,查重率达90%

智东西6月15日消息,据外媒Ars Technica报道,上周三,两位德国研究人员发表了一篇论文,研究了基于GPT-3.5的ChatGPT幽默理解与生成能力。他们发现ChatGPT的幽默能力相当有限:...

如何在ChatGPT时代提高数字媒体艺术的原创性和价值?

如何在ChatGPT时代提高数字媒体艺术的原创性和价值?

数字媒体艺术是指使用各种数字、信息技术制作的各种形式的有独立审美价值的艺术作品,具有模拟现实的虚拟性、艺术创造的想象性、交互性和使用网络媒体的基本特征。数字媒体艺术是一个跨自然科学、社会科学和人文科学...

购买Suno会员账号:10刀与30刀选项推荐

Suno独享账号购买 大家好!今天我们来聊一聊购买Suno会员账号时,10美元和30美元选项的推荐和选择。作为一个科技爱好者和常年使用Suno的老用户,我相信我的经验能为你们在做选择时提供一些有价值的...

ChatGPT和OpenAI国内保姆级登录改密使用问题解决图文教程,带账号使用常见问题解决方案

ChatGPT和OpenAI国内保姆级登录改密使用问题解决图文教程,带账号使用常见问题解决方案

按顺序仔细做,解决99%问题剩下1%的问题请附上 查IP和显示错误的截图问客服。PS:由于法律问题,T子问题自行解决,请不要来问有没有推荐、怎么开全局什么的,谢谢配合。没有账号的可以点击获取:http...

安全高效的ChatGPT Plus 4.0会员订阅充值方法

闪电发卡ChatGPT产品推荐:ChatGPT独享账号:https://www.chatgptzh.com/post/86.htmlChatGPT Plus独享共享账号购买代充:https://www...

摒弃ChatGPT的迷思:ChatGPT产品分析

摒弃ChatGPT的迷思:ChatGPT产品分析

ChatGPT的火爆背后,引发的是一场狂欢。这样一场狂欢,我们嗅到的是一股似曾相似的味道。这股味道,在区块链的身上,在元宇宙的身上都曾经出现过。深度分析对于ChatGPT追捧,我们更多地看到的是,人们...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。