AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

OpenAI已训练CriticGPT模型：基于GPT-4 用于发现ChatGPT生成内容错误

时间：2024-09-30分类：人工智能作者：TechWeb.com.cn

6月28日消息，据外媒报道，随着GPT系列大模型的不断升级，OpenAI所训练的chatgpt也在拥有更强的能力，但这也带来了一些挑战，它所生成的内容中存在的错误也越来越隐蔽，逐渐到了AI训练师难以发现的程度。

而为了应对这一挑战，OpenAI也想出了新招，他们基于GPT-4模型，训练了一个用于发现chatgpt 输出代码错误的模型。

OpenAI当地时间周四，已在官网宣布了这一消息，他们训练的模型名为CriticGPT，从名称来看就是用于发现不足，以便让相关的应用变得更好。

从OpenAI在官网公布的消息来看，CriticGPT在他们的应用中有不错的效果，他们发现在新模型的辅助下，使用者在检查chatgpt的输出代码时，比没有CriticGPT的协助要好60%。

在官网上，OpenAI提到，他们也是通过RLHF （从人类反馈中强化学习，Reinforcement Learning from Human Feedback）来训练CriticGPT，与训练chatgpt类似。但与训练chatgpt不同的是，他们在训练CriticGPT时，看了大量包含错误的输入。

虽然CriticGPT能帮助发现更多的问题，但也存在不足，还有改进的空间。OpenAI在官网上就提到，并不是所有的发现都是准确的，用于训练的chatgpt 生成内容也普遍很短，还需要开发新的方式，以协助训练师理解更长和更复杂的任务。

此外，OpenAI在官网上也提到，在研发CriticGPT的过程中，他们发现将RLHF应用于GPT-4时，能帮助生成更好的RLHF数据，他们计划扩大这一项工作的规模，并付诸实践。（海蓝）

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

外媒：库克和苹果亟需在中国找到AI合作伙伴

10月25日消息，苹果公司首席执行官蒂姆·库克（Tim Cook）本周对中国进行了访问，这已是他今年第二次到访中国。

作者：网易科技时间：2024-10-25

小鹏AI天玑5.4.0全球首发，智驾云端大模型竞争拉开序幕

10月24日消息，今日，在小鹏P7+AI智驾技术分享会上，小鹏汽车副总裁、自动驾驶负责人李力耘博士、小鹏汽车智能体验负责人于桐，分别介绍了小鹏端到端大模型的技术优势，和首发搭载在小鹏P7+上的AI天玑5.4.0版本。与此

作者：TechWeb.com.cn 时间：2024-10-24

现代起亚与首尔大学等设立机器人研发实验室专注于可移动的双臂机器人

10月24日消息，据外媒报道，现代汽车集团旗下的现代和起亚这两家公司在当地时间周三宣布，他们已同首尔大学、浦项科技大学和韩国科学技术研究院，联合设立了机器人研发实验室。

作者：TechWeb.com.cn 时间：2024-10-24

苹果阐述分阶段发布Apple Intelligence原因：隐私优先，逐步实现智能化服务升级

苹果公司的软件主管Craig Federighi近日在接受媒体采访时，详细阐述了对Apple Intelligence功能的发布策略。他解释了为何这一功能将分阶段推出，以及苹果在这一过程中所秉持的理念和策略。

作者：TechWeb.com.cn 时间：2024-10-24

AI手机看荣耀：荣耀MagicOS 9.0正式发布，开启手机自动驾驶新时代

10月23日，荣耀在MagicOS 9.0发布会及开发者大会上正式发布行业首个搭载智能体的个人化全场景AI操作系统——MagicOS 9.0，推出全新自研魔法大模型家族，并宣布YOYO助理正式升级为YOYO智能体。发布会上，荣耀全新智能

作者：TechWeb.com.cn 时间：2024-10-24

让AI像人类一样操作电脑！Anthropic上新Claude 3.5 Sonnet模型新能力

10月23日消息，OpenAI竞争对手Anthropic宣布推出升级版的Claude 3.5 Sonnet和新款Claude 3.5 Haiku。

作者：TechWeb.com.cn 时间：2024-10-23

OceanBase 4.3.3发布 CEO杨冰：一体化数据库是AI时代的数据底座

10月23日消息，随着AI技术发展，越来越多的AI应用不再局限于纯文本来生成回答，涉及的数据类型日益复杂，并且常存储于IT架构的不同数据库中，这对数据库提出了新的要求，包括提升性能与响应速度，要求数据库处理和存

作者：TechWeb.com.cn 时间：2024-10-23

ColorOS 15体验：系统丝般润滑 AI随叫随到

十月，这个充满科技气息的月份，无疑成为了各大手机厂商激烈角逐的战场。10月9日，联发科(MediaTek)顺应AI时代的潮流，推出了全新的5G旗舰AI芯片——天玑9400。这款芯片的亮点之一就是其NPU（神经网络处理单元）的算

作者：TechWeb.com.cn 时间：2024-10-23

Claude 3.5深夜觉醒，编程干翻o1，Agent一夜变天

编辑：编辑部 HYZ 太科幻了，深夜上线的Claude，可以像人类一样使用计算机了？查看屏幕、移动光标、点击按钮、输入文本，还能查找代码错误、自动搜集信息填表。AI推理已至瓶颈，下一个爆破点，就是AI操作电脑！

作者：新智元时间：2024-10-24

AIGC时代如何打击图片造假诈骗？合合信息文档篡改检测有妙招

近日，第七届中国模式识别与计算机视觉大会（简称“PRCV 2024”）在乌鲁木齐举办。大会由中国自动化学会（CAA）、中国图象图形学学会（CSIG）、中国人工智能学会（CAAI）和中国计算机学会（CCF）联合主办，新疆大学承

作者：编程之家时间：2024-10-22