发布 o1 AI 模型后,OpenAI 引入了「Self-Play」训练方法,让模型与自身不同版本进行对话和推理。为了提升用户体验,OpenAI 又于近日重磅推出了o1-preview和 o1-mini 模型。
最新的 AI 模型 o1-preview 和 o1-mini向所有 ChatGPT 企业版和 ChatGPT 教育版用户开放。这些模型专为处理复杂推理任务而设计,预计将改变组织和学术机构应对诸如高级编码、科学研究等艰难挑战的方式。
o1 模型于本月早些时候首次发布,代表了 OpenAI 在创建具有深度、多步骤推理能力的 AI 上的最先进尝试。通过模仿人类的思维过程,这些模型可以解决早期 AI 迭代难以解决的复杂问题,为依赖高级问题解决能力的行业提供新的可能性。
旨在思考的 AI: 是什么让 01 模型与众不同
o1-preview 和 o1-mini 模型与其之前版本相比,具有更深层次的批判性思考能力。OpenAI 训练这些模型在回应之前花更多时间处理信息,让它们能够处理数学、编码和科学发现等领域的复杂任务。
在初步测试中,o1-preview 模型通过解决国际数学奥林匹克竞赛资格考试中 83% 的问题展示了其能力——这一成绩相较于 GPT-4o 的 13 %有了显著提升。o1-preview 模型在编码竞赛中的表现同样出色,它在严格测试编码技能的平台——Codeforces 上排名第89位。
更小、更具成本效益的 o1-mini 型号则专为编码任务量身定制,为需要解决高级问题而无需广泛知识的公司提供了更实惠的选择。这使得 o1-mini 对于生成和调试复杂代码等任务特别有用,为小型企业和开发人员提供了一个可访问的选项。
为什么 01模型是企业游戏规则的改变者
对于企业客户来说,全新的 o1 模型代表着重大飞跃。从金融到医疗保健,各行各业都越来越多地转向 AI,不仅仅依赖 AI 来实现自动化,还依赖 AI 来解决复杂的高风险问题。o1 模型的推理能力、战略优化能力以及识别错误的能力使其成为这些用例的理想选择。
这些功能对于处理复杂数据集和工作流的公司特别有吸引力。例如,o1-preview 模型可以帮助物理学家生成复杂的量子光学公式,或帮助医疗保健研究人员注释大规模基因组数据。这与早期主要处理重复性、低级任务的 AI 模型形成鲜明对比。
我刚刚让 o1 根据非常具体的免疫学方法编写了一个主要的癌症治疗项目。它在一分钟内创建了项目的完整框架,具有极具创意的目标、方法,甚至还考虑了潜在的陷阱和替代策略......
杰克逊实验室的免疫学家 Derya Unutmaz 博士最近使用 o1-preview 模型编写了一份癌症治疗提案。「它在一分钟内创建了项目的完整框架,设计了高度创新的目标,甚至考虑了潜在的陷阱,」他在 X.com(前身为 Twitter)上发帖。「如果我自己来做,恐怕需要数天甚至更长时间来准备,」他补充道,该模型提出了他可能自己未曾考虑过的想法,即使他在该领域拥有 30 年的经验。
— Derya Unutmaz,医学博士 (@DeryaTR_) September 14, 2024
这种生产力和创造力的提升正是为什么这么多企业渴望将这些模型融入其工作流程的原因。OpenAI 决定通过此次发布优先面向企业客户,凸显了其抢占高价值、高复杂性人工智能细分领域的战略。
教育机构将从中受益匪浅
o1 模型也是教育机构的有力工具。大学和研究中心在进行复杂的数据分析或研究时,经常面临资源和时间的限制。通过向 ChatGPT Edu 客户提供这些模型,OpenAI 为学生和研究人员提供了尖端的 AI 工具,帮助他们解决各自领域中一些最困难的问题。
当 ChatGPT o1 在 1 小时内完成你攻读博士学位时花了大约一年时间的工作时的感觉:https://t.co/jG7UxEUT12
— 凯尔·卡巴萨雷斯博士 (@AstronoMisfit)September 15, 2024
来自学术界的初步反馈非常积极。湾区环境研究所(Bay Area Environmental Research Institute)的天体物理学家凯尔·卡巴萨雷斯(Kyle Kabasares)博士在 X.com 上发帖说,o1-preview「在1小时内完成了我攻读博士学位时花了大约一年的时间」。在计算流体动力学和免疫学等领域,复杂的计算和数据分析是常规操作,o1 模型已经通过加快研究过程和提供新的见解证明了其价值。
此外,o1 模型也有望改变学生的学习方式。通过处理更复杂的任务,这些模型使学生能够专注于更高层次的思考,而不是陷入死记硬背的过程中。这一转变可能会促进学术研究的创新和创造力,加速从物理学到生物学等各个领域的突破。
安全和治理:OpenAl致力于打造负责任的AI
除了先进的功能外,o1 型号还配备了增强的安全功能。OpenAI 开发了一种新的安全训练方法,允许这些模型通过道德准则和安全规则进行推理。对于处理敏感数据的企业和教育机构至关重要。
OpenAI 表示,它不会将客户数据用于训练,以确保专有信息保持安全。该公司还引入了严格的安全评估,包括一项被称为「越狱」的测试,其中 o1-preview 得分为 84 分(满分 100 分),远高于 GPT-4o 的 22 分。意味着 o1 型号能够更好地抵御绕过安全协议的企图,对于关注合规性和数据隐私的企业来说,这是一项关键功能。
在更广泛的背景下,OpenAI 已与美国和英国的 AI 安全机构正式建立合作伙伴关系,使组织们能够尽早访问模型进行独立测试。这项合作旨在确保 AI 进步与道德准则和监管框架保持一致,随着 AI 系统变得更加自主并集成到日常运营中,类似问题日益受到关注。
竞争格局:OpenAl与 Anthropic
o1 模型的发布使 OpenAI 在竞争激烈的 AI 企业领域中占据领导地位。然而,该公司也面临着激烈的竞争。另一家 AI 巨头 Anthropic 最近推出了自己的企业版模型 Claude Enterprise。该模型提供了庞大的 500,000 个代币上下文窗口,是 OpenAI 当前模型的两倍多。虽然 Anthropic 的模型在处理大型数据集方面表现出色,但 OpenAI 的优势在于它专注于深度推理和问题解决。
OpenAI 将这些高级模型整合到其现有的企业和教育产品中,为其带来了竞争优势。虽然 Anthropic 可能在数据处理能力方面占上风,但 OpenAI 对推理任务的关注可能会为其带来长期优势,特别是在解决问题比纯粹的数据处理更有价值的行业中。
AI在商业和教育领域的未来
OpenAI 的 o1-preview 和 o1-mini 模型的推出标志着人工智能领域的一个转折点。这些模型超越了自动执行日常任务的功能,它们被设计为能够进行批判性思考,从而在医疗保健、量子研究和高级编码等行业中成为应对最棘手挑战的真正伙伴。
随着企业和教育机构越来越依赖 AI 进行高风险决策和复杂问题的解决,这些模型的影响可能会重塑我们对智能系统的期望。
在一个创新经常发生在技术和人类洞察力交汇的世界里,o1 系列提供了通往未来的桥梁。现在的问题不再是关于 AI 能做什么,而是关于 AI 应该做什么。而 OpenAI 的最新飞跃似乎给出了明确的答案:它应该做得更多。
本文来自微信公众号“多鲸”(ID:DJEDUINNO),作者:Michael Nuñez,36氪经授权发布。
文章评论