您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:国盛:OpenAI:12日发布会纪要(更新Day12 o3模型)-20241220 - 发现报告
当前位置:首页/会议纪要/报告详情/

国盛:OpenAI:12日发布会纪要(更新Day12 o3模型)-20241220

2024-12-19国盛证券c***
国盛:OpenAI:12日发布会纪要(更新Day12 o3模型)-20241220

Day12,12月20日 发布o3和o3mini模型,暂未开放,可以申请参加openAI安全测试推出一种新的技术,叫做审慎对齐,用于模型安全。 今天我们将讨论下一个前沿模型,它将被命名为03。还有O3Mini,在性能和成本方面确实很出色。今天不会公开发布,好消息是我们将把它们用于公共安全测试,从今天开始你可以申请。随着我们的模型变得越来越强大 ,我们认真对待安全测试。在这个新的能力水平上,我们想尝试在我们的安全测试程序中增加一个新的部分就是允许想要帮助我们测试的研究人员公开访问 。 03在编码还有数学上比o1还要强很多ARC AgI是2019年在关于智力测量的论文中开发的基准,被认为是通用智能的一个 重要里程碑,独特之处在于每项任务都需要不同的技能。因为ARCAgI想测试模型在飞行中学习新技能的能力。我们不只是想重复已经记住的东西。ARCAgI版本1花了5年时间才从0%提高到5%,并采用了领先的前沿模型。今天我非常兴奋地说,03已经获得了我们在低计算上验证的新的最先进的分数。o3的得分为75,当我们要求03思考更长时间,并且我们实际上提升到高计算时,03能够得分85.7%。这一点尤其重要,因为人类的表现与85%的阈值相当。所以这是一个重要的里程碑。 我们正在非常努力地对这个模型进行培训,以便在模型之上进行一些安全干预 。我们现在正在做大量的内部安全测试。但这次我们也开放了外部安全测试,可以去我们的网站申请 我们推进了我们的安全计划。这是一种新的技术,叫做审慎对齐。通常,当我们在我们的模型上进行安全培训时,我们试图了解什么是安全的,什么是不安全的决策边界。通常只是通过展示纯粹的例子:这是一个安全的提示,这是一个不安全的提示,但我们现在可以利用模型中的推理功能来找到更准确的安全边界。 Day11,12月20日 推出ChatGPT桌面应用和其他应用协作能力 ChatGPT桌面应用可以与多种应用(如Warp终端、Xcode、Notion、AppleNotes、Quip等)协作,编写代码、生成图表、撰写文档等,可以在协作中使用选择不同模型(如O1和O1Pro来处理复杂的编码、高级数据分析问题)。引入了高级语音模式,允许用户通过语音交互与其他应用协作 大约六个月前推出了Mac桌面应用程序,几个月前推出了Windows桌面应用程序。随着我们的模型变得越来越强大,ChatGPT将越来越具有代理能力。这意味着ChatGPT将超越简单的问答开始为你工作。我们已经在Canvas中看到了这一点,你正在与ChatGPT协作以帮助改进你的写作和代码,这种转变将会持续 。ChatGPT将代理做越来越多的事情,桌面应用程序也是其中的重要组成部分 ,因为作为桌面应用程序,你可以做的事情比在浏览器标签页中多得多。在你允许的情况下,能够看到你屏幕上的内容并自动化你在桌面上进行的许多工作 。进入2025年时我们将会有更多关于这方面的信息要说,但我们今天也推出了一些令人兴奋的东西。 这是完全原生的Mac版ChatGPT桌面应用程序。作为原生应用,它不占用太多资源,它存在于自己的窗口中,我可以在不切换上下文的情况下使用它。有一个键盘快捷键,option+空格键,可以非常快速地显示和隐藏ChatGPT 当我点击这个按钮时,我将看到我计算机上当前正在运行的、ChatGPT可以与之交互的所有应用程序。首先点击Warp与其交互,“写一个命令,获取过去两个月每天的提交次数。” 它可以与ChatGPT中的所有其他功能和所有其他模型一起工作。4o决定使用高级数据分析来处理一些数字并给我一个条形图。 在IDE中与代码交互,在Xcode中协助编写代码 可以使用模型选择器切换到其他模型,比如o1pro来完成更复杂的编码问题我喜欢用ChatGPT的另一个原因是它可以帮我写作, 今天我们要宣布支持三个新的应用:AppleNotes、Notion和Quip 在协作写作中ChatGPT可以搜索网络,如果我想了解更多信息,我可以点击链接。ChatGPT还可以读我文档的其他部分,学习我的风格。 不仅可以向模型输入文字,还可以用新的高级语音模式支持。使用右下角的图标来请出我们的特别来宾圣诞老人 Day10,12月19日 推出给ChatGPT打电话和通过WhatsApp和ChatGPT沟通的能力OpenAI 推出了一种ChatGPT对话的新方式,拨打电话号码:+1-800-242-8478 美国用户每月可拨打该号码享受15分钟的免费通话时间。全球用户都可以通过WhatsApp向该号码发送消息。 现在通过电话或者WhatsApp使用ChatGPT还没有互联网搜索以及图像功能,这些功能仅在ChatGPT移动应用程序和网站上可用。未来会提供登录ChatGPT账号的能力,让用户可以使用其他高级功能。 Day9,12月18日 更新面向开发人员的新工具 向开发人员推出OpenAIo1、新的自定义工具和升级,包括:1、API中的OpenAIo1 :支持函数调用、开发者消息、结构化输出和视觉功能。 2、实时API更新:包括简单的WebRTC集成、GPT-4o音频降价60%以及以以前音频速率的十分之一支持GPT-4omini 3、偏好微调(Preference Fine-Tuning):这是一种新的模型自定义技术,可以更轻松地根据用户和开发人员的偏好定制模型。 4、新的GO和Java语言API,在beta版可用API中的OpenAIo1 OpenAIo1 是我们的推理模型,旨在以更高的准确性处理复杂的多步骤任务,现在向tie5级别的开发人员推出o1 ,之前是o1-preview,开发人员已经使用它来构建代理应用程序,以简化客户支持、优化供应链决策和预测复杂的财务趋势。 O1可用于生产,具有支持实际使用案例的关键功能,包括:函数调用:将o1无缝连接到外部数据和API。 结构化输出:生成可靠遵守自定义JSON架构的响应。 开发人员消息:指定模型要遵循的说明或上下文,例如定义语气、样式和其他行为指导。 视觉功能:对图像进行推理,以解锁视觉输入很重要的科学、制造或编码中的更多应用。 更低的延迟:对于给定请求,o1使用的推理令牌平均比o1-preview少60%。 新的'reasoning_effort'API参数允许控制模型在回答之前思考的时间。对RealtimeAPI的改进 实时API使开发人员能够创建低延迟、自然的对话体验。它非常适合语音助手、实时翻译工具、虚拟导师、交互式客户支持系统,甚至是您自己的虚拟圣诞老人 (在新窗口中打开).今天,我们发布了一些更改,以解决开发人员的一些最常见的请求:直接WebRTC集成、降低定价以及更好地控制响应。 WebRTC支持:即将推出RealtimeAPI对WebRTC浏览器的支持。WebRTC是一种开放标准,可以更轻松地跨平台构建和扩展实时语音产品,无论是基于浏览器的应用程序、移动客户端、IoT 设备还是直接的服务器到服务器设置。我们的WebRTC 集成旨在实现在实际条件下的流畅和响应迅速的交互,即使网络质量参差不齐 。它处理音频编码、流式处理、噪声抑制和拥塞控制。 使用WebRTC,您现在可以添加实时功能,只需几行Javascript:更低的成本获得新的GPT-4o和GPT-4omini实时快照 改进了语音质量,提高了输入(尤其是对于听写数字)并降低了成本。将音频token价格降低了60%,降至40美元/1M输入oken和80美元/1M 输出oken。缓存音频输入成本降低87.5%,降至2.50USD/1M输入oken。 我们还将GPT-4omini作为''.GPT-4omini 是我们最具成本效益的小型模型,为RealtimeAPI带来了与GPT-4o 相同的丰富语音体验。GPT-4o迷你音频价格为10美元/1M输入token和20 美元/1M输出token。文本令牌的价格为0.60美元/1M输入token和2.40美元/1M输出token。缓存的音频和文本都需要0.30美元/1Mtoken。 更好地控制响应 正在向RealtimeAPI 提供以下功能,以便更轻松地提供卓越的语音驱动体验: 并发带外响应使内容审核或分类等后台任务能够在不中断用户语音交互的情况下运行。 自定义输入上下文指定要将哪些对话项作为模型输入。例如,仅对用户的最后一句话进行审核检查,或重新使用过去的回复,而无需永久更改会话状态。 控制响应时间使用服务器端语音活动检测(VAD) 而不自动触发响应。例如,在手动发起语音回复之前,收集必要的数据(如帐并将其添加到模型的上下文中,从而更好地控制时间和准确性。 增加最大会话长度15至30分钟 偏好微调(PreferenceFine-Tuning) :□差异□存在一些关□之□督微□和□尤其有效。偏好微□任□造力很重要的主□格和□气、于□□松定制模型。偏好微□的偏好□人□和开以便根据用□□在支持偏好微API□微 最后,我们将推出两个新的官方SDK,在beta 版中用于Go和Java,除了我们现有的官方Python、Node.js和.NET库我们的目标是让OpenAIAPI易于使用,无论您选择哪种编程语言。 Day8,12月14日 升级搜索功能,向免费用户推出纪要: 两个月前我们对付费用户推出了搜索使ChatGPT能够访问实时信息,并能够在Web上搜索答案。 今天要宣布三件事1、对搜索做了一些改进,让它更快,在移动设备上更好,有新的地图体验。 2、整合了搜索和高级语音模式,现在可以在与ChatGPT交谈时进行搜索 3、最重要的是为所有免费ChatGPT用户提供搜索 如果我在这里按下回车或发送,ChatGPT将自动决定这个问题是否需要来自网络的最新信息。但是我们还在Web图标中添加了搜索。如果您明确单击此按钮 ,ChatGPT将始终使用来自Web的最新信息 它在网上搜索,你会得到一个答案。可以直接在ChatGPT中看到丰富的视觉图像和列表。 在ChatGPT中可以直接播放搜到的视频 可以在浏览器中使用ChatGPT作为默认搜索引擎从浏览器栏尝试酒店预订 移动端APP搜索餐厅,有地图导航高级语音模式对话中搜索 Day7,12月14日 更新项目功能, 可以上传文件,设置自定义指令,并为该项目中的所有对话定制ChatGPT 目前向Plus、Pro和Teams用户推出。会尽快把它发布给免费用户。展示了用项目功能做一个人网站 纪要: 今天推出了ChatGPT中的projects。当你开始一个项目时,你可以上传文件,你可以设置自定义指令,并为该项目中的所有对话定制ChatGPT。 ChatGPT对话的所有部分比如搜索和画布,都是项目的一部分。或者你可以跳过所有花哨的东西,只使用项目作为文件夹来组织对话 要创建一个新的项目只需转到左侧栏并单击“加号”,如果需要,我可以编辑项目标题。我可以选择一个漂亮的颜色,这有助于我在侧边栏中自定义它。然后我可以添加文件或说明 可以搜索一个相关的聊天,从侧边栏将其添加到项目中 对于秘密圣诞老人项目,我给它加了一个表情符号,选择了喜庆的颜色我收集了与此项目相关的文件,包括秘密圣诞老人提交内容,还设置了规则、礼物预算和活动详情。 我们也拥有搜索网络的能力。在网上搜索节日帽子。在项目中内置了canvas支持 一个房屋维护项目,我用它来记录我公寓里我记不住如何去做,或者我是否已 经做过的事情。 它从我的维护日志中提取了我的冰箱笔记的信息。根据维修记录,我的冰箱需要每6个月更换一次。我从三月开始就没做过了。所以我肯定是过期了。所以我现在就得回家做这件事。所以我也可以问,我该怎么做?它会从我的冰箱维护记录和我的冰箱记录中提取信息并告诉我如何去做 我想给我的个人网站做一点美化。我觉得它有点过时了。所以我浏览了一下网页,寻找我认为可能有趣的模板。我找到了一个我喜欢的,我打算修改它以适应我的需要,这样我就不必手动编写所有这些代码了 我为