前言
上周六,OpenAI结束了为期12天的最新技术直播分享。
第一天:完整版o1与ChatGPT Pro发布
OpenAI在第一天发布了期待已久的完整版o1和Pro两个模型,并新增了高级语音和图片上传功能。
与之前的预览版相比,完整版o1和Pro在数学、代码及博士级科学问题上有了显著提升,能够解决超复杂难题,思考时间更长但答案更准确。
同时,OpenAI推出了ChatGPT Pro,用户可无限使用完整版o1和Pro,价格为每月200美元。
第二天:强化微调技术发布
OpenAI发布了强化微调,这是一种全新的模型定制化技术。
只需几十到数千个高质量数据,就能定制金融、法律、医疗、科研等不同领域的AI助手。
强化微调能够提升模型在特定领域任务中的准确性,例如在自然语言处理和机器翻译中,显著优化模型的推理和理解能力。
Sam Altman评价强化微调为2024年OpenAI的最大惊喜之一。
第三天:Sora Turbo发布
在第三天,OpenAI发布了雪藏10个月的文生成视频模型——Sora Turbo。
与早期版本相比,Turbo生成效率更高,能通过文本直接生成最长20秒的1080P视频,是全球生成时长最长的视频模型之一。
同时支持文本+图片/视频,生成特定视频内容,使生成效果更可控。
ChatGPT Plus和Pro用户可免费使用Sora,但使用人数众多导致当天服务器崩溃。经过10多个月的迭代,Sora发布时依然引发用户热情。
第四天:ChatGPT Canvas推出
Canvas是一个功能强大的协作平台,为用户提供独立的工作页面,用户可与ChatGPT协作执行各类任务。
内置于ChatGPT中,Canvas提供单独窗口,主要用于编程和写作任务,能提供意见、审核和具体功能执行。例如,编写代码时遇到困难,Canvas可高亮问题代码并提供调试建议;写文章时,可通过Canvas进行深度内容调整。Canvas如同ChatGPT内置的AI Agent,指导AI高效完成任务。
第五天:苹果全面接入ChatGPT
OpenAI宣布与苹果的iPhone、iPad、Mac和Siri实现深度集成,用户可原生使用ChatGPT。iPhone 16支持ChatGPT的高级视觉功能,用户拍摄或选择图片后,相机控制功能会初步分析图像并提取关键元素,随后交由ChatGPT进一步处理。苹果的入局对OpenAI及整个生成式AI赛道的发展具有重要意义,标志着AI已正式融入我们的生活。
第六天:高级语音与屏幕共享功能发布
OpenAI发布了高级视频对话功能,用户可实时与ChatGPT交流,并可打断其叙述进行实时提问。
屏幕共享功能允许用户实时分享屏幕内容,如处理电子邮件、文档编辑等任务时,ChatGPT可基于共享内容进行深度提问。
此外,为增添圣诞节气氛,OpenAI在ChatGPT中加入了圣诞老人语音模式,用户开启语音模式并说“ho ho ho”即可使用,该模式将在圣诞后失效。
第七天:ChatGPT Projects上线
Projects是一个工具大合集,包含文件与指令上传、自定义对话、Canvas、网络搜索、对话管理、实时协作等高效实用的产品。
Projects更像一个高效的协作平台,用户可在一个项目中同时使用所有高效工具,无论是开发代码、分析文件还是搜索新闻,都非常方便。
第八天:ChatGPT Search 开放
OpenAI向全球用户免费开放了ChatGPT Search
主要功能包括实时搜索、深度优化的搜索算法、股票和新闻等实时内容获取;高级语音模式下,用户可进行更自然的多轮搜索对话;移动端优化提升搜索效率40%以上;地图集成功能允许用户在搜索结果中查看周边地理位置信息,进行路线规划和地点探索。
ChatGPT Search的开放正式向传统搜索巨头谷歌发起挑战,标志着AI搜索时代的到来。
第九天:完整版o1模型API开放
完整版o1模型的API较预览版本思考成本降低了60%,并附带高级视觉功能;
GPT-4o的音频成本降低60%,mini版本价格暴降10倍。
此外,OpenAI增强了实时API并支持WebRTC,使开发的AI应用能自动处理互联网变化,如调整比特率和回声消除,提升实时语音应用的性能和稳定性,简化开发流程。
第十天:新增电话功能——1-800
为了降低ChatGPT使用门槛和扩大应用范围,OpenAI新增了电话功能,专属号码为1-800(242-8478)。
无论是老式座机还是翻盖手机,用户均可拨打该号码询问各种问题。同时,ChatGPT与超级应用WhatsApp完成集成,用户可通过该号码直接发短信咨询,使用方法与web、移动版本相同。发布当天,ChatGPT的电话号码被大量拨打,显示用户对新功能的热烈反响,但需注意前15分钟免费,之后收费。
第十一天:ChatGPT与MacOS原生应用集成
ChatGPT现可在Mac系统上通过高级语音或文本与更多编码和笔记应用程序配合使用。例如,在与Warp控制台和Xcode IDE的交互中,ChatGPT能迅速判断用户意图,无论是分析代码库的提交数据,还是解决复杂编码逻辑问题,都能高效自动解决,节省大量开发时间。
此功能是OpenAI在AI Agent领域的一次尝试,旨在通过智能自动化提升用户体验。
第十二天:新模型o3发布
在发布前一天,许多人猜测OpenAI可能会发布新的文生图模型DALL·E 4。直到发布前一天下午,Sam Altman才透露“oh oh oh”,原来发布的是全新模型——o3。
o3在ARC AGI测试中超越人类评测分数达87.5%,标志着AGI通用人工智能的突破。此外,o3在美国AIME数学竞赛中得分96.7分,超过所有现有模型,堪比顶级数学家。
目前o3处于邀请测试阶段,费用较高,回答一个问题可能需几十至数百美元。OpenAI表示,o3正式公测时将降低使用成本。由于与英国著名电信公司重名,o3作为o1模型的迭代版本未命名为“o2”。
第十三天:特别奖励——无限使用Sora
上周日,Sam Altman在最后一天的o3发布中表示不过瘾,特别增加了第13天的无限使用Sora奖励,解除之前的使用限制。由于12月下旬圣诞节假期,OpenAI的GPU负载减轻,将为所有Plus用户提供假日期间无限制的Sora访问权限。
以上就是12天所有直播内容的整理,希望对大家有所帮助。未来,工四科技将持续为大家输出最新、最准确的技术分享,我们一起结伴同行,见证每一个AI的历史性时刻。
联系我们
工四科技 是一家前沿技术公司,提供云计算、大数据、信息安全和人工智能解决方案。我们致力于利用创新技术助力企业数字化转型,推动业务增长。我们的业务范围包括:
云服务:作为 AWS 和 Akamai 合作伙伴,提供全面的云计算和企业上云解决方案,帮助企业实现高效的云端部署和管理,满足各种规模的业务需求。 安全防护:通过安全托管应对未知的网络威胁,通过SOC安全运营中心提供一个全面的网络安全解决方案,集成了资产管理、入侵检测、调查响应、风险防范等多项功能,旨在为企业提供全方位的网络安全保护和管理服务。 RPA(机器人流程自动化):通过自动化技术,提高业务流程效率,降低运营成本。 PWA(渐进式 Web 应用):开发跨平台的 Web 应用,为用户提供接近原生应用的体验。 短信服务:提供全球短信,语音短信,满足企业通信需求
0 Comments