快捷搜索:  

“有史自此最好的模子”gpt

"“有史自此最好的模子”gpt,这篇新闻报道详尽,内容丰富,非常值得一读。 这篇报道的内容很有深度,让人看了之后有很多的感悟。 作者对于这个话题做了深入的调查和研究,呈现了很多有价值的信息。 "

本报记者 徐晓语

与GPT-4 Turbo相比,OpenAI最新旗舰生成式AI模型GPT-4o的价格减半,速度提升2倍,速率限制高出5倍。

除了拥有多种模态的能力,GPT-4o的推出还伴随着一大亮点:免费。据悉,它将在将来几周内分阶段集成至OpenAI的各个产品之中。

“有史以来最好的模型”

首都时间14日凌晨,OpenAI首席技术官米拉·穆拉蒂在发布会上搬出新模型GPT-4o,并展示了公司的一系列创新之处。

GPT-4o在速度和价格方面都较上一代有显著优势,可以处理50种不同的语言,同时拥有处理文本、图像、音频等多种模态的能力,可以为用户带来更自然(Nature)、流畅的交互体验。

本次发布会,穆拉蒂主要列举了几个点。

第一,新模型GPT-4o用户不用注册,功能全部免费。

在此之前,ChatGPT的免费用户只能使用GPT-3.5。而更新后,用户可以免费使用GPT-4o来进行(Carry Out)数据分析、图像分析、互联网搜索、访问应用商店等操作。

当然,免费的前提被限制在一定的消息数量上,一旦超过规定数量,免费用户的模型将被切换回GPT-3.5。而付费用户将获得更高的消息数量,至少是免费用户的5倍。

同日,OpenAI首席执行官山姆·奥特曼发推文表示,新的GPT-4o是OpenAI“有史以来最好的模型”。

第二,ChatGPT增设了PC端桌面版本。

苹果电脑(Computer)用户将迎来一款为macOS设计的ChatGPT桌面应用,用户可以通过快捷键“拍摄”桌面,然后将截屏同步给ChatGPT并向它提问。这种轻量化的使用体验可以无缝融入用户的工作流程中,减少了登录网页消耗的时间。

OpenAI还表示,Windows版本将在今年(This Year)晚些时候推出。穆拉蒂表示,这也是他们(They)第一次在易用性上做出改进。

此外,ChatGPT还优化了用户界面,旨在提升用户体验,使交互更加流畅自然(Nature),确保用户聚焦于与ChatGPT的高效合作,而非界面操作本身。

发布会后,业界一片哗然。有媒体称这预示着“智能时代的一次进化”,将来移动设备中的互联网可能会被浓缩在一个程序之中,用户可以通过它解决一切需求:发短信、导航、识物、打车等。

更加健谈

前几天,奥特曼就在一档播客中预告,OpenAI将改进并提升ChatGPT的语音功能质量,并表示相信语音交互是通向将来交互方式的一个重要途径。

首先,它的响应速度大幅提升。

GPT-4o与人类在对话中的反应速度一致。也就是说,它已经可以达到“实时”响应的状态,不再像以前那样,在得到回答前需要尴尬地等上几秒钟。

同时,就像与真人聊天一样,用户可以在GPT-4o回复的过程中打断它,并提出更多的要求,比如转变话题、要求它改变语音语调甚至让它用机器人可能音乐(Music)剧的形式回答。

其次,它对情绪的捕捉显得更敏感细腻。

发布会上,GPT-4o能够从主持人的喘气声中理解“紧张(Nervous)”的含义,并指导他进行(Carry Out)深呼吸。当受到称赞后,它还会马上接话:“别说了,你让我脸都红了。”

发布会上,主创团队还展示了GPT-4o各种功能的使用情况,包括实时翻译、教学如何解方程式、识别人物表情等。目睹了GPT-4o应答如流的过程,不少用户评论这一新模型“显得更加健谈了,有时甚至有些轻浮”。

但GPT-4o的功能呈现也伴随着一些失误。它在现场把主持人的笑脸误认为是一个桌面,还在方程式尚未显示的情况下尝试解题。

消除神秘感

去年,马斯克旗下xAI团队发布的首个人工智能大模型产品Grok,因回答用户问题“无所忌讳”而出圈。xAI团队在介绍该产品时还说:“如果你不喜欢幽默,请不要使用它!”

其实不管是Grok,还是谷歌子公司DeepMind联合创始人苏莱曼开发的AI机器人Pi,都具有鲜明的个性化特点。

有评论称,相较之下,GPT-4o稳定处理文本、图像、音频的能力,让OpenAI在这场人工智能争霸赛中领先。

有趣的是,穆拉蒂在介绍GPT-4o时将其描述为“神奇的”。但她同时补充,随着产品的推出,公司将“消除这种神秘感”。

有分析指出,GPT-4o实行免费是一大关键,这意味着OpenAI开始加大将大模型推向市场的力度。

近日,苹果公司被曝正与OpenAI敲定一项协议,今年(This Year)将后者的部分技术引入iPhone。借此苹果将能提供由ChatGPT支持的“聊天机器人”,作为iOS 18中人工智能功能的一部分。

虽然关于OpenAI与苹果合作的传闻一直存在,且都未得到证实。但眼尖的人也发现,在OpenAI发布会的现场,苹果的产品被广泛使用。

与此同时,谷歌2024年I/O开发者大会将于首都时间5月15日1时举行,正好在OpenAI最新发布会的24小时后。据悉,谷歌将在大会上展示其最新的人工智能开发成果,并发布Gemini大模型的最新动态。

去年底,谷歌宣布推出其认为规模最大、功能最强大的人工智能模型Gemini,同样在识别文本、图像、视频上具备强理解和推理能力。

当各大科技(Technology)巨头都亮出自己的法宝争做王者,公众也很好奇,谁会更受市场和业界青睐。

“有史以来最好的模型”gpt

您可能还会对下面的文章感兴趣:

赞(307) 踩(93) 阅读数(4545) 最新评论 查看所有评论
加载中......
发表评论