本文作者:郭沫若

2023澳门今晚开奖特马,GPT-4o 高级语音模式上线,ChatGPT 语音对话更自然,安全防护也升级了

2023澳门今晚开奖特马,GPT-4o 高级语音模式上线,ChatGPT 语音对话更自然,安全防护也升级了摘要: 2023澳门今晚开奖特马,GPT-4o 高级语音模式上线,ChatGPT 语音对话更自然,安全防护也升级了该模式上线后,不少收到邀请的网友已经玩起来了,并分享了自己试用的视频和感受...

智东西7月31日报道称,今天凌晨香港马会开奖结果 记录,其宣布已开始向少部分Plus用户推出高级语音模式,基于GPT-4o提供更自然的实时对话。

2023澳门今晚开奖特马,GPT-4o 高级语音模式上线,ChatGPT 语音对话更自然,安全防护也升级了

▲推出高级语音模式

该模式上线后,不少收到邀请的网友已经开始体验,并分享了试玩的视频和感受。比如这是由表演的快节奏说唱,听起来就很不错。

总体来说,高级语音模式和官方演示的差别不大,几乎没有延迟,语音音调逼真。不过似乎采取了不少安全措施,拒绝用户请求的概率有所增加。

该聊天机器人的语音对话功能于去年 9 月首次推出。今年 5 月,基于旗舰模型 GPT-4o 的更高级语音对话版本推出并公开演示。GPT-4o 使用单一多模态模型代替之前的三个独立模型来实现语音功能,从而降低与聊天机器人对话的延迟。(一夜之间让语音助手不堪重负!GPT-4o 模型强大到令人恐惧。学会读屏幕。《她》真实版即将到来)

当时宣布该功能将在几周内逐步向免费和付费用户推出,然而上线没几天,演示中的声音就因与《复仇者联盟》系列电影中饰演黑寡妇、被粉丝称为“黑寡妇”的斯嘉丽约翰逊( )的声音太过相似,斯嘉丽约翰逊因此受到吐槽,网友也强烈反对。

高级配音模式的发布日期因此被推迟,随后该声音被删除,尽管工作室坚称这不是对斯嘉丽约翰逊声音的模仿。

1. 超过 100 名外部红队成员进行测试,并将于秋季向所有订阅者开放

基于GPT-4o的高级语音模型目前仅向少数Plus用户开放,它可以提供更自然的实时对话,允许用户随时打断关键技术天下彩(944:CC)免费资料大全,还能感知并回应用户的情绪。

参与此次 Alpha 测试的用户将收到一封包含说明的电子邮件,并在其移动应用中收到通知。该公司表示,将继续以滚动方式增加更多用户,并计划在秋季向所有 Plus 用户提供此功能。

2023澳门今晚开奖特马,GPT-4o 高级语音模式上线,ChatGPT 语音对话更自然,安全防护也升级了

▲邀请邮件及App首页

高级语音模式于今年5月发布,基于新旗舰型号GPT-4o,可进行语音聊天和实时视频互动,比如通过视频图像理解线性方程、通过表情语调理解和判断人的情绪等。

据该公司称,自首次发布以来,该团队一直致力于提高语音对话的安全性和质量,并与 45 种语言的 100 多名外部红队成员一起测试语音功能。

为了保护隐私,训练模型时只使用了四种预设声音来说话,并构建了相应的系统来屏蔽不同的输出,并采取了保护措施来屏蔽对暴力或版权内容的请求。

我们计划在 8 月初分享有关 GPT-4o 的功能、局限性和安全评估的详细报告。

2. 首批试用用户开始进行一些活动:练习法语、学喵叫、评论足球

首批试用用户已迫不及待想要使用高级语音模式,并纷纷分享了试用感受。

艺术家打开摄像机,实时拍摄自己新领养的小猫以及自己给它布置的环境,并询问喂养方面的建议。

猫咪毫不迟疑地回应,他先是宠溺地夸猫咪可爱,再问清楚情况后安慰它,让它不用担心。他感慨道:“感觉就像和一位博学的朋友视频通话一样。”

2023澳门今晚开奖特马,GPT-4o 高级语音模式上线,ChatGPT 语音对话更自然,安全防护也升级了

网友在社交媒体上分享说,它拒绝了他所有唱歌的要求,不愿意改变声音。当他要求它以不同的方式和情绪朗诵一首诗时,它成功了,但当他要求它面带微笑地朗诵这首诗时,它拒绝了。

例如,假设您正在练习法语,并请某人担任您的语言教练并寻求他们关于发音的建议。

对单词发音、重音、词尾等给出详细建议,并进行示范,同时他的教学风格非常“鼓励式教育”,对发音大方表扬,情感价值直接最大化。

他们被要求用害羞和愤怒的语气讲述关于啤酒的笑话。他们认为害羞就是用气声说话,而当表达愤怒时,他们会提高分贝。

当被要求用悲伤的语气朗诵诗歌时,听起来就像快要破裂了一样……

他说,到目前为止的测试中,它的表现与所展示的差不多,但拒绝率似乎有点高,他猜测这可能是出于安全原因。

例如,当被要求唱一个关于机器人和爱情的故事时,它说它可以讲述这个故事,但只能用正常的说话语调。

在讲述过程中2023澳门今晚开奖特马,GPT-4o 高级语音模式上线,ChatGPT 语音对话更自然,安全防护也升级了,他多次被打断,并被要求“增加更多的情感”。他做到了,语调变得更慢,更生动。

一些网友已经开始使用它。

Squad 联合创始人兼 CTO Ethan Sutin 让我模仿各种猫叫声。我不得不说,这些猫叫声有点“神奇”,但它们似乎相当真实,因为我的猫被它们吸引了……

它似乎有演奏音乐的能力。Sutin 让它演奏了 C 小调和弦。有懂音乐理论的读者可以听一下它,看看是否正确?

网友让他扮演足球解说员,分享了试用高级语音模式的初步感受:速度很快,总能产生有趣的效果,说其他语言时总是带有美国口音。

网友 Kesku 要求人们说一种不存在的语言,然后解释它是如何运作的。他创造了一种基于声音的语言,听起来有点像吟诵。

虽然现在只有少数用户使用高级语音模式,但随着其推送范围的扩大品鉴最准一肖一码100%准,或许我们会看到更多有趣的玩法和体验。

结论:提高人工智能安全的知名度

语音和视频中的人工智能因其可能成为欺诈工具而受到质疑。尽管语音模型目前不允许生成新的声音或语音克隆,但该模型仍然可能造成混淆。

在春季更新后的几个月里,发布了一系列有关安全性和 AI 模型对齐的新论文。在此之前,其超级对齐团队已经解散,一些前任和现任员工批评其将重点转移到发布新产品而不是安全性上。目前,高级语音模式推出速度的放缓似乎是向用户、监管机构和立法者表明其对安全性非常重视的一种方式。

先进语音模型的发布也让AI与Meta的Llama 3.1模型、3.0等竞争对手进一步区分,给专注于情感语音的AI初创公司带来压力。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,47人围观)参与讨论

还没有评论,来说两句吧...