近日OpenAI宣布推出新版ChatGPT,增加了两项新功能:语音输入和图像输入。据OpenAI称,新功能将在未来两周内向ChatGPT Plus订阅用户推出,其他人也将“很快”能够使用这些功能。
语音输入功能类似于手机上的语音助手,用户只需按下一个按钮,说出自己的问题,ChatGPT就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。
OpenAI还开发了一种新的文本转语音模型,可以根据几秒钟的样本语音,生成与之相似的人声。用户可以从五种选项中选择ChatGPT的声音,而且这种模型还有更多的潜在用途。不过,这种模型也存在一些风险,比如可能被恶意利用来冒充公众人物或进行诈骗。
图像输入功能则类似于Google Lens,用户可以拍摄自己感兴趣的事物,并上传到ChatGPT中。ChatGPT会尝试识别用户想要询问的内容,并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题,或者配合语音或文本输入来进行交流。当然,图像搜索也有一些潜在问题。例如,在处理人物图片时,OpenAI表示他们限制了ChatGPT对人物进行分析和直接评价的能力,既为了保证准确性,也为了保护隐私。
自从2022年初ChatGPT推出以来,OpenAI一直在努力为其增加更多功能和能力,同时避免造成新的问题出现。通过这次更新,该公司试图在这条界线上寻找平衡点,通过有意识地限制其新模型能做什么来实现这一目标。但是这种方法并不是长久之计,随着越来越多的人使用语音控制和图像搜索,以及ChatGPT逐渐成为一个真正的多模态、有用的虚拟助手,要保持安全和合理的边界会变得越来越困难。
#免责声明#
①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!