作为当前最火的AI应用,ChatGPT在积累了1亿用户之后开始尝试商业运营了,昨天正式发布了API,企业可以付费接入,75万单词只要2美元,成本比之前降低了90%。
实际上昨天开放的业务还有一个,那就是语音转文字的API,基于公司的Whisper大模型,去年9月份首次推出Whisper Large-v1模型,12月开源了升级版的Whisper Large-v2模型。
这次商业化之后,Whisper API的收费也很低廉,每分钟只要0.006美元,人民币约为4分钱,预计会让很多语音相关的企业压力很大。
Whisper API支持对语音文件进行转录和翻译,并支持包括英语、中文、阿拉伯语、日语、德语、西班牙语等几十种语言。
不过不同语言的准确率差别不小,Whisper large-v2模型在识别西语、英语、意大利语、德语等语言单词错误率都能控制在5%以内,这种语言转文字之后只需要用户简单修改就好。
至于中文,v1模型的错误率就有19.6%,v2略微提升到14.7%,改进不大,错误率比英文、西语之类的高很多,用户使用起来有些麻烦,需要校正的地方就多。
至于为何有这样的差距,除了中文自身的特点之外,很可能跟训练使用的中文语料较少有关,毕竟网上的内容主要还是外文。
#免责声明#
①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!