作為當(dāng)前最火的AI應(yīng)用,,ChatGPT在積累了1億用戶之后開(kāi)始嘗試商業(yè)運(yùn)營(yíng)了,昨天正式發(fā)布了API,,企業(yè)可以付費(fèi)接入,75萬(wàn)單詞只要2美元,,成本比之前降低了90%,。
實(shí)際上昨天開(kāi)放的業(yè)務(wù)還有一個(gè),那就是語(yǔ)音轉(zhuǎn)文字的API,,基于公司的Whisper大模型,,去年9月份首次推出Whisper Large-v1模型,12月開(kāi)源了升級(jí)版的Whisper Large-v2模型,。
這次商業(yè)化之后,,Whisper API的收費(fèi)也很低廉,每分鐘只要0.006美元,,人民幣約為4分錢,,預(yù)計(jì)會(huì)讓很多語(yǔ)音相關(guān)的企業(yè)壓力很大,。
Whisper API支持對(duì)語(yǔ)音文件進(jìn)行轉(zhuǎn)錄和翻譯,并支持包括英語(yǔ),、中文,、阿拉伯語(yǔ)、日語(yǔ),、德語(yǔ),、西班牙語(yǔ)等幾十種語(yǔ)言。
不過(guò)不同語(yǔ)言的準(zhǔn)確率差別不小,,Whisper large-v2模型在識(shí)別西語(yǔ),、英語(yǔ)、意大利語(yǔ),、德語(yǔ)等語(yǔ)言單詞錯(cuò)誤率都能控制在5%以內(nèi),,這種語(yǔ)言轉(zhuǎn)文字之后只需要用戶簡(jiǎn)單修改就好。
至于中文,,v1模型的錯(cuò)誤率就有19.6%,,v2略微提升到14.7%,改進(jìn)不大,,錯(cuò)誤率比英文,、西語(yǔ)之類的高很多,用戶使用起來(lái)有些麻煩,,需要校正的地方就多,。
至于為何有這樣的差距,除了中文自身的特點(diǎn)之外,,很可能跟訓(xùn)練使用的中文語(yǔ)料較少有關(guān),,畢竟網(wǎng)上的內(nèi)容主要還是外文。