最近在做一款录音App,有一个模块是录音转文字功能,于是对比了市面上常见的API,国内做的比较大的主要有讯飞、腾讯、阿里、百度、华为。

讯飞

讯飞在国内做语音SDK是做的比较早的,翻译出来的准确率挺不错的,支持的方言也多,比较成熟。只是价格上比较贵,感觉是最贵的API了,适合对转写要求比较高的用户。

SDK有个缺点就是不能直接给OSS地址,调用他家的SDK必须要上传音频文件。

一共有6种套餐,我给大家介绍其中两种:

套餐三:

1000小时3900元,相当于一小时3.9元,赠送3个方言/语种,使用有效期一年。

套餐六:

10万小时12万元,相当于一小时1.2元,赠送8个方言/语种,使用有效期一年。

他们官网介绍地址:

https://www.xfyun.cn/services/lfasr

腾讯

腾讯依托微信的用户群体,语音转文字也是做的挺不错的,翻译的也很准确,标点符号都能翻译出来,客服服务也好,你问了问题立马打电话给你,SDK调试也方便,有在线调试网页。

支持5小时以内的录音文件进行识别,文件大小不超过512MB,异步返回识别全部结果。识别结果在服务端可保存7天。方言也支持几十种。

他们家分付费跟预付费两种。

预付费,就是购买资源包,有效期是1年

最贵套餐,30万小时,21万人名币,一个小时0.7元

后付费,就是先使用再付费

一个月使用量是30万小时以上,一个小时是0.95元

感觉购买资源包比较划算,搞活动的时候,资源包能便宜到0.6元一个小时。

他们官网介绍地址以及计费说明:

https://cloud.tencent.com/document/product/1093/35686

华为

华为的我没有使用过SDK,官网也没有介绍支持的方言,文件大小限制,转写时间什么的。

华为就是按照小时计费的,最贵的套餐:

20万小时,20万人名币,1块钱1小时,有效期是一年。

他们官网介绍地址以及计费说明:

https://support.huaweicloud.com/productdesc-sis/sis_01_0020.html

阿里云

做的挺专业的,支持的语种也很多,中国国内语言32种(普通话+方言),国外语言32种。他们家分付费跟预付费两种。

预付费,就是购买资源包,有效期是1年

最贵套餐,25万小时,20万人名币,一个小时0.8元

后付费,就是先使用再付费

一个月使用量5000小时以上,一个小时是1.2元

他们官网介绍地址以及计费说明:

https://help.aliyun.com/document_detail/207373.html

百度

百度音频文件转写目前支持的语言有中文普通话和英语。

预付费,就是购买资源包,有效期是1年

最贵套餐,50万小时,30万人名币,一个小时0.6元

后付费,就是先使用再付费

没有使用量的说法,就是一个小时2块钱

他们官网介绍地址以及计费说明:

https://ai.baidu.com/tech/speech

最后总结

从识别准确率、套餐价格、支持语种来说,个人觉得最适合的SDk是阿里跟腾讯,我自己的App也是接的腾讯云,有时间打算把阿里云也接入进来。这样可以两家SDK切换使用。

我自己开发的App名字叫:「楚少录音」,已上架各大应用商店,欢迎大家去体验下载,目前有录音、视频转文字、文字转语音(智能配音)、音频裁剪、音频合并、格式转换、音频裁剪、音频降噪等功能。

官网:

https://luyin.art

录音转文字SDK哪家强?的更多相关文章

  1. PAT 1032. 挖掘机技术哪家强(20)

    为了用事实说明挖掘机技术到底哪家强,PAT组织了一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入格式: 输入在第1行给出不超过105的正整数N,即参赛人数.随后N行,每行给出一位 ...

  2. PAT乙级 1032. 挖掘机技术哪家强(20)

    1032. 挖掘机技术哪家强(20) 时间限制 200 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 CHEN, Yue 为了用事实说明挖掘机技术到底 ...

  3. PAT (Basic Level) Practise:1032. 挖掘机技术哪家强

    [题目链接] 为了用事实说明挖掘机技术到底哪家强,PAT组织了一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入格式: 输入在第1行给出不超过105的正整数N,即参赛人数.随后N行 ...

  4. .NET ORM 哪家强

    ORM到底哪家强? 很多人都想知道这个问题,自已也没测试过,只能道听途说. 闲的无聊就将几个ORM拿出来比一比,假如怀疑测试代码有问题可以将它下载下来慢慢研究. 参赛ORM 1.SqlSugar:是一 ...

  5. 挖掘机技术哪家强(c++实现)

    描述:为了用事实说明挖掘机技术到底哪家强,组织一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入:输入在第1行给出不超过105的正整数N,即参赛人数.随后N行,每行给出一位参赛者的 ...

  6. PAT-乙级-1032. 挖掘机技术哪家强(20)

    1032. 挖掘机技术哪家强(20) 时间限制 200 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 CHEN, Yue 为了用事实说明挖掘机技术到底 ...

  7. exe打包发行哪家强

    exe打包发行哪家强,我推荐Advanced Installer11.0: 该有的都有了,这是网盘地址:http://pan.baidu.com/s/1geRDPIz

  8. 跨站数据请求哪家强——青出于蓝的jsonp

    /* * 跨站数据请求哪家强--青出于蓝的jsonp数据格式 * @author gj * @date 2017-09-15 */ 先哲有云"青,取之于蓝,而青于蓝:冰,水为之,而寒于水&q ...

  9. 【安全狗SRC】抗D设备哪家强?你来!大佬告诉你答案

    上周,安全狗SRC联合SRC部落,携手推出了爆款话题:传统抗D设备 vs 新兴CDN抗D:抗D效果哪个好? 一经发布简直好评如潮,热评无数,四方雷动(?)原帖在此,错过的吃瓜表哥们可以再围观一下~ht ...

  10. PAT 1032 挖掘机技术哪家强

    https://pintia.cn/problem-sets/994805260223102976/problems/994805289432236032 为了用事实说明挖掘机技术到底哪家强,PAT组 ...

随机推荐

  1. 流式查询1. mybatis的游标Cursor,分页大数据查询

    流式查询流式查询 指的是查询成功后不是返回一个集合而是返回一个迭代器,应用可以通过迭代器每次取一条查询结果.流式查询的好处是能够降低内存使用.例如我们想要从数据库取 1000 万条记录而又没有足够的内 ...

  2. Docker运维之容器的日志清理

    在容器运行的过程中,通常会产生大量的日志,尤其是应用程序本身记录了info级别的日志时候,程序的标准输出记录到容器的日志.这样会占用大量的磁盘空间,严重者导致IO异常,最终服务会宕机. 方案一:定期手 ...

  3. Mysql-explain之Using temporary和Using filesort解决方案

    第一条语句 explainselect * from tb_wm_shop where is_delete != 1 and is_authentication = 1 ORDER BY create ...

  4. oeasy 教您玩转 linux 之 010301 电子宠物 pet

    我们来回顾一下 上一部分我们都讲了什么? 中️文诗词fortune=zh的使用 建立自己的彩色诗词库 通过pip把输出结果交给cowsay或boxes 我们这次讲一讲桌面的一些应用 oneko 我们可 ...

  5. 第二章 编译FFmpeg并开启H.264编码

    目录 前言 1. 下载x264 2. 编译x264 3. 编译FFmpeg 3.1 可能出现的问题和解决方法 3.1.1 ERROR: x264 not found using pkg-config ...

  6. 如何安装 Arch Linux 操作系统?

    Arch Linux Install 安装 到使用 Arch 说明前面或多或少已经接触过 Debian 系列和 Red Hat 系列相关 Linux 发行版,对于虚拟化软件 VirtualBox 如何 ...

  7. 跟着ChatGPT学习设计模式 - 工厂模式

    1. 前言 在工作过程中,越发觉得设计模式的重要性.经常会有人说工作5年的人,大学生随便培训1-2月也能做同样的工作,没错,大学生的确可以做. 但其写的代码,可维护性.可扩展性.添加新功能时方便还是简 ...

  8. Python用shp文件裁剪多个遥感影像的方法

      本文介绍基于Python中ArcPy模块,基于矢量数据范围,对大量栅格遥感影像加以批量裁剪掩膜的方法.   首先,话不多说,本文所需要的代码如下所示. # -*- coding: utf-8 -* ...

  9. OpenStack 基本命令

    keystone source /etc/keystone/admin-openrc.sh #登录 openstack user create --password ps1234 --email hq ...

  10. 【JavaWeb】如何越过SpringMVC直接返回内容

    来自前同事问的一个问题,因为项目里面的SpringMVC会封装好一个固定的JSON响应规范: 可以看见,data属性下面,又会有一层data, 数据的消费方提出要求,只需要里面data的数据,外面的J ...