王之捷:AI智能云端架构大幅提升智能语音识别能力
时间:2022-04-21
本文章向大家介绍王之捷:AI智能云端架构大幅提升智能语音识别能力,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
腾讯云AI业务架构师王之捷分享了腾讯云在人工智能、尤其在智能云方面的最新进展,以及如何将这些能力应用到工作当中。
王之捷表示,不断增强的计算能力、日益积累的海量数据,和先进的模型算法作为三大基石支撑并促进了人工智能的发展。
在计算能力方面,腾讯云拥有强大的基础设施,这主要得益于腾云遍布国内的服务器,使得腾讯云能够在大范围使用GPU,同时输出,并且能够在全球34个国家和地区能够接触到;在海量数据方面,依托QQ、微信10亿级别的用户群应用,每天都能积累超过数千万的图片数据、数十万小时的语音数据和千亿级别的文本量数据,为机器深度学习提供了强大的数据基础;在先进的模型算法方面,AI LAB、优图实验室、微信智能语音等,并且在这些领域吸引了数十名国内外专家,使腾讯云的算法能力始终保持在业界领先水平。
尤其在智能语音领域,腾讯云2010年开始深入研究语音深度学习模型DNN和LSTM等,后来则采取了双向LSTM,再结合CNN识别,形成CLDNN模型,再到现在端到端模型,实现了语音和文本的智能双向转换。后来,针对数据量的几何级增长,借助GPU加速的矩阵运算,语音识别的准确率不断提升。在噪音场景下,识别错误率由2010年的40%降低到了18%,对日常口语识别错误率也由以前的20%~30%下降到10%~15%;而在标准朗读的情况下,识别错误率更从原来的10%降低到了3%~5%,换言之,识别准确率高达97%,处于业界领先水平。
不仅如此,腾讯云独创的创新方法还支持语言模型的并行解码,可以在一套系统上面同时加载多个语言模型,在同时识别的时候自动挑选一个识别效果最好模式,由此解决了垂直领域的定制问题。
点击下载演讲资料:
- 设计模式专题(十一)——抽象工厂模式
- Canvas 图形组合方式
- HTML5 FileReader接口学习笔记
- 如何用BBED使Offline的数据文件Online
- Entity Framework4.3 Code-First基于代码的数据迁移讲解1.建立一个最初的模型和数据库 2.启动Migration(数据迁移)3.第一个数据迁移4.订制的数据迁移4.动态
- 轻松初探Python(六)—函数
- css3实现圆角边框渐变
- 设计模式专题(十二)——状态模式
- HTML5新增属性学习笔记
- HTML5标签学习笔记
- 设计模式专题(十三) ——备忘录模式
- 设计模式专题(十五) ——组合模式
- 设计模式专题(十六)——迭代器模式
- 设计模式专题(十七) ——单例模式
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 什么是前缀树--打开了我的新思路
- 一个案例搞懂原码、反码、补码,不懂得请看过来
- 人人都在用,但你却不知道它背后发生了什么——浏览器的工作原理:浏览器幕后揭秘
- 这有一把钥匙,打开MySQL死锁问题!
- 普通人如何全面了解大数据的特点,意义和发展前景
- 面试官问我Linux下常见网络命令
- 最全常用User-Agent
- 聊到JVM(还怕面试官问JVM吗?)
- Android.location.Address类方法获取GPS定位信息
- Python二叉树详解笔记
- 《剑指offer》第七天:二叉树的下一个结点
- 后台登录微信并定时发送消息,消息包括农历、阴历、天气;自动监测是否断线,支持邮箱发送二维码登录;适合于挂在服务器上运行
- 《剑指offer》第八天:二叉树的下一个结点
- 基于python和OpenCV构建智能停车系统
- nvm管理工具