【nlp李宏毅】笔记

zhangchen • 2022-02-15 01:18 • 好物分享

一，六种模型
输入一段声音------>输出文本、声音、判断类别

输入语言判断类别：

二、speech recognition声音识别

三个主要语音辨识会议中，使用最多的token：

语音辨识+xxxx：

声音特征：

物种语音识别模型

LAS（Listen，Attend，and Spell ）

encoder 可以采用rnn，cnn

1，获取attention两种方式：
z0关键字和每一个资料库（encoder的输出）h1、h2.。。。都分别输入一个叫match的function计算出一个skeler即一个数值。

常用的match function方式：

2，spell

版权声明：
作者：zhangchen
链接：https://www.techfm.club/p/21121.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

调用金蝶的WebService接口作废单据

IO模型、Netty线程模型

下一篇>>

搜索内容