【nlp李宏毅】笔记

一,六种模型
输入一段声音------>输出文本、声音、判断类别

 
输入语言判断类别:

 
二、speech recognition声音识别

三个主要语音辨识会议中,使用最多的token:

 语音辨识+xxxx:

 声音特征:

 
 
 物种语音识别模型

        LAS(Listen,Attend,and Spell )

 
 encoder 可以采用rnn,cnn

 
  1,获取attention两种方式:
z0关键字和每一个资料库(encoder的输出)h1、h2.。。。都分别输入一个叫match的function计算出一个skeler即一个数值。
 
常用的match  function方式:

 2,spell

【nlp李宏毅】笔记最先出现在Python成神之路

版权声明:
作者:zhangchen
链接:https://www.techfm.club/p/21121.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>