【nlp李宏毅】笔记
一,六种模型
输入一段声音------>输出文本、声音、判断类别
输入语言判断类别:
二、speech recognition声音识别
三个主要语音辨识会议中,使用最多的token:
语音辨识+xxxx:
声音特征:
物种语音识别模型
LAS(Listen,Attend,and Spell )
encoder 可以采用rnn,cnn
1,获取attention两种方式:
z0关键字和每一个资料库(encoder的输出)h1、h2.。。。都分别输入一个叫match的function计算出一个skeler即一个数值。
常用的match function方式:
2,spell
【nlp李宏毅】笔记最先出现在Python成神之路。
版权声明:
作者:zhangchen
链接:https://www.techfm.club/p/21121.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。
THE END
二维码
共有 0 条评论