Skip to content
This repository has been archived by the owner on Sep 5, 2020. It is now read-only.

Latest commit

 

History

History
16 lines (13 loc) · 460 Bytes

20-Day9.md

File metadata and controls

16 lines (13 loc) · 460 Bytes

第九周

神经图灵机(NTM)

自动语音识别(ASR)

  • W = arg max P(W|X)
  • 利用贝叶斯公式转化为声学模型和语言学模型
  • CTC:时频谱图 - RNN -> 概率分布矩阵 - 去重,合并,得到结果
  • CLDNN:输入信号经过时间卷积,该层和其他层共同训练

声控智能设计

  1. 语音指令设计
    • 24条输出指令
  2. 语音指令录音
  3. 基于TensorFlow的深度网络训练
  4. 部署