AI柠檬

一个科技爱好者的个人博客

标签： ASRT语音识别项目

ASRT语音识别程序依赖环境说明

浏览量： 1,545
ASRT语音识别项目是AI柠檬博主于2017年初开始着手实现的一个开源项目。由于本项目从最初第一个可用版发布到现在已经有较长时间了，在软件的依赖包方面，已经与两年前有了很大的不同，本文将介绍ASRT项目在程序运行的依赖环境上的一些问题，供参考，如果后续有变化，会及时更新。几乎所有基于TensorFlow 1.x版本和Keras的程序都可以参考本文的配置。

（更多…）

2019-10-17
ASRT：一个中文语音识别系统

浏览量： 91,508
ASRT是一套基于深度学习实现的语音识别系统，全称为Auto Speech Recognition Tool，由AI柠檬博主开发并在GitHub上开源(GPL 3.0协议)。本项目声学模型通过采用卷积神经网络（CNN）和连接性时序分类（CTC）方法，使用大量中文语音数据集进行训练，将声音转录为中文拼音，并通过语言模型，将拼音序列转换为中文文本。算法模型在测试集上已经获得了80%的正确率。基于该模型，在Windows平台上实现了一个基于ASRT的语音识别应用软件，取得了较好应用效果。这个应用软件包含Windows 10 UWP商店应用和Windows 版.Net平台桌面应用，也一起开源在GitHub上了。

（更多…）

2018-08-29
统计N元语言模型生成算法：简单中文词频统计

浏览量： 12,504
做自然语言处理有一个基本的步骤是词频统计，然而我们知道，中文的词语有单音节词、双音节词和多音节词之分，所以中文处理起来远比英文复杂得多。不过，我们可以“偷个懒”，如果要做词频统计的文本量足够大，而且我们只需要知道词频最高的几个词的话，那么我们可以将问题简化一下。

（更多…）

2017-02-20