AI柠檬

一个科技爱好者的个人博客

  • 主页
  • 博客首页
  • AI大模型
  • 机器学习及应用
  • 智能语音技术
  • ASRT
  • 软件开发
  • NAS专区
  • 评论型文章
  • 综合技术
  • 云计算
  • 学界业界动态
  • ASRT语音识别项目
  • 微信公众号
  • 友情链接
  • 留言板
  • ASRT上线测试Demo啦

    2020-09-17
    浏览量: 500

    ASRT项目最近新上线了Web网页端的测试Demo,以供各位测试ASRT最终的使用效果。测试地址为:https://asrt.ailemon.net/demo ,欢迎大家进行测试使用。开源的JavaWeb项目地址为:https://github.com/nl8590687/ASRT_SpeechClient_JavaWeb 。由于后端服务器的规模和性能限制,以及网络的延迟,可能存在着等待时间偏长的问题,请耐心等待,不要不停地点击识别按钮,会加重服务器负担。如果显示没有变化,可能是本身没录上音或者录音声音为空白噪声。

    (更多…)
  • [论文分享]迁移学习实现基于预算的语音识别

    2020-09-14
    浏览量: 750

    Kunze, Julius, et al. “Transfer learning for speech recognition on a budget.” arXiv preprint arXiv:1706.00290 (2017).

    大家好,本次我要分享的论文是Transfer Learning for Speech Recognition on a Budget

    (更多…)
  • 计算机的内功真的很重要吗?

    2020-09-10
    浏览量: 350

    本文原为本人在知乎上的一个同名问题下的回答内容

    https://www.zhihu.com/question/392971737/answer/1417910483

    计算机的内功就是计算机科学一路发展来的这一套成熟的理论体系和技术框架,简单从计算机专业基础课来说,就包括了:程序设计基础、数据结构、算法、计算机组成原理、计算机体系结构、计算机网络、操作系统原理、编译原理、微机原理、数据库、软件工程和软件体系结构。而数学(包括高等数学、线性代数和概率论与数理统计)则是做计算机科学理论研究的基础。

    (更多…)
  • [论文分享]FastSpeech: 快速鲁棒可控的语音合成

    2020-09-07
    浏览量: 2,181

    Ren, Yi, et al. “Fastspeech: Fast, robust and controllable text to speech.” Advances in Neural Information Processing Systems. 2019.

    本次分享的论文是FastSpeech语音合成框架,这篇论文由微软研究院和浙大联合发表在NIPS2019上。

    (更多…)
  • C#在UWP中实现录音功能

    2020-09-03
    浏览量: 557

    我们在开发Windows客户端程序时,有时需要实现录音的功能,比如使用语音识别时。本文中的代码通过DLL导入调用系统API实现了录制16kHz、16bit位宽的单声道wav格式录音。该代码已用于ASRT语音识别客户端SDK(C# UWP版):

    https://github.com/nl8590687/ASRT_SpeechClient_UWP

    (更多…)
  • C#基于winmm实现录音功能

    2020-08-31
    浏览量: 958

    我们在开发Windows客户端程序时,有时需要实现录音的功能,比如使用语音识别时。本文中的代码通过DLL导入调用系统API实现了录制16kHz、16bit位宽的单声道wav格式录音。该代码已用于ASRT语音识别客户端SDK(C# WPF桌面版):https://github.com/nl8590687/ASRT_SpeechClient_WPF 。

    (更多…)
  • 教你如何使用ASRT部署中文语音识别API服务器

    2020-08-27
    浏览量: 18,582

    ASRT是一个中文语音识别系统,由AI柠檬博主开源在GitHub( https://github.com/nl8590687/ASRT_SpeechRecognition )上,为了便于大家使用,本文将手把手按顺序教你如何使用ASRT语音识别系统在测试和生产环境中部署中文语音识别API服务器。文本以CPU (Intel x86_64) + Linux + Python 3 + Nginx 为示例运行环境。

    (更多…)
  • [论文分享]用GAN从MFCC合成语音波形

    2020-08-24
    浏览量: 1,090

    Juvela, Lauri, et al. “Speech waveform synthesis from MFCC sequences with generative adversarial networks.” 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2018.

    本次论文分享的是一篇2018年发表在IEEE上的用GAN从MFCC合成语音波形的论文。

    (更多…)
  • 教你如何使用ASRT训练中文语音识别模型

    2020-08-20
    浏览量: 28,751

    ASRT是一个中文语音识别系统,由AI柠檬博主开源在GitHub( https://github.com/nl8590687/ASRT_SpeechRecognition )上,为了便于大家使用,本文将手把手按顺序教你如何使用ASRT语音识别系统训练一个中文语音识别模型。如果遇到任何问题,为了节省您的时间,请及时加QQ群或者微信群进行讨论,包括反馈bug或者版本兼容性等。

    首先到GitHub上打开ASRT语音识别项目仓库:https://github.com/nl8590687/ASRT_SpeechRecognition

    国内Gitee镜像地址:https://gitee.com/ailemon/ASRT_SpeechRecognition

    打开的网页如图所示

    (更多…)
  • [论文分享]Char2wav端到端语音合成

    2020-08-17
    浏览量: 684

    Sotelo, Jose, et al. “Char2wav: End-to-end speech synthesis.” (2017).

    Char2Wav是一个2017年发表在ICLR上的语音合成模型。

    (更多…)
←上一页
1 … 4 5 6 7 8 … 18
下一页→
AI柠檬

AI柠檬

一个科技爱好者的个人博客


如果您有技术需求,请通过这些
联系方式与AI柠檬交流

Email: ailemon <at> ailemon.net

<at> 请替换为@

AI柠檬
微信公众号

添加AI柠檬微信

微信号:
ailemon-me
请备注“来自AI柠檬博客”

    • X
    • GitHub
    • RSS Feed
  • AI柠檬主页
  • ASRT开源项目
  • Gitee主页
  • 元语音网个人主页

Copyright  © 2025 AI柠檬


陕ICP备19023187号-1

二〇二五

以 WordPress 设计