大家好,这里是我博客的留言板,有什么想说的或者申请友链的都可以写在这里,我们一起交流一下。
谢谢大家的光临,希望能喜欢我的小站。
本人联系方式:
Email:
ailemon [AT] ailemon.net ( “[AT]”请替换为”@” )
ailemon_me [AT] outlook.com ( “[AT]”请替换为”@” )
Twitter: @ailemon_me
版权声明本博客的文章除特别说明外均为原创,本人版权所有。欢迎转载,转载请注明作者及来源链接,谢谢。本文地址: https://blog.ailemon.net/guestbook/ All articles are under Attribution-NonCommercial-ShareAlike 4.0 |
“留言板”上的31条回复
我想要一个特定场景的语音识别AI模型,比如超市收银员中文收银场景中。该AI模型能听写出收款多少多少钱,能听懂超市卖的货物。范围就是收银员收银日常说的那些话。请教几个问题:
1.这个框架训练出来的这样的模型,是否能跨平台使用,即在不同指令集架构的cpu上。
2.限于特定场景后,模型是否可以小到1M以内。
训练这样一个模型估计要用多长时间, 1080ti,12G的显卡
训练的总时长取决于模型大小、训练用的数据量、GPU和CPU算力强弱、硬盘IO读写性能、数据文件的编码格式等多种因素影响,没有固定值。可以先尝试运行训练一段时间后,估算一下在你所使用的设备和数据条件下的总时间,取个平均值。
如果是基于“API服务器-录音终端”的C/S架构部署的话,服务器端与客户端是解耦的,每一部分均可以使用其支持的CPU架构平台和系统来运行,这也是我以前博客文章里面写的经常推荐的模式。
模型的大小与设计这个模型时的神经网络结构参数量有关,语料空间限定了后,模型总大小相比于通用大模型可以得到压缩,但在相同精度的情况下,能压缩到多少是需要做实验来验证的。建议自行修改代码以及处理数据,然后运行训练尝试。
我想应用在嵌入式设备上离线使用。比如esp32 sr框架中的 提供的几个音频AI模型,有识别唤醒词的,识别命令词的。他们都是离线的。唤醒词模型大小在300k左右,支持5个唤醒词。命令词,可以自己用拼音定义,模型大小大概3M。
可以尝试训练跑一下做个估算,另外,模型一般还需要反复调优并训练,以及finetune,单次训练总时长也意义不大,模型训练完但是如果效果欠佳,也是没有用的
现在听写功能都是将中文speech转成 中文,是否可以提取到其中包含的数字信息。即将其中的数字信息转成阿拉伯数字,而不是显示成’零,点,令,一’
那可以再做一些自然语言处理后处理,现在是完全忠于纯中文字音的识别,如果需要一些灵活变通就得定制化修改
哇, 很羡慕你有超多的粉丝, 博客质量也很高. 希望可以遇到更多像你一样志同道合的朋友, 小弟不才, 也开发了个人博客www.fangzengye.com 已经把你博客放在首页了, 如果您愿意的话, 我们互换友链呗, 一起遇见更多志同道合的朋友. 期待您的回复.
好的,非常高兴你对我博客的赞赏,我也将友链加入了,不过希望您能把我博客的链接替换为新的 https://blog.ailemon.net/ ,而不是.me后缀的,我已经将域名切换了过来。
名称:冇想法买手店
简介:主要是机器学习和自然语言处理的文章
网址:https://www.ivenwang.com
我已在我的网站添加了贵站链接(https://ivenwang.com/2020/06/04/blogs/),请问是否可以添加友链?
您好,友链已经添加了,请查看:
https://blog.ailemon.net/links/
祝贵站越办越好!
目前github上面的ASRT项目支持实时的语音识别的么?
是支持的,不过需要使用windows客户端SDK,可以在文档这里找到: https://asrt.ailemon.net/docs/client-demo ,以及在这里下载: https://asrt.ailemon.net/download
名称:宇宙湾
简介:主要是大数据和人工智能的原创文章。
网址:https://yuzhouwan.com/
头像:https://picture.yuzhouwan.com/yuzhouwan_logo_128x128.ico
大佬,友链否
可以呀?欢迎~ 友链已经添加,请查看
https://blog.ailemon.net/links/
我也添加好了,以后多多关照哈哈~
好的,哈哈哈~
博主,你在学习深度学习课程的时候,是先学数学知识,还是先学深度学习基础,然后中间不断重温数学呢,
我先学的微积分、矩阵和概率统计这些基础知识后,才学的机器学习,然后再动手实践,实践中遇到问题再回去学习基础知识。
理解了,多谢了,博主!!
本世纪会不会是ai的天下
可能吧
膜观大佬
+65535s
友链一波呗
名称:图灵技术域
网址:http://www.omegaxyz.com/
恩可以的,友链已经添加到友链等候区,请查看,请您也及时添加~
http://www.omegaxyz.com/friends/
已友链,请查看
界面有点丑之后会美化一下
博主,你好,你的qq是多少,可以加个好友吗?
可以,我加你吧
你好,博主,我是一位想从事ai领域的计算机行业的在职人员,但是现在很迷茫不知道从何入手,希望博主指点迷津,qq:443100927 可以加个好友吗?tks
你好你好。
是这样的,想入门的话,我首先推荐吴恩达(Andrew Ng)教授在Coursera上的Machine Learning的视频课程,这课程内容非常基础且易懂,而且课后的练习作业也能够很容易让自己掌握实践技能;还有一门课是Deep Learning深度学习课程,在Coursera和网易云课堂上都有,我已经看过一部分了,同样的棒。而且这方面重点是实践经验,多练练。
至于学习教程推荐,我这篇博文里有:
https://blog.ailemon.net/2017/05/02/share-some-tutorials-to-machine-learning/
至于编程语言,Ng的那个机器学习课程使用的是matlab,而深度学习课程是python,不过这不重要,机器学习的原理才是最重要的。
matlab有很多机器学习的工具箱,比如神经网络工具箱,而python,可用的包就更多了,比如tensorflow,keras,sklearn什么的,我相当推荐keras,用起来十分的简洁易上手,官网有文档,照着做就好。
最后,一定要多实践。