分类
ASRT 智能语音技术

[论文翻译]SpecAugment:一种用于自动语音识别的简单数据扩增方法

SpecAugment: A Simple Data Augmentation Method for Automatic Speech Recognition

原文:https://arxiv.org/abs/1904.08779

Daniel S. Park∗, William Chan, Yu Zhang, Chung-Cheng Chiu, Barret Zoph, Ekin D. Cubuk, Quoc V. Le

Google Brain

{danielspark, williamchan, ngyuzh, chungchengc, barretzoph, cubuk, qvl}@google.com

分类
云计算 后端开发

转载:服务端高并发分布式架构演进之路

本文转载自segmentfault.com

https://segmentfault.com/a/1190000018626163

1. 概述

本文以淘宝作为例子,介绍从一百个到千万级并发情况下服务端的架构的演进过程,同时列举出每个演进阶段会遇到的相关技术,让大家对架构的演进有一个整体的认知,文章最后汇总了一些架构设计的原则。

特别说明:本文以淘宝为例仅仅是为了便于说明演进过程可能遇到的问题,并非是淘宝真正的技术演进路径

分类
学界业界动态 评论型文章

转载:西电校长杨宗凯走进《中国经济大讲堂》解读信息技术如何翻转课堂

本文转载自微信公众号:西安电子科技大学

11月30日晚22时,西安电子科技大学校长杨宗凯受邀走进CCTV2央视财经频道《中国经济大讲堂》“奋斗在科技前沿”栏目,以“信息技术如何‘翻转’课堂”为题,为观众深度解读如何利用信息技术,促进教育融合创新发展。

央视视频回放地址:
http://tv.cctv.com/2019/12/02/VIDExp5vgY9AhtdtrK75cSln191202.shtml

分类
学界业界动态

智能医疗再突破:脊柱侧弯智能筛查新系统可达专家水平

脊柱侧弯是青少年中最常见的脊柱疾病,全世界的患病率为0.5–5.2%。由于传统的筛查方法对于阳性的预测成功率较低,并需要一些不必要的转诊和放射成像。上海交通大学附属新华医院的杨军林教授发现裸露背部外观照能够在一定程度上反应脊柱侧弯程度,因此联合中山大学中山眼科中心的林浩添教授、西安电子科技大学的刘西洋教授着手于脊柱侧弯深度学习筛查技术的研发,项目于2018年获得国家重点研发计划项目(项目编号:2018YFC0116500)。其全球首创脊柱侧弯大规模人工智能筛查系统,准确率可达专家水平,这一成果于2019年10月25日在《自然》子刊《通讯·生物学》(Communications Biology)发表。

分类
学界业界动态 智能语音技术 机器学习及应用

使用N-DenseNet实现城市声音事件分类模型

现代社会中,智慧城市的构建是一个当前的趋势,其中包括利用传感器网络收集目标城市的城市声音时间的信息采集和分类研究用相关音频数据并进行分析,这对于是提高智能感知水平的重要一步。来自江南大学的一研究团队,通过采用N-DenseNet网络模型,实现了对城市声音事件的分类,其一阶和二阶模型的分类准确率达到了83.63%和81.03%,并且具有良好的泛化能力。

分类
学界业界动态 智能语音技术 机器学习及应用

MCNN-CTC:将语音识别错误率再降12%

近些年来,随着深度学习的发展,语音识别的准确率已经达到较高水平。卷积神经网络的应用,对于语音识别系统准确率的提升起了至关重要的作用。虽然普通的深度卷积神经网络,随着深度的增加,准确率应该会有所提升,但是其在宽度上的限制,使得其可能无法捕捉到人类语音信号中足够的信息。近日,江南大学一团队提出了深度多路卷积神经网络MCNN-CTC模型,在没有语言模型的情况下,可将端到端声学模型的错误率相比DCNN-CTC模型下降1.10%-12.08%,并有着更好的性能。相关论文发表在Intelligent Robotics and Applications 2019。

分类
机器学习及应用

ASVRG:一个更好的加速近端SVRG

ASVRG是由西安电子科技大学一科研团队于近期新提出来的一个加速的近端随机变量减小的梯度方法,通过设计一个简单高效的动量加速技巧,只添加一个额外的变量和一个动量参数,使得其拥有了一个更简单且所需的训练迭代数更少的加速效果。并且,ASVRG被证明可以实现强凸和非强凸目标的最著名的oracle复杂性,此外,还可以扩展到小批量和非平滑设置。作者在论文中,还凭经验验证了理论结果,并表明ASVRG的性能与最先进的随机方法相当,有时甚至更好。