分类
机器学习及应用 评论型文章

做机器学习为什么要学数学

在知乎上看到有人问,在做机器学习方面,质疑数学的意义,觉得会用各种经典模型不就行了。我们做机器学习,要做到知其然,还要知其所以然。我们不能仅仅是会调一调库,跑个程序炼个丹什么的,还要知道底层的数学原理和算法。

分类
Python学习

Python实现多进程运行

在这篇文章里,我将列出一种python下的实现多进程并发执行程序的方法。我们经常需要通过并发来实现一些功能,为了加速计算或者最大程度利用CPU等等。Python中有一种方法可以实现多进程并发执行,我们需要导入python库“multiprocessing”。

分类
Python学习

Python关键字yield用法

我这篇文章将简单记录一下python关键字yield的用法。因为写代码需要,我看到了别人的部分代码中有用到yield关键字。作为习惯了C类语言的人,第一次看到这种关键字会感到很迷茫,不知道是用来做什么的,可是偏偏很多时候会用到这样的代码。

分类
ASRT Python学习 智能语音技术 程序设计

Python读取wav格式文件

我们经常需要处理wav格式的文件,读取其中的声音信号和相关参数,来做一些事情。如果我们使用C++来做,那么需要对文件的底层存储格式有一个透彻的了解才行,而且考虑不周还有可能出Bug;如果使用MatLab来做,虽然只有一行代码就可以读取文件,但是MatLab语言自身的局限性使得写出的代码难以在实际中投入使用。因此,兼顾简介易用和实用性,用Python来做就显得比较好了。

分类
Python学习

Python缩进问题

众所周知,python是一个基于缩进而不是大括号的语言,因而写python代码有需要使用游标卡尺的梗。我在写python代码的时候,没少掉进这个坑里面。基本上只要前一行结尾出现冒号,下一行必然添加一个单位的缩进,直到块结束。我们可以使用空格(Space)和制表符(Tab)来进行缩进,然而这里面有一些会经常遇到的坑。

分类
Python学习

初学Python

Python的确是一个易于学习且功能强大的编程语言,而且是跨平台做的最好的编程语言。虽然它是解释型的语言,但是其开发效率之高,有目共睹,弥补了运行速度稍慢的缺陷。Python有胶水语言之称,解释器很容易拓展,用起来像瑞士军刀。当前的很多机器学习方面的项目都是基于Python语言实现的,所以感觉这个语言未来会很火。本人推荐直接学Python3版本,这样在时代的潮流下才不容易掉队。: )

分类
综合技术 长期更新的内容

Linux系统下安装TensorFlow的GPU版本

本文已在2023年05月更新到最新方法,确保本文教程的有效性。

前言:
曾经(2017年)安装TensorFlow的GPU版本真的不是一件容易的事,好难(因为能用的教程很少,有些连最基本的一些必需的步骤都没写到,那样子的话能安装到位才是奇迹),但是现在不会了,因为本文出现了,本文是为数不多的可用教程

在经历各种踩坑后,我终于总结出来一个走的通的安装tensorflow-gpu的方法,并且亲自动手实践,在Linux(Ubuntu) + Python3安装且运行成功。

分类
综合技术

在多平台上安装TensorFlow的方法

TensorFlow是谷歌在近期开源的一款深度学习方面的框架,有纯CPU版本和使用了GPU的版本。我们通过使用它,可以大大方便我们在神经网络方面的工作,降低我们的工作量。众所周知,TensorFlow是基于Python的,所以我们需要使用Python来做。TensorFlow在Windows上仅支持64位Python 3.5。

鉴于Python2已经濒临淘汰,所以,我建议现在以及今后都直接使用Python3来做,除非你手头有一大堆现有的py2的代码项目,否则,Python2迟早是要切换到Python3,到时候又是一大堆代码要手动升级到3版本,3和2的代码差别太大了。

分类
机器学习及应用 长期更新的内容

机器学习入门教程分享

经常会在一些社区类网站看到有人问如何入门和学习机器学习,于是,我在这里分享一些我学习机器学习这一段时间以来收集的各类比较好的教程。

我过滤掉了一些没什么用的教程和资料,因为那些确实没有用,而且看起来太多太繁琐,人的精力有限,只要能把这些资料看完,就已经可以变得很厉害了。

分类
ASRT 机器学习及应用 程序设计

统计语言模型:从中文拼音到文本

前言:

自然语言是信息的载体,记录和传播着信息,信息论之父香农对信息的定义是“信息是用于消除随机不确定性的东西”。信息通过编码,经过一定的信道传输,然后传递到接收者,再解码成对应的可被人理解感知的东西,就完成了一次信息的传递。原始人的通信方式就是说话,而说话是先将信息编码为对应的语言信号,可以是文本,可以是声音,也可以就是中文拼音,然后接收者再将收到的信号进行解码。而我们人类对自然语言的处理经历了从基于规则的算法到基于统计的算法,显然基于统计的方法比规则更有效,下面我将介绍一种基于统计的语言模型,可以实现从拼音转为文本。