嘿!您似乎在 United States,您想使用我们的 English 网站吗?
Switch to English site
Skip to main content

如何使用 Neural Network Console 构建自己的数据集?(第2部分)

在日常生活中, 深度学习变得更加重要。我解锁我们的手机和街道上的智能 Led 都展示了在图像识别方面实现 AI 的例子。互联网上有很多关于 AI 的开源, 包括手写的数字识别, 以及我们如何构建自己的数据集?在本文中, 我将和您分享一个应用程序 Neural Network Console。

本文将分为4个部分,第一部分是数据集的编写,第二部分是构建网络模型,第三部分是创建数据集,最后是如何评估模型。

让我们先观看视频并设置网络概念。

https://v.qq.com/x/page/f08873ryilr.html

手势的神经网络模型

mo_a60c5a66fa637f6553ae9429a5c204abc2ef6e17.jpg

以下是每个块的基本概念。

图片包括3种颜色,红色,蓝色和绿色。 它们都被分成具有不同梯度的层,编号为0到255。

RBG_LAYER_ff74ab5987d3eea3dd421842fefb14028c43fcba.png

本文我们将选择红色层作为演示。

red_169910eadad9e331ca3d265eb9bc52b13a1a34ae.jpg

Input,神经网络输入层,指定输入大小。

MulScalar是一个将值乘以输入的函数。

ImageAugmentation随机改变输入图像。

Convolution Ox,y,m = Σ_i,j,n Wi,j,n,m Ix+i,y+j,n + bm (二维卷积) (其中O是输出; 我是投入; i,j是内核大小; x,y,n是输入索引; m是输出映射(OutMaps属性),W是内核权重,b是每个 kernel的偏差项)每个KernelShape都是我们想要卷积的窗口大小。 例如,5 * 5 png可以设置为2 * 2的kernalshape。

https://v.qq.com/x/page/q0887bb2ykm.html

Relu是一种激活函数,可以找出线性区域。

488px-Ramp_function.svg__8907fe53b9d3c36a78793b292fc6732709da0fbd.png

MaxPooling输出本地输入的最大值。

此maxPooling使用2x2下采样方法,该方法可减小图像的大小并获得表示信号的最大参数。 下图显示了4x4红色下层样品到2x2。

maxpool_1ab3d6a573308b52e145578583dd5c7792341164.jpg

Tanh是一个激活函数,可以找出线性区域。

tnah_61aef8fe1f9cd35999c3d681722904b87e6d1369.png

 

AFFINE

微调更好的图像比例以进行识别。

例如,当前数据是图片的四分之一,在应用仿射之后,图片将对矩阵中的每个数据乘以4,并且给出与原始数据集类似的比率以用于重新定位。

 

AFFIne_3ccc3b79af9f71cc22a80f84bfad02c3d3938900.jpg

Softmax显示潜在结果列表的概率分布。

Softmax输出Softmax的输入。 当您想要获取分类问题中的概率或输出值从0.0到1.0(总计为1.0)时,可以使用此选项。

通过模型传递后的数据将给出一个权重,在将权重乘以点积后,我们用算法 ox=exp(ix) / Σ_jexp(ij) 发送结果然后我们将获得与数据成正比的概率 重量。

 

smax_e07306017538a501ac6be13362e67efd03ef356c.jpg

https://v.qq.com/x/page/i0887e4o3ps.html

下一部分将是创建数据集。

 

未来发展

Neural network console 可以识别脸部吗? 可以! 使用这个应用程序作为起步是有趣的。

输入不同的数据集并生成各种结果。

第1部分

第2部分

第3部分

第4部分

Brian0925 还没写个人简介...