用 mxnet 操作數值, ndarray 最基礎的資料結構

2019 iT 邦幫忙鐵人賽

DAY 10

自我挑戰組

深度學習所需入門知識--一位初學者的認知系列第 10 篇

2019鐵人賽

JavaCoffee

2018-10-24 21:24:08

3052 瀏覽

分享至

由 Gavin 拍板接受 Fields 使用 MxNet 來當作他進入深度學習與相關數學的入門。直接從 Mxnet 官方的教學網站 The Straight Dope 開始學習，首先自己先從 git clone 程式碼

git clone https://github.com/zackchase/mxnet-the-straight-dope.git
cd mxnet-the-straight-dope/
conda env create -f environment.yml #以environment.yml裡面指示安裝的套件建立 gluon 環境
source activate gluon
pip install -U pip
pip install notedown #支援 Markdown，暫時用不到，但是先前建立的 Jupyter Config需要
pip install jupyter_contrib_nbextensions #安裝Jupter Notebook code cell執行計時套件
jupyter contrib nbextension install --user
jupyter nbextension enable execute_time/ExecuteTime
jupyter notebook #會自動抓前文所製作的 ~/.jupyter/jupyter_notebook_config.py 。如果還沒做，請參考 https://ithelp.ithome.com.tw/articles/10203673

以Browser 連上指定網址以後出現

進入 chapter01_crashcourse 第一章後，點選 ndarray.ipynb

進入第一個課題，假設我們已經抓到訓練用的資料集，那如何將數據放進電腦記憶體來進一步做運算呢？ mxnet 提供了 NDArray，熟悉 Numpy 的人可能可以猜出它也是置放多維陣列（比較潮的說法叫『張量』）的資料結構，但是它添加了諸如 GPU 甚至分散式雲計算，而且他會幫忙做梯度計算，是針對深度學習優化的。要使用它相當容易：

import mxnet as mx 
from mxnet import nd
mx.random.seed(1)
x = nd.zeros((3, 5))
print(x)

可以得到 3x5 都是0. 的2維張量

[[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]]
<NDArray 3x5 @cpu(0)>

我們可以很輕易的對張量做運算:

y = nd.random_normal(0, 1, shape=(3, 5))
print('x + y =',x+y)
print('x/y =',x/y)
print('exp(y) =',nd.exp(y))
print('nd.dot(x, y.T) =',nd.dot(x, y.T))

與先前談過得 Tuple，List等資料結構，我們也可以對 ndarry做切片 Slice；而且可以用 reshape 改變其型態。這個在數值計算經常用到。

print('x[1:3] =',x[1:3])
print('x[1:2,1:3] =',x[1:2,1:3])
#我們可以改變切片部份的值
x[1:2,1:3] = 5.0
print('new x =', x)

#我們可以改變張量型態方便後續做運算
z=nd.random_normal(0, 1, shape=(3, 6))
print(z.reshape((2, 9)))

進行數值運算時，常遇到兩個變量的型態不同，這時候 Broadcast 機制很重要。舉例來說：

a = nd.arange(3).reshape((3, 1))
b = nd.arange(2).reshape((1, 2))
print('a =', a)  
print('b =', b)
print()
print('a+b broadcast:',a + b)

a 是 3x1的張量；b 是 1x2的張量, 兩者相加自動以broadcast變形(資料複製到新的維度)成 3x2的張量。這個雖然不需要用指令操作，在後續程式碼細細的推算每個變量的維度，經常可以察覺到其蹤跡。

a = 
[[0.]
 [1.]
 [2.]]
<NDArray 3x1 @cpu(0)>
b = 
[[0. 1.]]
<NDArray 1x2 @cpu(0)>

a+b broadcast: 
[[0. 1.]
 [1. 2.]
 [2. 3.]]
<NDArray 3x2 @cpu(0)>

備註：

專案緣起記錄在【UP, Scrum 與 AI專案】

Tensorflow, PyTorch, Mxnet ...

安裝GPU 加速的 CUDA 驅動

系列文

深度學習所需入門知識--一位初學者的認知共 31 篇

RSS系列文訂閱系列文

28 人訂閱

完整目錄

直播研討會

{{ item.channelVendor }} {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22195 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

深度學習所需入門知識--一位初學者的認知系列 第 10 篇