iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 20
0
自我挑戰組

資料分析之路的雜談系列 第 20

量產型AI工程師

全球都在缺AI人才,未來的AI人力需求更達到百萬人以上,但現在AI相關人才數量遠遠不及未來需求,且AI人才薪資目前普遍較高,因此有需多非本科系或是轉職工程師想要靠補習班、資策會課程培訓等機構來接軌AI這個產業,但這些速成AI人才真的能夠變成擁有即戰力的資料分析師嗎?

資料科學家、資料工程師及機器學習工程師

從問題定義到分析資料到實際分析結果決策應用大概會有三種人員參與。

第一種是資料科學家,資料科學家通常是看圖說故事的人,連結分析結果與產業價值是資料科學家擅長的事,通常必須對AI產業有一定的深入了解同時又熟悉產業現況的人。

第二種是資料工程師,資料工程師通常是熟習各種資料處理工具的人,他們必須同時懂演算法又懂資料處理才能快速布署AI程式,在目前每隔幾個月就有重大開源工具被釋放出來情況下,如何快速熟習必要工具進行最短時間分析,是非常重要的。

第三種是機器學習工程師,機器學習工程師通常熟稔各種AI演算法、線性代數、機率論、微積分等數學模型,針對不同問題快速提出可能演算法方案是機器學習工程師擅長的。

從以上三種角色大概可以看出能夠速成的角色可能會是第二種人才,第一種人才因為需要對AI與相關產業問題現況有深入著墨才能提出有效見解,通常需要待在相關產業一定的時間累積才行,而第三種人才需要對基礎數學有一定的學習時間,想透過短期速成難度較大,如果是數學相關科系才比較有可能。

3個月補習就可以上戰場?

現有坊間AI補習班通常會是針對第二種人才進行高強度工具應用補習,透過大量實戰演練強化工具熟習度,但透過短期幾個月補習就能夠上戰場嗎?

我想這個問題可以用一個實際例子來呈現。

量產型砲灰工程師
這個例子是來自於某網頁工程師培訓營的學員心得。

  • 工具熟習
我们先抛开培训班的问题,我们先来讨论一个经典的面试题,它叫做「FizzBuzz」。输出数字 1-100,逢 3 的整倍数输出 Fizz,逢 5 的整倍数输出 Buzz,又是 3 又是 5 的整倍数输出 FizzBuzz。那么稍有常识的人都知道,无论你学习什么语言,学的水平有多糟糕,这道题都很容易实现。但我们来看一下最常见的一些错误是怎么出现的:

for i in 1..100
  if i / 3 == # 写不下去了

for i in 1..100
  if i % 3 == 0
    puts 'Fizz'
  elsif i % 5 == 0
    puts 'Buzz'
  elsif i % 15 # 写不下去了...

for i in 1..100
  if i % 3 == 0
    puts 'Fizz'
  elsif i % 5 == 0
    puts 'Buzz'
  elsif i % 15 == 0
    puts 'FizzBuzz'
  else
    puts i
  end

很多培训班会告诉你这些算法的基础知识毫不重要,但事实上严格来说这都算不上是一道算法题,这没有任何已有的算法模板来解决,这只是一个最简单的循环和条件分支语句,有超过 9 成的开发者没法正确写对这道题。我认为,这些人压根就不该也不适合来写代码。
这些人并非不能写业务逻辑,比如说让他们写个 CRUD,他们甚至不比你写得慢。但它们的问题在于连理解文字、理解需求的基本能力都不具备。当你说「整倍数」的时候他们无法想到用余数,当你先提到 3 和 5 的整倍数时,他们无法想到 15 应该放在他们两个之前判断。

出現這種情況就是補習班只會教你特殊情境下工具使用,而不是教導解決問題的方法和原理,而且解決問題的方法也是教不來的,需透過更多實戰累積經驗才行。

如果把情境從網頁工程師套到資料工程師也會出現同樣情況,對於只會使用特定工具可能就不知道為何CNN在圖形辨識效果好過單純的全連接層,可能不知道RNN為何適合文字分析處裡,因為他們只被教導遇到圖形就用CNN,遇到文章分析就用RNN就對了,對於這些AI類神經模型原理一概不懂,這種人才如果上戰場大概也只是變成砲灰。

1. 讓人工智慧真正開始上工
2. 量产型炮灰工程师


上一篇
新世代思維演講心得
下一篇
量子AI
系列文
資料分析之路的雜談30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言