iT邦幫忙

data science相關文章
共有 228 則文章
鐵人賽 AI & Data DAY 5

技術 [Day 5] Instagram 如何產出要讓用戶探索(Explore)的內容?(下)

在前一天的內容中,我們介紹 Instagram 為了推薦用戶其他公眾帳號,設計三個工具以節省運算資源、快速找到相似帳號。此三工具分別為:IGQL、account...

鐵人賽 AI & Data DAY 27

技術 [Day 27] Dropbox 的圖片搜尋演算法

本篇文章使用的圖片皆來自於 Dropbox 的文章 How image search works at Dropbox。 國慶連假後的上班日,Skylar...

鐵人賽 AI & Data DAY 27

技術 [Day 27] 凸顯圖表重點的小技巧2

在上一篇介紹了一些比較好操作的凸顯圖表重點的小技巧,例如藉由圖表的顏色、或是標題的文字,來讓觀眾一眼就能夠看出你想要表達的重點。 接下來我們再繼續來看看一些其他...

鐵人賽 AI & Data DAY 15

技術 [Day 15] 資料產品生命週期管理-預測模型

儘管都是模型,但預測模型目的在於預測未來,所以開發方式也會和描述型模型有所差異。 Initiation 起始階段要確認的事情跟之前差不多。 商業意圖是否明確:商...

鐵人賽 AI & Data DAY 8

技術 [Day 8] Netflix(二)- 如何判讀 A/B testing 的結果?淺談 False Positive

在昨天的文章中,我們介紹 Netflix 在測試新功能「顯示Top 10 的節目排名」頁面時,使用 A/B testing。在搜集完資料後,資料科學家要如何判斷...

鐵人賽 AI & Data DAY 10

技術 [Day 10] 做一個 A/B testing 要如何部署各種版本的 app?以 Uber 為例

經過統計的疲勞轟炸,今天來聊一點輕鬆的內容吧。 Netflix 是一間勇於嘗試、大膽做實驗的公司,無論是廣告、付款方式、給客戶的訊息(例如 email)、聲音及...

技術 Why learn Python for Data Science?

Data Science is a multi-disciplinary field where one uses algorithms, processes,...

鐵人賽 AI & Data DAY 23

技術 [Day 23] 資料產品在設計與開發階段的五個大坑

過了需求訪談後,在設計和開發階段也有要注意的事項。 第一坑 資料不熟悉 當組織規模一大,設計資料產品的人可能需要從其他人的手伸認識資料,這種時候就會發生很多誤解...

鐵人賽 AI & Data DAY 22

技術 [Day 22] 呈現多種特性的資料1 - 先找出重點

好了,經過前面的介紹,現在應該對於如何幫資料找到適合的方式之後,我們現在來更進一步,找看看是否有「更」適合的方式。尤其是當資料很複雜、有多個不同面向可以切入去做...

鐵人賽 AI & Data DAY 22
人機結合 數據與學習 系列 第 22

技術 程式語言的世界

人的科技文明發展始終來自於人性 在人工智慧成為一個顯學的現今,除了要學習許許多多相關的知識之外,還要學會如何寫程式,在人工智慧與大數據分析這兩個結合在一起的領域...

鐵人賽 AI & Data DAY 22

技術 [Day22] Pinterest 生成推薦內容的方法(二)- PinSage

昨天我們一起認識了 random walk 這個方法,Pinterest 在實務上是如何利用這個技術的呢?讓我們今天一起來看 他們提出的 PinSage 演算法...

鐵人賽 AI & Data DAY 23

技術 [Day 23] 呈現多種特性的資料2 - 再來思考如何呈現

在前一篇 [Day22] 呈現多種特性的資料1 有提到要先找出用這些資料想要呈現出的重點,接下來就來實際看看一些案例吧。 坐於言不如起而行 都先確認好資料的樣...

鐵人賽 AI & Data DAY 26

技術 [Day 26] Airbnb 使用 ResNet50 標記房間圖片

在國慶連假時,Skylar 使用 Airbnb 預定出遊的住宿地點。而在入住後,他發覺和當初在網站上看到的照片並無二致,圖片品質很好且很精確,也會依照不同房型分...

鐵人賽 AI & Data DAY 25

技術 [Day 25] 視覺化圖表的 Dos & Don'ts 2

在上一篇 [Day 24] 視覺化圖表的 Dos & Don'ts 1 我們介紹了在製作視覺化圖表時的幾個常出現的錯誤,今天我們再來繼續看看還有哪些錯誤...

鐵人賽 AI & Data DAY 18

技術 [Day 18] 資料產品生命週期管理-自動決策

如同前面所說,資料模型需要運用到實際環境中才會發揮價值 Initiation 延續之前輔助決策的初始條件,如果想使用資料來做自動決策,最重要的一樣是要釐清想解決...

鐵人賽 AI & Data DAY 25

技術 [Day 25] 資料產品在評估階段的五個大坑

在評估階段有幾件面向需要注意 資料產品品質 資料產品品質是需要持續監控和評估的。不同層的資料產品有不同的品質指標,基本上很難一次到位,需要持續增加觀察的指標。例...

鐵人賽 AI & Data DAY 20

技術 [Day 20] 購物網站處理詐騙攻擊的方式

在昨天的文章中,我們聊到 Uber 如何使用 RADAR 系統偵測詐騙行為。今天,讓我們再擴大應用場域,看看跟現今生活密不可分的購物網站是如何處理詐騙問題吧!...

鐵人賽 AI & Data DAY 13

技術 [Day 13] 更貼近消費者需求的購物網站搜尋結果 - Alicoco

國慶連假快到了,Skylar 和 Kristina 預計要去三天兩夜的露營,於是 Skylar 決定在購物網站採購一些露營相關的用具。他拿出事先列好的商品清單,...

鐵人賽 AI & Data DAY 19

技術 [Day 19] Uber 使用 RADAR 模型偵測詐騙行為

昨天看完 Uber 如何預測抵達時間,今天來聊聊另外一個主題,看看 Uber 的詐騙偵測(fraud detection)吧! 無論是什麼產業,防止詐騙行為都...

鐵人賽 AI & Data DAY 25

技術 [Day 25] Spotify 使用 NLP 以助於 Podcast 搜尋

近幾年,Podcast 越發熱門,Spotify 的用戶也越來越頻繁地使用關鍵字搜尋相關節目,希望找到自己有興趣的 Podcast 內容。不過,Podcast...

鐵人賽 AI & Data DAY 21

技術 [Day 21] 好還要更好:資料視覺化的小技巧與工具

終於也慢慢接近這 30 天挑戰的尾聲了,在前面的幾個主題中,主要都在介紹資料視覺化的圖表們,其中又大致分為以下四個大類別。 [Day 4] 用來呈現時間趨勢...

鐵人賽 AI & Data DAY 18

技術 [Day 18] Uber 要如何估計司機和外送的抵達時間?(下)- DeeprETANet

昨天的文章中提到 Uber 計算預估抵達時間(Estimated Time of Arrival,ETA)時,不僅要考慮路線本身,也會被時間、天氣和交通狀況影響...

鐵人賽 AI & Data DAY 6

技術 [Day 6] Instagram 藉由 Suggested Post,讓用戶「Feels Like Home」

Skylar 一如往常地在滑著 Instagram 時,突然發現在首頁,除了他原本追蹤的帳號以外,也多了一些貼文來自他沒有追蹤的帳號,那些貼文的左上角都寫著「S...

鐵人賽 AI & Data DAY 15

技術 [Day 15] 改善 Airbnb 的房源排序模型(中) - ABCD 改善方案

在昨天的文章中,我們提到 Airbnb 為了做出更好的房源排序模型,決定跳脫「讀文獻 -> 實作 -> A/B testing」的迴圈,提出「ABC...

鐵人賽 AI & Data DAY 17

技術 [Day 17] Uber 要如何估計司機和外送的抵達時間?(上)- Self attention 介紹

今天公事繁忙,Skylar 沒有出門買午餐的餘裕,決定使用 Uber 訂購外送。App 顯示的預估抵達時間為 40 分鐘後,他盤算著剛好下一場會議結束後,剛好就...

鐵人賽 AI & Data DAY 30

技術 [Day 30] Booking.com 從成功模型中學到的經驗(下)及賽末心得

今天的文章中,我們會延續昨天的題目,聊聊 Booking.com 在模型上線後發現的有趣現象。最後,我會再跟大家分享經過這 30 天的鐵人挑戰賽後,我學到的事,...

鐵人賽 AI & Data DAY 16

技術 [Day 16] 改善 Airbnb 的房源排序模型(下)- ABCD 改善方案

在前兩天的文章中,我們提到 Airbnb 為了做出更好的房源排序模型,提出「ABCD 改善方案」: A:模型架構(Architecture):觀察使用者需求後,...

鐵人賽 AI & Data DAY 29

技術 [Day 29] Booking.com 從成功模型中學到的經驗(上)

終於到了鐵人賽的尾聲,在經過一個月、看過各大公司依據不同目的、場景設計的演算法後,我們學到了什麼呢?而每間公司在研發並使用各式各樣的模型後,有沒有什麼珍貴的經驗...

鐵人賽 AI & Data DAY 28

技術 [Day 28] Pinterest 如何用機器學習打造更健康的評論系統

對社群網站而言,使用者積極的互動是非常重要的一環。因此,打造一個用戶能夠安心發文、建全的評論環境更是不可忽視的重要任務。社群網站往往會提供用戶檢舉貼文的選項,以...

技術 每個數據科學候選人都應該知道的 5 項技能

據估計,我們每天生成大約 2.5 萬億字節的數據。因此,構建有針對性的方法來導航和分析這些數據變得非常重要,這些數據對於理解全球各種公司和企業的戰略運營至關重要...