在前一天的內容中,我們介紹 Instagram 為了推薦用戶其他公眾帳號,設計三個工具以節省運算資源、快速找到相似帳號。此三工具分別為:IGQL、account...
本篇文章使用的圖片皆來自於 Dropbox 的文章 How image search works at Dropbox。 國慶連假後的上班日,Skylar...
在上一篇介紹了一些比較好操作的凸顯圖表重點的小技巧,例如藉由圖表的顏色、或是標題的文字,來讓觀眾一眼就能夠看出你想要表達的重點。 接下來我們再繼續來看看一些其他...
儘管都是模型,但預測模型目的在於預測未來,所以開發方式也會和描述型模型有所差異。 Initiation 起始階段要確認的事情跟之前差不多。 商業意圖是否明確:商...
在昨天的文章中,我們介紹 Netflix 在測試新功能「顯示Top 10 的節目排名」頁面時,使用 A/B testing。在搜集完資料後,資料科學家要如何判斷...
經過統計的疲勞轟炸,今天來聊一點輕鬆的內容吧。 Netflix 是一間勇於嘗試、大膽做實驗的公司,無論是廣告、付款方式、給客戶的訊息(例如 email)、聲音及...
Data Science is a multi-disciplinary field where one uses algorithms, processes,...
過了需求訪談後,在設計和開發階段也有要注意的事項。 第一坑 資料不熟悉 當組織規模一大,設計資料產品的人可能需要從其他人的手伸認識資料,這種時候就會發生很多誤解...
好了,經過前面的介紹,現在應該對於如何幫資料找到適合的方式之後,我們現在來更進一步,找看看是否有「更」適合的方式。尤其是當資料很複雜、有多個不同面向可以切入去做...
人的科技文明發展始終來自於人性 在人工智慧成為一個顯學的現今,除了要學習許許多多相關的知識之外,還要學會如何寫程式,在人工智慧與大數據分析這兩個結合在一起的領域...
昨天我們一起認識了 random walk 這個方法,Pinterest 在實務上是如何利用這個技術的呢?讓我們今天一起來看 他們提出的 PinSage 演算法...
在前一篇 [Day22] 呈現多種特性的資料1 有提到要先找出用這些資料想要呈現出的重點,接下來就來實際看看一些案例吧。 坐於言不如起而行 都先確認好資料的樣...
在國慶連假時,Skylar 使用 Airbnb 預定出遊的住宿地點。而在入住後,他發覺和當初在網站上看到的照片並無二致,圖片品質很好且很精確,也會依照不同房型分...
在上一篇 [Day 24] 視覺化圖表的 Dos & Don'ts 1 我們介紹了在製作視覺化圖表時的幾個常出現的錯誤,今天我們再來繼續看看還有哪些錯誤...
如同前面所說,資料模型需要運用到實際環境中才會發揮價值 Initiation 延續之前輔助決策的初始條件,如果想使用資料來做自動決策,最重要的一樣是要釐清想解決...
在評估階段有幾件面向需要注意 資料產品品質 資料產品品質是需要持續監控和評估的。不同層的資料產品有不同的品質指標,基本上很難一次到位,需要持續增加觀察的指標。例...
在昨天的文章中,我們聊到 Uber 如何使用 RADAR 系統偵測詐騙行為。今天,讓我們再擴大應用場域,看看跟現今生活密不可分的購物網站是如何處理詐騙問題吧!...
國慶連假快到了,Skylar 和 Kristina 預計要去三天兩夜的露營,於是 Skylar 決定在購物網站採購一些露營相關的用具。他拿出事先列好的商品清單,...
昨天看完 Uber 如何預測抵達時間,今天來聊聊另外一個主題,看看 Uber 的詐騙偵測(fraud detection)吧! 無論是什麼產業,防止詐騙行為都...
近幾年,Podcast 越發熱門,Spotify 的用戶也越來越頻繁地使用關鍵字搜尋相關節目,希望找到自己有興趣的 Podcast 內容。不過,Podcast...
終於也慢慢接近這 30 天挑戰的尾聲了,在前面的幾個主題中,主要都在介紹資料視覺化的圖表們,其中又大致分為以下四個大類別。 [Day 4] 用來呈現時間趨勢...
昨天的文章中提到 Uber 計算預估抵達時間(Estimated Time of Arrival,ETA)時,不僅要考慮路線本身,也會被時間、天氣和交通狀況影響...
Skylar 一如往常地在滑著 Instagram 時,突然發現在首頁,除了他原本追蹤的帳號以外,也多了一些貼文來自他沒有追蹤的帳號,那些貼文的左上角都寫著「S...
在昨天的文章中,我們提到 Airbnb 為了做出更好的房源排序模型,決定跳脫「讀文獻 -> 實作 -> A/B testing」的迴圈,提出「ABC...
今天公事繁忙,Skylar 沒有出門買午餐的餘裕,決定使用 Uber 訂購外送。App 顯示的預估抵達時間為 40 分鐘後,他盤算著剛好下一場會議結束後,剛好就...
今天的文章中,我們會延續昨天的題目,聊聊 Booking.com 在模型上線後發現的有趣現象。最後,我會再跟大家分享經過這 30 天的鐵人挑戰賽後,我學到的事,...
在前兩天的文章中,我們提到 Airbnb 為了做出更好的房源排序模型,提出「ABCD 改善方案」: A:模型架構(Architecture):觀察使用者需求後,...
終於到了鐵人賽的尾聲,在經過一個月、看過各大公司依據不同目的、場景設計的演算法後,我們學到了什麼呢?而每間公司在研發並使用各式各樣的模型後,有沒有什麼珍貴的經驗...
對社群網站而言,使用者積極的互動是非常重要的一環。因此,打造一個用戶能夠安心發文、建全的評論環境更是不可忽視的重要任務。社群網站往往會提供用戶檢舉貼文的選項,以...
據估計,我們每天生成大約 2.5 萬億字節的數據。因此,構建有針對性的方法來導航和分析這些數據變得非常重要,這些數據對於理解全球各種公司和企業的戰略運營至關重要...