我們昨天介紹 Pinterest 的推薦系統 PinnerSage,不過那是 2020 年的文章。身為不斷創新的 Pinterest 公司,在 2022 年又提...
昨天在 [Day 5] 時間趨勢圖表1 有介紹過折線圖與面積圖,今天則要來針對長條圖的使用方式,來做進一步的介紹與舉例說明。 長條圖 (Bar Chart)...
昨天我們認識 Pinterest 使用 PinSage 演算法,將每個 pin 和 board 轉成 embedding。不過,只是轉成 embedding 還...
在 [Day 7] 用來比較不同群體的圖表們,有簡單介紹過長條圖、直方圖、雷達圖等,用來比較不同群體的圖表們。接下來,就讓我們來針對這些圖表們做進一步的介紹與比...
本系列文已於 2023 年底出版 🥳🥳🥳 歡迎大家多多支持 🙇🏻♀️🙇🏻♀️🙇🏻♀️https://www.tenlong.com.tw/product...
「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 G...
接下來的30天,我們會一起看MLOps的更多層面。從為什麼產業開始談MLOps開始,以及其包含的技術與非技術面。今天我想談的是關於學習mlops前必備的3個背景...
這個主題是想要介紹,當你手上有一些資料,做了些分析有了些洞見 (insight) 之後,要怎麼視資料的特性,來為他選擇適合的視覺化方式,來達到事半功倍的效果。...
「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 G...
「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 G...
一個風和日麗的上午,Skylar 慵懶地躺在沙發上,滑著 Facebook,漫不經心地瀏覽動態。他看到 Toby 更新自己的衝浪影片、Wade 和自己的狗狗的自...
在昨天的文章中,我們介紹 Netflix 在測試新功能「顯示Top 10 的節目排名」頁面時,使用 A/B testing。在搜集完資料後,資料科學家要如何判斷...
圖片來源: https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixaba...
前面花了不少篇幅在討論資料產品的開發,接下來將花一些篇幅討論資料產品的治理方式。 在做資料產品治理時,有一個很重要的觀念「將資料當作資產」。如果前面介紹過的,資...
Google购物是营销您的在线业务并增加销售额的良好起点。但是,如果您是新手,则必须使用网络数据提取工具(网络抓取工具)来观看和了解竞争对手如何在Google购...
即便是相同原料經過不同師傅的手藝也會呈現不同的味道(昨天吃的游壽司) 當資料經過基本篩檢後,也會根據後續使用的需求將資料聚合(資料聚合就是將資料從細的顆粒度聚合...
打開 Spotify,我們會看到許多推薦歌單和 Podcast 節目,他們怎麼知道用戶會喜歡什麼呢? 資料 Spotify 不遺餘力地搜集各式各樣的資料,資料...
來到了這個系列的最後一篇,除了這個主題之外還會有我個人的一些心得~ 關於資料科學 這其實是一門博大精深的學問,整個過程會包含像是定義問題、確認需要哪些資料、搜...
Skylar 和 Krsitina 最近想要重新裝潢他們家,因此閒來無事時就會到 Pinterest 上看別人分享的裝潢照片作為參考。另外,Krsitina 也...
終於撐完三十天啦啊啊啊啊!!!沒想到自己有一天也能完成這個壯舉(拭淚),真的太敬佩各路大神以及前輩了Orz,也非常感謝各位讀者的支持,不管是幫忙點擊、按讚、分享...
也慢慢進入到這整個系列的尾聲了,其實這整個系列,我們在談的都是透過靜態圖表這種呈現方式的視覺化。 但其實還有其他方式也可以達成視覺化的目的,例如資訊圖表、影片、...
前面說了那麼多理論,最後幾天來寫一下開發實務吧!今天要介紹的是怎麼收集 App 使用者行為資料。 Initiate 追蹤事件是需要成本的,這些成本包括開發、蒐集...
在 [Day 9] 比較不同群體的圖表2 有提到柏拉圖這個可以同時比較不同群體的量、又能呈現組成比例的圖表。今天就讓我們來看看,還有哪些圖表是專門用來呈現組成結...
在前幾天的內容當中,我們陸續介紹了 Data pipeline、Data pipeline 的種類、資料處理,資料品質等主題,相信大家對於 Data pipel...
不同類型的資料產品在其各自專案週期有需要注意的地方,以下我們將說明在處理原始資料時,各階段應該做的事情 Initiate 在初始階段,最重要的就是要了解搜集資料...
「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 G...
就像稻米之於米苔目,小麥之於麵疙瘩,原始資料就是任何資料產品最基礎的存在。 在研究所修讀統計的時候,教授常常掛在嘴邊的一句話就是「garbage in, ga...
「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 G...
前面一系列文章已經介紹過 Neo4j Bloom 以及 Neo4j GDS,Bloom 的強處是視覺化,GDS 的強處是演算法,現在該是時候把兩者結合了!畢竟光...
上線之後才是開始。 第一坑 開發和部署環境不一致 如果一開始開發和部署沒有「喬好」環境的話,那上線的過程可是會吃一番苦頭。例如搞不清楚環境有哪些套件,只好正式環...