iT邦幫忙

data science相關文章
共有 238 則文章
鐵人賽 AI & Data DAY 24

技術 [Day 24] Pinterest 生成推薦內容的方法(四)- PinnerFormer

我們昨天介紹 Pinterest 的推薦系統 PinnerSage,不過那是 2020 年的文章。身為不斷創新的 Pinterest 公司,在 2022 年又提...

鐵人賽 AI & Data DAY 6

技術 [Day 6] 時間趨勢圖表2 - 長條圖

昨天在 [Day 5] 時間趨勢圖表1 有介紹過折線圖與面積圖,今天則要來針對長條圖的使用方式,來做進一步的介紹與舉例說明。 長條圖 (Bar Chart)...

鐵人賽 AI & Data DAY 23

技術 [Day 23] Pinterest 生成推薦內容的方法(三)- PinnerSage

昨天我們認識 Pinterest 使用 PinSage 演算法,將每個 pin 和 board 轉成 embedding。不過,只是轉成 embedding 還...

鐵人賽 AI & Data DAY 8

技術 [Day 8] 比較不同群體的圖表1 - 長條圖

在 [Day 7] 用來比較不同群體的圖表們,有簡單介紹過長條圖、直方圖、雷達圖等,用來比較不同群體的圖表們。接下來,就讓我們來針對這些圖表們做進一步的介紹與比...

鐵人賽 AI & Data DAY 1

技術 [Day 1] 前言 - 動心起念和文章主題介紹

本系列文已於 2023 年底出版 🥳🥳🥳 歡迎大家多多支持 🙇🏻‍♀️🙇🏻‍♀️🙇🏻‍♀️https://www.tenlong.com.tw/product...

鐵人賽 AI & Data DAY 29

技術 Youtube Reports API 教學 - 告一個段落

「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 G...

鐵人賽 AI & Data DAY 1

技術 學習MLOps前暖身操:why, what, who?

接下來的30天,我們會一起看MLOps的更多層面。從為什麼產業開始談MLOps開始,以及其包含的技術與非技術面。今天我想談的是關於學習mlops前必備的3個背景...

鐵人賽 AI & Data DAY 1

技術 [Day 1] 什麼是資料視覺化

這個主題是想要介紹,當你手上有一些資料,做了些分析有了些洞見 (insight) 之後,要怎麼視資料的特性,來為他選擇適合的視覺化方式,來達到事半功倍的效果。...

鐵人賽 AI & Data DAY 24

技術 Youtube Analytics API 教學 - 多維度分析 A+B

「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 G...

鐵人賽 AI & Data DAY 1

技術 前導文 - 科學不能解決大自然的奧秘(↑訂閱)

「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 G...

鐵人賽 AI & Data DAY 2

技術 [Day 2] Facebook 如何排序推薦內容(上)- 使用者調查

一個風和日麗的上午,Skylar 慵懶地躺在沙發上,滑著 Facebook,漫不經心地瀏覽動態。他看到 Toby 更新自己的衝浪影片、Wade 和自己的狗狗的自...

鐵人賽 AI & Data DAY 8

技術 [Day 8] Netflix(二)- 如何判讀 A/B testing 的結果?淺談 False Positive

在昨天的文章中,我們介紹 Netflix 在測試新功能「顯示Top 10 的節目排名」頁面時,使用 A/B testing。在搜集完資料後,資料科學家要如何判斷...

鐵人賽 AI & Data DAY 19

技術 [Day 19] 資料產品的管理-資料治理初探

前面花了不少篇幅在討論資料產品的開發,接下來將花一些篇幅討論資料產品的治理方式。 在做資料產品治理時,有一個很重要的觀念「將資料當作資產」。如果前面介紹過的,資...

技術 如何通过Web数据提取来Google购物价格

Google购物是营销您的在线业务并增加销售额的良好起点。但是,如果您是新手,则必须使用网络数据提取工具(网络抓取工具)来观看和了解竞争对手如何在Google购...

鐵人賽 AI & Data DAY 5

技術 [Day 5] 資料產品第二層 - 資料加工術 - 資料聚合

即便是相同原料經過不同師傅的手藝也會呈現不同的味道(昨天吃的游壽司) 當資料經過基本篩檢後,也會根據後續使用的需求將資料聚合(資料聚合就是將資料從細的顆粒度聚合...

鐵人賽 AI & Data DAY 12

技術 [Day 12] Spotify 怎麼知道要在「每週新發現」推薦什麼歌給你?(下)Bart Model

打開 Spotify,我們會看到許多推薦歌單和 Podcast 節目,他們怎麼知道用戶會喜歡什麼呢? 資料 Spotify 不遺餘力地搜集各式各樣的資料,資料...

鐵人賽 AI & Data DAY 30

技術 [Day 30] 更多關於資料科學、與資料視覺化

來到了這個系列的最後一篇,除了這個主題之外還會有我個人的一些心得~ 關於資料科學 這其實是一門博大精深的學問,整個過程會包含像是定義問題、確認需要哪些資料、搜...

鐵人賽 AI & Data DAY 21

技術 [Day21] Pinterest 生成推薦內容的方法(一)- RandomWalk

Skylar 和 Krsitina 最近想要重新裝潢他們家,因此閒來無事時就會到 Pinterest 上看別人分享的裝潢照片作為參考。另外,Krsitina 也...

鐵人賽 AI & Data DAY 30

技術 [Day 30] 資料產品開發實務 - 完結撒花!

終於撐完三十天啦啊啊啊啊!!!沒想到自己有一天也能完成這個壯舉(拭淚),真的太敬佩各路大神以及前輩了Orz,也非常感謝各位讀者的支持,不管是幫忙點擊、按讚、分享...

鐵人賽 AI & Data DAY 29

技術 [Day 29] 圖表以外的資料視覺化方法

也慢慢進入到這整個系列的尾聲了,其實這整個系列,我們在談的都是透過靜態圖表這種呈現方式的視覺化。 但其實還有其他方式也可以達成視覺化的目的,例如資訊圖表、影片、...

鐵人賽 AI & Data DAY 26

技術 [Day 26] 資料產品開發實務 - 原始資料 - Event Tracking

前面說了那麼多理論,最後幾天來寫一下開發實務吧!今天要介紹的是怎麼收集 App 使用者行為資料。 Initiate 追蹤事件是需要成本的,這些成本包括開發、蒐集...

鐵人賽 AI & Data DAY 11

技術 [Day 11] 用來呈現組成結構的圖表們

在 [Day 9] 比較不同群體的圖表2 有提到柏拉圖這個可以同時比較不同群體的量、又能呈現組成比例的圖表。今天就讓我們來看看,還有哪些圖表是專門用來呈現組成結...

鐵人賽 AI & Data DAY 10

技術 『Day10』 如何設計實作 Data pipeline

在前幾天的內容當中,我們陸續介紹了 Data pipeline、Data pipeline 的種類、資料處理,資料品質等主題,相信大家對於 Data pipel...

鐵人賽 AI & Data DAY 11

技術 [Day 11] 資料產品生命週期管理-原始資料

不同類型的資料產品在其各自專案週期有需要注意的地方,以下我們將說明在處理原始資料時,各階段應該做的事情 Initiate 在初始階段,最重要的就是要了解搜集資料...

鐵人賽 AI & Data DAY 26

技術 Youtube Analytics API 教學 - 告一個段落

「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 G...

鐵人賽 AI & Data DAY 2

技術 [Day 2] 資料產品第一層 - 原始資料

就像稻米之於米苔目,小麥之於麵疙瘩,原始資料就是任何資料產品最基礎的存在。 在研究所修讀統計的時候,教授常常掛在嘴邊的一句話就是「garbage in, ga...

鐵人賽 AI & Data DAY 23

技術 Youtube Analytics API 教學  -  期待多元性別出現 'gender' 維度

「鮭魚均,因為一場鮭魚之亂被主管稱為鮭魚世代,廣義來說以年齡和臉蛋分類的話這應該算是一種 KNN 的機器學習,不正經的數據分析師,畢業後把人生暫停了半年,在 G...

鐵人賽 AI & Data DAY 20

技術 Neo4j Data Science 資料分析與 Bloom 視覺化

前面一系列文章已經介紹過 Neo4j Bloom 以及 Neo4j GDS,Bloom 的強處是視覺化,GDS 的強處是演算法,現在該是時候把兩者結合了!畢竟光...

鐵人賽 AI & Data DAY 24

技術 [Day 24] 資料產品在部署階段的五個大坑

上線之後才是開始。 第一坑 開發和部署環境不一致 如果一開始開發和部署沒有「喬好」環境的話,那上線的過程可是會吃一番苦頭。例如搞不清楚環境有哪些套件,只好正式環...