iT邦幫忙

data science相關文章
共有 238 則文章
鐵人賽 AI & Data DAY 29

技術 [Day 29] Booking.com 從成功模型中學到的經驗(上)

終於到了鐵人賽的尾聲,在經過一個月、看過各大公司依據不同目的、場景設計的演算法後,我們學到了什麼呢?而每間公司在研發並使用各式各樣的模型後,有沒有什麼珍貴的經驗...

鐵人賽 AI & Data DAY 28

技術 [Day 28] Pinterest 如何用機器學習打造更健康的評論系統

對社群網站而言,使用者積極的互動是非常重要的一環。因此,打造一個用戶能夠安心發文、建全的評論環境更是不可忽視的重要任務。社群網站往往會提供用戶檢舉貼文的選項,以...

鐵人賽 AI & Data DAY 27

技術 [Day 27] Dropbox 的圖片搜尋演算法

本篇文章使用的圖片皆來自於 Dropbox 的文章 How image search works at Dropbox。 國慶連假後的上班日,Skylar...

鐵人賽 AI & Data DAY 26

技術 [Day 26] Airbnb 使用 ResNet50 標記房間圖片

在國慶連假時,Skylar 使用 Airbnb 預定出遊的住宿地點。而在入住後,他發覺和當初在網站上看到的照片並無二致,圖片品質很好且很精確,也會依照不同房型分...

鐵人賽 AI & Data DAY 25

技術 [Day 25] Spotify 使用 NLP 以助於 Podcast 搜尋

近幾年,Podcast 越發熱門,Spotify 的用戶也越來越頻繁地使用關鍵字搜尋相關節目,希望找到自己有興趣的 Podcast 內容。不過,Podcast...

鐵人賽 AI & Data DAY 24

技術 [Day 24] Pinterest 生成推薦內容的方法(四)- PinnerFormer

我們昨天介紹 Pinterest 的推薦系統 PinnerSage,不過那是 2020 年的文章。身為不斷創新的 Pinterest 公司,在 2022 年又提...

鐵人賽 AI & Data DAY 23

技術 [Day 23] Pinterest 生成推薦內容的方法(三)- PinnerSage

昨天我們認識 Pinterest 使用 PinSage 演算法,將每個 pin 和 board 轉成 embedding。不過,只是轉成 embedding 還...

鐵人賽 AI & Data DAY 21

技術 [Day21] Pinterest 生成推薦內容的方法(一)- RandomWalk

Skylar 和 Krsitina 最近想要重新裝潢他們家,因此閒來無事時就會到 Pinterest 上看別人分享的裝潢照片作為參考。另外,Krsitina 也...

鐵人賽 AI & Data DAY 22

技術 [Day22] Pinterest 生成推薦內容的方法(二)- PinSage

昨天我們一起認識了 random walk 這個方法,Pinterest 在實務上是如何利用這個技術的呢?讓我們今天一起來看 他們提出的 PinSage 演算法...

鐵人賽 AI & Data DAY 20

技術 [Day 20] 購物網站處理詐騙攻擊的方式

在昨天的文章中,我們聊到 Uber 如何使用 RADAR 系統偵測詐騙行為。今天,讓我們再擴大應用場域,看看跟現今生活密不可分的購物網站是如何處理詐騙問題吧!...

鐵人賽 AI & Data DAY 19

技術 [Day 19] Uber 使用 RADAR 模型偵測詐騙行為

昨天看完 Uber 如何預測抵達時間,今天來聊聊另外一個主題,看看 Uber 的詐騙偵測(fraud detection)吧! 無論是什麼產業,防止詐騙行為都...

鐵人賽 AI & Data DAY 18

技術 [Day 18] Uber 要如何估計司機和外送的抵達時間?(下)- DeeprETANet

昨天的文章中提到 Uber 計算預估抵達時間(Estimated Time of Arrival,ETA)時,不僅要考慮路線本身,也會被時間、天氣和交通狀況影響...

鐵人賽 AI & Data DAY 17

技術 [Day 17] Uber 要如何估計司機和外送的抵達時間?(上)- Self attention 介紹

今天公事繁忙,Skylar 沒有出門買午餐的餘裕,決定使用 Uber 訂購外送。App 顯示的預估抵達時間為 40 分鐘後,他盤算著剛好下一場會議結束後,剛好就...

鐵人賽 AI & Data DAY 16

技術 [Day 16] 改善 Airbnb 的房源排序模型(下)- ABCD 改善方案

在前兩天的文章中,我們提到 Airbnb 為了做出更好的房源排序模型,提出「ABCD 改善方案」: A:模型架構(Architecture):觀察使用者需求後,...

鐵人賽 AI & Data DAY 15

技術 [Day 15] 改善 Airbnb 的房源排序模型(中) - ABCD 改善方案

在昨天的文章中,我們提到 Airbnb 為了做出更好的房源排序模型,決定跳脫「讀文獻 -> 實作 -> A/B testing」的迴圈,提出「ABC...

鐵人賽 AI & Data DAY 14

技術 [Day 14] 改善 Airbnb 的房源排序模型(上)- NDCG 介紹

昨天 Skylar 訂完露營和烤肉用具後,今天他想在 Airbnb 上搜尋適合渡假的房源,而當他在瀏覽時,Airbnb 是如何排序出 Skylar 看到的頁面呢...

鐵人賽 AI & Data DAY 13

技術 [Day 13] 更貼近消費者需求的購物網站搜尋結果 - Alicoco

國慶連假快到了,Skylar 和 Kristina 預計要去三天兩夜的露營,於是 Skylar 決定在購物網站採購一些露營相關的用具。他拿出事先列好的商品清單,...

鐵人賽 AI & Data DAY 12

技術 [Day 12] Spotify 怎麼知道要在「每週新發現」推薦什麼歌給你?(下)Bart Model

打開 Spotify,我們會看到許多推薦歌單和 Podcast 節目,他們怎麼知道用戶會喜歡什麼呢? 資料 Spotify 不遺餘力地搜集各式各樣的資料,資料...

鐵人賽 AI & Data DAY 11

技術 [Day 11] Spotify 怎麼知道「每週新發現」中要推薦什麼歌給你?(上)Multi-Armed Bandit

今天 Skylar 在出差的路上,一邊開著車,一邊聽著歌。在遙遙無期的路途中,他突然想到今天是禮拜一,Spotify 會推薦「每週新發現」的歌單,因此他滿懷期待...

鐵人賽 AI & Data DAY 10

技術 [Day 10] 做一個 A/B testing 要如何部署各種版本的 app?以 Uber 為例

經過統計的疲勞轟炸,今天來聊一點輕鬆的內容吧。 Netflix 是一間勇於嘗試、大膽做實驗的公司,無論是廣告、付款方式、給客戶的訊息(例如 email)、聲音及...

鐵人賽 AI & Data DAY 9

技術 [Day 9] Netflix(三)- 如何判讀 A/B testing 的結果?淺談 False Negative

在昨天的文章中,我們執行了一個抽球的想像實驗,讓我們來回憶一下 在不知道箱子中黑白球數量的情況下,藉由抽球實驗想要確定兩球之數量: (1) 虛無假設(null...

鐵人賽 AI & Data DAY 8

技術 [Day 8] Netflix(二)- 如何判讀 A/B testing 的結果?淺談 False Positive

在昨天的文章中,我們介紹 Netflix 在測試新功能「顯示Top 10 的節目排名」頁面時,使用 A/B testing。在搜集完資料後,資料科學家要如何判斷...

鐵人賽 AI & Data DAY 7

技術 [Day 7] Netflix(一)- 為什麼我看到的和你的不同?你被 A/B Testing 了嗎?

今天是颱風天,Skylar 無處可去,只好懶散地躺在沙發上(他哪天不是呢?),遙控器轉來轉去,都沒有自己想要看的節目。他嘆了口氣,將畫面切到 Netflix,決...

鐵人賽 AI & Data DAY 6

技術 [Day 6] Instagram 藉由 Suggested Post,讓用戶「Feels Like Home」

Skylar 一如往常地在滑著 Instagram 時,突然發現在首頁,除了他原本追蹤的帳號以外,也多了一些貼文來自他沒有追蹤的帳號,那些貼文的左上角都寫著「S...

鐵人賽 AI & Data DAY 5

技術 [Day 5] Instagram 如何產出要讓用戶探索(Explore)的內容?(下)

在前一天的內容中,我們介紹 Instagram 為了推薦用戶其他公眾帳號,設計三個工具以節省運算資源、快速找到相似帳號。此三工具分別為:IGQL、account...

鐵人賽 AI & Data DAY 3

技術 [Day03] MedMNIST 資料集

前言 本日會開始進入最主體的Classification的部份,首先就從資料集開始介紹吧!這次會使用的是MedMNIST這個資料集,差不多就是Medical版的...

鐵人賽 AI & Data DAY 4

技術 [Day 4] Instagram 如何產出要讓用戶探索(Explore)的內容?(上)

今天又是美好的一天,Skylar 一如往常地躺在沙發上,滑著手機。但是,他有點看膩了追蹤帳號的內容,他跳到 explore 頁面,想看看有沒有什麼新的帳號和內容...

鐵人賽 AI & Data DAY 3

技術 [Day 3] Facebook 如何排序推薦內容(下)- Feed Aggregator

回憶昨天的介紹,推薦系統分為兩個階段:candidate generation 和 candidate selection,以下按照這兩個步驟依序介紹。 Can...

鐵人賽 AI & Data DAY 2

技術 [Day 2] Facebook 如何排序推薦內容(上)- 使用者調查

一個風和日麗的上午,Skylar 慵懶地躺在沙發上,滑著 Facebook,漫不經心地瀏覽動態。他看到 Toby 更新自己的衝浪影片、Wade 和自己的狗狗的自...

鐵人賽 AI & Data DAY 1

技術 [Day 1] 前言 - 動心起念和文章主題介紹

本系列文已於 2023 年底出版 🥳🥳🥳 歡迎大家多多支持 🙇🏻‍♀️🙇🏻‍♀️🙇🏻‍♀️https://www.tenlong.com.tw/product...