iT邦幫忙

data science相關文章
共有 228 則文章
鐵人賽 自我挑戰組 DAY 9

技術 Day 9|資料運算的常見函數

  資料的運算除了基本的加減乘除之外,也能透過函數快速觀察和取得常見的統計值,完成資料匯總,以下將以實例介紹六種常見函數,包含: 最大值與最小值 資料加總與筆...

鐵人賽 AI & Data DAY 9

技術 『Day9』 資料品質

在上一篇當中我們常常談到資料的品質,因為在資料處理的其中一個目的就是我們要提升資料的品質。那我們要如何判斷資料的品質呢?這篇想要來聊聊資料品質,幫助大家在實作...

鐵人賽 自我挑戰組 DAY 8

技術 Day 8|資料運算的加減乘除

  資料的運算是整理大型數據常見的操作,本篇將搭配新增資料的操作,以案例分享 DataFrame 的加減乘除,方便我們利用 Pandas 快速整理數據,以下內容...

鐵人賽 AI & Data DAY 8

技術 『Day8』 資料處理

在前一天跟大家分享了 Data pipeline 的種類,在每種 Data pipeline 當中多半都有資料處理的步驟。實際上在各種資料應用的場景,從資料分析...

鐵人賽 自我挑戰組 DAY 7

技術 Day 7|新增 Series 或 DataFrame

  嗨!大家好!了解完如何載入和觀察資料後,接著將開始一系列對資料內容的操作,今天的主題為「新增資料」,內容分別以Pandas兩種常見的數據結構說明,包含:...

鐵人賽 AI & Data DAY 7

技術 『Day7』 Data pipeline 的種類

在建立Data pipeline 時我們常會碰到類似的場景。這邊帶大家了解一些常見的Data pipeline 類型,我們在開發Data pipeline 的時...

鐵人賽 AI & Data DAY 6

技術 『Day6』 Data pipeline 介紹

管線無所不在,雖然說日常生活中常常不會注意到其存在,但是卻對我們的生活影響非常大。舉例來說,在做裝潢時,就必須要把未來房屋的使用情景進行評估。並且需要針對屋主進...

鐵人賽 自我挑戰組 DAY 6

技術 Day 6|實戰讀取並觀察外部資料

  在進行數據分析前,需要先了解資料的內容,以利後續資料清理、特徵工程等處理,因此本篇將延續昨日主題,以實際案例實作一次讀取外部資料,並使用基本語法觀察資料內容...

鐵人賽 AI & Data DAY 5

技術 『Day5』 來聊聊 Data Management

"那個Timmy啊,廠商那邊又有多一組類型的資料,你再幫忙收一下""Jerry,資料好像有少喔,幫忙看一下是哪邊的問題,以後看到類...

鐵人賽 自我挑戰組 DAY 5

技術 Day 5|檔案路徑與存取外部資料

  Pandas 的優勢在於可以處理大型數據,方便使用者觀察和分析,但處理數據前需要先載入資料,因此,本文將說明如何透過檔案路徑讀取外部資料,內容包含: 介紹...

鐵人賽 AI & Data DAY 4

技術 『Day4』資料工程師所需之技能

作為資料工程師,或說是負責處理資料工程的角色,我們需要具備什麼能力呢?其實從過去到現在的資料工程師的角色,隨著應用的不同以及工具的演變,資料工程師的角色默默的在...

鐵人賽 自我挑戰組 DAY 4

技術 Day 4|資料結構 - DataFrame 篇

  上一篇文章中,介紹了 Pandas 中的 Series 結構,今天要和大家聊聊 Pandas 中最常使用的資料結構——DataFrame,其概念和操作都和...

鐵人賽 AI & Data DAY 3

技術 『Day3』Data team 的組成以及資料工程師的角色

團隊的合作方式從古至今總是不斷的演變當中,雖然工程師的歷史並沒有很長,但是變化卻十分快速。就像是網站工程師一般,過去也沒有這麼細分為前端禍後端,常常每個人都是全...

鐵人賽 自我挑戰組 DAY 3

技術 Day 3|資料結構 - Series 篇

  學習撰寫程式時,常會遇到資料結構(Data Structure)這個詞彙,指的是如何用最有利的型態儲存或組織資料,並將其存在記憶體當中,以便電腦更有效率的使...

鐵人賽 AI & Data DAY 2

技術 『Day 2』什麼是 Data Engineering

記得在學生時期,我因為對於學校的選課網站操作不太習慣,於是便自己寫了一個簡單的爬蟲程式,用來自動抓取課程資訊和教師評價。經整理後,我和朋友合作設計了一個使用者友...

鐵人賽 自我挑戰組 DAY 2

技術 Day 2|環境安裝 - Python、VS Code、Pandas

  決定寫文章後,發現撰寫Pandas的環境有許多種,有人會用 Anaconda 搭配 Jupyter Notebook,有人直接使用 VS Code ,也有人...

鐵人賽 自我挑戰組 DAY 1

技術 Day 1|Pandas 開賽!

嗨!大家好!我是Eva!一位正努力跨進資料科學領域的女子!這是我首次撰寫技術文章,也是第一次挑戰30天日更,希望能挑戰成功!第一篇文章,就讓我簡單介紹參賽動機、...

技術 How Modern Customer Success Is Powered by Data Science

Every day, customer success teams interact with tens of thousands of customers....

技術 A Complete Guide on How to Become a Tableau Developer

Tableau has the fastest growth and most widespread acceptance among the differen...

鐵人賽 AI & Data DAY 30

技術 [Day 30] Booking.com 從成功模型中學到的經驗(下)及賽末心得

今天的文章中,我們會延續昨天的題目,聊聊 Booking.com 在模型上線後發現的有趣現象。最後,我會再跟大家分享經過這 30 天的鐵人挑戰賽後,我學到的事,...

鐵人賽 AI & Data DAY 29

技術 [Day 29] Booking.com 從成功模型中學到的經驗(上)

終於到了鐵人賽的尾聲,在經過一個月、看過各大公司依據不同目的、場景設計的演算法後,我們學到了什麼呢?而每間公司在研發並使用各式各樣的模型後,有沒有什麼珍貴的經驗...

鐵人賽 AI & Data DAY 28

技術 [Day 28] Pinterest 如何用機器學習打造更健康的評論系統

對社群網站而言,使用者積極的互動是非常重要的一環。因此,打造一個用戶能夠安心發文、建全的評論環境更是不可忽視的重要任務。社群網站往往會提供用戶檢舉貼文的選項,以...

鐵人賽 AI & Data DAY 27

技術 [Day 27] Dropbox 的圖片搜尋演算法

本篇文章使用的圖片皆來自於 Dropbox 的文章 How image search works at Dropbox。 國慶連假後的上班日,Skylar...

鐵人賽 AI & Data DAY 26

技術 [Day 26] Airbnb 使用 ResNet50 標記房間圖片

在國慶連假時,Skylar 使用 Airbnb 預定出遊的住宿地點。而在入住後,他發覺和當初在網站上看到的照片並無二致,圖片品質很好且很精確,也會依照不同房型分...

鐵人賽 AI & Data DAY 25

技術 [Day 25] Spotify 使用 NLP 以助於 Podcast 搜尋

近幾年,Podcast 越發熱門,Spotify 的用戶也越來越頻繁地使用關鍵字搜尋相關節目,希望找到自己有興趣的 Podcast 內容。不過,Podcast...

鐵人賽 AI & Data DAY 24

技術 [Day 24] Pinterest 生成推薦內容的方法(四)- PinnerFormer

我們昨天介紹 Pinterest 的推薦系統 PinnerSage,不過那是 2020 年的文章。身為不斷創新的 Pinterest 公司,在 2022 年又提...

鐵人賽 AI & Data DAY 23

技術 [Day 23] Pinterest 生成推薦內容的方法(三)- PinnerSage

昨天我們認識 Pinterest 使用 PinSage 演算法,將每個 pin 和 board 轉成 embedding。不過,只是轉成 embedding 還...

鐵人賽 AI & Data DAY 22

技術 [Day22] Pinterest 生成推薦內容的方法(二)- PinSage

昨天我們一起認識了 random walk 這個方法,Pinterest 在實務上是如何利用這個技術的呢?讓我們今天一起來看 他們提出的 PinSage 演算法...

鐵人賽 AI & Data DAY 21

技術 [Day21] Pinterest 生成推薦內容的方法(一)- RandomWalk

Skylar 和 Krsitina 最近想要重新裝潢他們家,因此閒來無事時就會到 Pinterest 上看別人分享的裝潢照片作為參考。另外,Krsitina 也...

鐵人賽 AI & Data DAY 20

技術 [Day 20] 購物網站處理詐騙攻擊的方式

在昨天的文章中,我們聊到 Uber 如何使用 RADAR 系統偵測詐騙行為。今天,讓我們再擴大應用場域,看看跟現今生活密不可分的購物網站是如何處理詐騙問題吧!...