iT邦幫忙

tag不存在或已被下架!

數據分析相關文章
共有 194 則文章

技術 數據分析youtube頻道

大家好:因近期要教同事使用R.studio與python等工具,所以在youtube上建立了"數據分析の大小事"頻道,主要是想跟大家分享數據...

鐵人賽 AI & Data DAY 27

技術 〔Day27〕用線性迴歸預測童話故事的類別-Logistic Regression

於上一篇,我們懂得如何歸類故事類別,那麼今天將帶大家用機器學習模型對新故事進行分類!我們開始執行吧~ 匯檔→預處理→增加文字轉換成數值之屬性 這邊跟上一篇一樣,...

鐵人賽 Software Development DAY 12

技術 Day 12 - Statcast 投球篇

昨天介紹完打擊,今天接下來介紹投球,不過其實大多數的參數都滿像的,但投手的 methods 多打者滿多的,一起來瞧瞧吧。 statcast_pitcher 跟昨...

鐵人賽 Software Development DAY 2

技術 Day 02 - 環境設置

昨天簡單介紹了 pybaseball,接下來我會介紹平常使用的開發環境與工具,希望能讓大家在起步用 Python 進行棒球分析更順利。 Jupyter Note...

鐵人賽 Software Development DAY 17

技術 Day 17 - Baseball Reference 介紹

Baseball Reference (簡稱:BR) 是在 2000 年由 Sean Forman 在他讀博士期間所建立的棒球數據網站。後來 2004 年 Fo...

鐵人賽 Software Development DAY 21

技術 Day 21 - Baseball Reference 進階數據解釋

之前幾篇介紹關於 pybaseball 裡使用 Baseball Reference 資料的 functions,在文章內容裡也有包含一些進階數據的介紹,今天會...

鐵人賽 AI & Data DAY 10

技術 Ɖ10-榫卯/ 利用分組 Python 方式計算加權平均數

更多的 Pandas Pandas包含多個內置函數,如sum、mean、max、min等,我們可以應用到 DataFrame 或分組數據中。他可以提高你在數據處...

鐵人賽 影片教學 DAY 2
R語言-預測方法大全 系列 第 2

技術 [Day-2] 預測觀念1-名詞&流程簡介

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教

鐵人賽 影片教學 DAY 16
R語言-預測方法大全 系列 第 16

技術 [Day-16] 集成學習簡介(ensemble learning introduction)

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教

鐵人賽 AI & Data DAY 1

技術 Ɖ1-序/ 先別急著學 Python

這跟我聽到的不太一樣 『先別急著學 Python 』這個主題與大家的直觀理解會有蠻大的反差,但是以我作為一個資料分析師,對於想要進入數據入門的人的建議,是先把...

鐵人賽 影片教學 DAY 8

技術 [Day-8] R語言 - K - means 實作 ( K - means in R.Studio)

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 library(naniar) data(iris) any_na(iris) #前置1: chk NA...

鐵人賽 AI & Data DAY 24

技術 〔Day24〕零程式的圖像分析(二)-Classification

在上一篇中,我們是將許多張未分類過的圖像數據,讓電腦幫我們分類與查看它們之間的相似度(屬於無監督式學習);那麼今天,就是要將另外一群已分類好之圖像數據,進行模型...

技術 掌握財務命脈:揭祕16個常用的財務指標

掌握企業財務命脈,是確保企業穩健運營與持續發展的關鍵。財務指標作爲衡量企業財務狀況的標尺,其重要性不言而喻。今天,我們將深入揭祕16個常用的財務指標,這些指標全...

鐵人賽 影片教學 DAY 6

技術 [Day-6] R語言 - 怎麼選 分群群數 & 距離? ( Clustering Distance & Index )

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教

鐵人賽 Software Development DAY 9

技術 軟體開發後的成效追蹤方式

大家以為前幾天介紹完產品從無到有的過程,就已經完成一個完整的軟體開發流程了嗎?如果是的話那你就大錯特錯了,在完成專案管理讓開發完的產品順利上線後,是另一個新的開...

鐵人賽 影片教學 DAY 29
R語言-預測方法大全 系列 第 29

技術 [Day-29] 預測觀念9-提升模型準確度(minimize predict error)

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教

鐵人賽 AI & Data DAY 29

技術 Ɖ29-布朗尼/ Pandas 的缺失值處理與應用

處理缺失數據 真實的數據很少是乾淨的。更常見的情況是,很多有意思的數據集都有很多的數據缺失。更複雜的是,不同的數據源可能有著不同指代缺失數據的方式,我們會將這些...

鐵人賽 影片教學 DAY 21
R語言-預測方法大全 系列 第 21

技術 [Day-21] 預測操作--xgb-下 (xgb predict in r)

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教 #影片程式碼 #延續DAY20 set.seed(123) model &lt...

鐵人賽 AI & Data DAY 5

技術 Ɖ5-根/ 鐵達尼號的 Python 的資料型態應用

如果用 Python 處理鐵達尼號的資料會是什麼樣子? 前幾篇文章的內容中我們已經利用 Excel 來處理鐵達尼號的資料集,試著判斷出不同的標頭資料,也進行了樣...

鐵人賽 Software Development DAY 3

技術 Day 03 - 球員 ID 搜尋

在正式開始介紹數據功能前,我想先介紹 pybaseball 的球員 ID 搜尋功能。因為各大網站辨別球員的方式會有所不同,所以我們需要先獲得相對應的球員 ID...

鐵人賽 AI & Data DAY 3

技術 Ɖ3-根/ 鐵達尼號的 Excel 特徵分類與異常值偵測

這聽起來很酷,但是我該怎麼訓練解題過程 對於數據分析師我覺得最容易訓練解題過程的方式就是利用 Kaggle,我相信數據分析師對於 Kaggle 應該不會太陌生,...

鐵人賽 AI & Data DAY 20

技術 Ɖ20-溫沙拉/ 進階樞紐分析表

進階樞紐分析表 Pivot table 回歸昨天提到的,大多數人可能都有在Excel中使用透視表的經驗。 Pandas 提供了一個類似的函數,叫做 Pivot_...

技術 FineReport10.0的這12個更新,能讓你的工作效率提高3倍!

產品的反覆運算更新除了要滿足更多的使用場景,很多時候也是為了優化某些功能,尤其是一些細節方面的優化,往往能帶來工作效率的極大提升。 比如已經升級FineRepo...

鐵人賽 AI & Data DAY 25

技術 Ɖ25-布朗尼/ Numpy 多維陣列呈現

布朗尼 Chocolate brownie 邁入倒數的五天了,轉眼間發現30天的挑戰賽其實過得非常快,許多內容皆在轉眼間。而最後一篇章節我所要講的主題稱為布朗尼...

鐵人賽 AI & Data DAY 21

技術 〔Day21〕了解K-means的底層運作-Educational

在上一篇我們有用到K-means把數據分群以及視覺化其分群效果,但若是沒先了解過K-means的你,經由上篇應該還沒有很懂它的運作方式吧,今天我將帶你一同了解其...

鐵人賽 AI & Data DAY 4

技術 Ɖ4-根/ 鐵達尼號的 Excel 樞紐分析表

試算表的樞紐分析 Sheet of Pivoting Table 之前在完成介紹完工作流程階段與異常值糾正後,使用了 Python 進行樞紐分析(Pivotin...

鐵人賽 AI & Data DAY 28

技術 〔Day28〕看看Orange將故事或文章分類的小技巧吧!

倒數兩天啦~今天要讓大家自己找檔案試試前幾集以故事為主題的教學,那就直接來囉! 選檔 這次大家可以選幾個類別的故事或文章,接著將它們用txt或tab檔存於檔案中...

技術 AWS的大數據分析-Part 1資料收集

這是一個數位化的世界。隨著越來越多數位設備的使用,大量的資料也隨之產生,而這麼多的原始資料就需要進行整理、分析、產生新的洞見,資料才會變成資訊,進而促使我們行動...

鐵人賽 AI & Data DAY 16

技術 〔Day16〕探索新插件-Bioinformatics

今天我們要來探索新插件!又是個實作日了,準備好,我們就開工啦~ 安裝並重新開啟 首先,我們至Orange上的工作列表點選「Options」,再來點選其中最下面的...

鐵人賽 AI & Data DAY 6

技術 Ɖ6-根/ 鐵達尼號的 Python 的樞紐分析應用

工具的使用取決於你 How to use tools 工具的使用是數據分析師一大利器,生活中已經有非常多好用的工具了,但是選擇最適合當下情況的工作才能夠事半功倍...