大家好:因近期要教同事使用R.studio與python等工具,所以在youtube上建立了"數據分析の大小事"頻道,主要是想跟大家分享數據...
於上一篇,我們懂得如何歸類故事類別,那麼今天將帶大家用機器學習模型對新故事進行分類!我們開始執行吧~ 匯檔→預處理→增加文字轉換成數值之屬性 這邊跟上一篇一樣,...
昨天介紹完打擊,今天接下來介紹投球,不過其實大多數的參數都滿像的,但投手的 methods 多打者滿多的,一起來瞧瞧吧。 statcast_pitcher 跟昨...
昨天簡單介紹了 pybaseball,接下來我會介紹平常使用的開發環境與工具,希望能讓大家在起步用 Python 進行棒球分析更順利。 Jupyter Note...
Baseball Reference (簡稱:BR) 是在 2000 年由 Sean Forman 在他讀博士期間所建立的棒球數據網站。後來 2004 年 Fo...
之前幾篇介紹關於 pybaseball 裡使用 Baseball Reference 資料的 functions,在文章內容裡也有包含一些進階數據的介紹,今天會...
更多的 Pandas Pandas包含多個內置函數,如sum、mean、max、min等,我們可以應用到 DataFrame 或分組數據中。他可以提高你在數據處...
您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教
這跟我聽到的不太一樣 『先別急著學 Python 』這個主題與大家的直觀理解會有蠻大的反差,但是以我作為一個資料分析師,對於想要進入數據入門的人的建議,是先把...
您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 library(naniar) data(iris) any_na(iris) #前置1: chk NA...
在上一篇中,我們是將許多張未分類過的圖像數據,讓電腦幫我們分類與查看它們之間的相似度(屬於無監督式學習);那麼今天,就是要將另外一群已分類好之圖像數據,進行模型...
掌握企業財務命脈,是確保企業穩健運營與持續發展的關鍵。財務指標作爲衡量企業財務狀況的標尺,其重要性不言而喻。今天,我們將深入揭祕16個常用的財務指標,這些指標全...
您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教
大家以為前幾天介紹完產品從無到有的過程,就已經完成一個完整的軟體開發流程了嗎?如果是的話那你就大錯特錯了,在完成專案管理讓開發完的產品順利上線後,是另一個新的開...
您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教
處理缺失數據 真實的數據很少是乾淨的。更常見的情況是,很多有意思的數據集都有很多的數據缺失。更複雜的是,不同的數據源可能有著不同指代缺失數據的方式,我們會將這些...
您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教 #影片程式碼 #延續DAY20 set.seed(123) model <...
如果用 Python 處理鐵達尼號的資料會是什麼樣子? 前幾篇文章的內容中我們已經利用 Excel 來處理鐵達尼號的資料集,試著判斷出不同的標頭資料,也進行了樣...
在正式開始介紹數據功能前,我想先介紹 pybaseball 的球員 ID 搜尋功能。因為各大網站辨別球員的方式會有所不同,所以我們需要先獲得相對應的球員 ID...
這聽起來很酷,但是我該怎麼訓練解題過程 對於數據分析師我覺得最容易訓練解題過程的方式就是利用 Kaggle,我相信數據分析師對於 Kaggle 應該不會太陌生,...
進階樞紐分析表 Pivot table 回歸昨天提到的,大多數人可能都有在Excel中使用透視表的經驗。 Pandas 提供了一個類似的函數,叫做 Pivot_...
產品的反覆運算更新除了要滿足更多的使用場景,很多時候也是為了優化某些功能,尤其是一些細節方面的優化,往往能帶來工作效率的極大提升。 比如已經升級FineRepo...
布朗尼 Chocolate brownie 邁入倒數的五天了,轉眼間發現30天的挑戰賽其實過得非常快,許多內容皆在轉眼間。而最後一篇章節我所要講的主題稱為布朗尼...
在上一篇我們有用到K-means把數據分群以及視覺化其分群效果,但若是沒先了解過K-means的你,經由上篇應該還沒有很懂它的運作方式吧,今天我將帶你一同了解其...
試算表的樞紐分析 Sheet of Pivoting Table 之前在完成介紹完工作流程階段與異常值糾正後,使用了 Python 進行樞紐分析(Pivotin...
倒數兩天啦~今天要讓大家自己找檔案試試前幾集以故事為主題的教學,那就直接來囉! 選檔 這次大家可以選幾個類別的故事或文章,接著將它們用txt或tab檔存於檔案中...
這是一個數位化的世界。隨著越來越多數位設備的使用,大量的資料也隨之產生,而這麼多的原始資料就需要進行整理、分析、產生新的洞見,資料才會變成資訊,進而促使我們行動...
今天我們要來探索新插件!又是個實作日了,準備好,我們就開工啦~ 安裝並重新開啟 首先,我們至Orange上的工作列表點選「Options」,再來點選其中最下面的...
工具的使用取決於你 How to use tools 工具的使用是數據分析師一大利器,生活中已經有非常多好用的工具了,但是選擇最適合當下情況的工作才能夠事半功倍...