假設的資料存檔為 data1.txt 內容如下: 1 22 2 56 3 87 4 6 5 46 6 56 7 59 8 84 9 90 10...
將昨天的亂數資料檔再新增一行亂數.取名為data2.txt 如: 1 22 37 2 56 20 3 87 79 4 6 46 5...
Gnuplot有多種輸出格式,我們可以直接指定輸出為 png格式,並且可以設定字型. 在此我們選用pngcairo,這會使用cairo來繪製, 圖形會比較漂亮,...
雖然好的模型和參數可以提高成效,但通常最關鍵還是資料本身。基本上資料的品質決定了八成以上模型的成效,因此大家有必要對自己的資料有所認識和了解。 而在做機器學習的...
Gnuplot 可以使用對數座標. 範例如下: set term pngcairo font "SetoFont" set output &...
進入互動模式: unset key f(x,y)=sin(sqrt(x*x+y*y))/sqrt(x*x+y*y) set xlabel "X&quo...
CSV檔是我們資料處理時蠻好用的格式, 現在有人開發出一套csvkit,裡面包含好幾個好用的指令. 因為他是使用Python開發的,我們使用Python的安裝工...
前面有介紹過Gnuplot,可以畫出漂亮的圖形. 也看到要下一些指令,進行設定. 可是有時候我們只是想要快速的畫出一些簡單的圖形. 而且可以在命令列裡面直接,簡...
先使用 multiplot 縱向數目,橫向數目 設定即可 進入互動模式 unset key set term pngcairo font "Anony...
有時候需要使用箭頭來提示. 今天的範例就使用了箭頭,加上文字label來說明. 並且在最大值處畫個醒目的點,我們使用了色碼, 來指定顏色. 而且指定了比較萌一點...
結語 在前面的29天中,從資料庫的一些案例出發,裡面 有產生大量測試資料的方法,也有一些比較有點 難度,但是在系統實務上很有用的案例,這部份 我只提出一些Tab...
從這裡開始,開始需要執行程式。在之後的範例裡面,我們會把所有的 functions 都先放在 TaggingMain_Sample.java 裡。 文章列表為了...
前言 遺失值(Missing Value)資料的插補也是訓練模型前資料清洗重要的一環,在進行資料分析時資料常常是不完善的,因此需要有一些方法來處理資料遺失的狀況...
在第15天時有討論資料處理的一些項目與過程. 其中一項是從網路上擷取資料. 從網路上擷取資料的方式很多,今天要介紹 curl. 我們從古騰堡計畫的網站來擷取馬基...
再接再厲,繼續研究csvkit這好東西. 找出我們想要的資料 一般的UNIX指令是grep;在SQL中是用where. csvkit中提供了csvgrep. 來...
經過前面幾天的SQL範例以及plot範例, 鐵人賽也到中間了. 今天來談一下關於資料處理的一些項目與過程. 1.獲得資料 從別的地方下載資料,例如從網頁擷取....
最近很流行且通用的資料格式 json, csvkit也提供了csv轉換到json 的tool,叫 csvjson. 來看以下的範例: $ csvcut -c c...
昨天探討到使用[0-9]這樣的方式來代表數字的範圍. 今天接著探討範圍. In [1]: import re In [2]: re.search("...
今天來討論一下排除及簡記法. 在之前例子中,多是使用列舉, 在一些情況下用排除會比較方便. 來看以下的例子 In [1]: import re In [2]:...
今天介紹量詞(quantifier) 先來看以下基本例子 In [1]: import re In [2]: re.search(r"^\d\d\d...
目標 我相信大家在成為軟體工程師前就有接觸excel來查閱或整理資料了~ 在工作中看過奇怪的 資料怪談(空白、資料不齊全、檔案無法下載、無法解析...等)...
基本架構 1.找出問題2.思考是否真的需要使用機器學習?3.資料收集4.資料前處理5.特徵工程6.模型訓練7.模型評估8.微調模型&參數9.預測&...
完整程式碼! https://github.com/yu-ken0207/PascalVOCtoYolo 將Pascal VOC格式的標註轉換為YOLO格式 要...
目標 這個專案的目標主要是為了處理excel以及Libreoffice - Calc (ODS格式)表個文件的專案 因為表格文件在我們日常生活中廣泛應用除了文...
目標說明 經過昨天的檔案操作後想要帶大家更更進階的操作~ 工作中常用的excel技能 根據工作中大大的要求大概可以定義成這兩項技能會拆解成兩大項:1.資料的...