iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

1 Like 0 留言 6858 瀏覽

鐵人賽 AI & Data

爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰系列第 32 篇

技術【Day 31】在 Scrapy 中操作瀏覽器

在 Day 21 的內容中有介紹 Selenium 和 puppeteer 兩種在程式中操作瀏覽器的方式，今天來看看怎麼在 Scrapy 中使用。 Seleni...

Rex Chien ‧ 2019-10-18

2 Like 0 留言 7968 瀏覽

鐵人賽 AI & Data

爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰系列第 31 篇

技術【Day 30】在程式中啟動 Scrapy 爬蟲

目前為止我們都是用 scrapy crawl <spider-name> 指令來啟動爬蟲，但有時候可能需要在程式中來啟動爬蟲（例如提供一個 API...

Rex Chien ‧ 2019-10-17

1 Like 1 留言 1456 瀏覽

鐵人賽 Software Development DAY 30

30 天把自己榨好榨滿的四週四語言大挑戰！系列第 30 篇

技術 [Day 29] 一起做事效率高

今天是鐵人賽的最後一天了。老實說每天要四個語言實在是有點太高估自己的時間狀況，加上 Context Switch 的成本，導致過程之中許多時候都只能先寫部分再慢...

ryanyang1221 ‧ 2019-10-16

0 Like 0 留言 1724 瀏覽

鐵人賽 Software Development DAY 29

30 天把自己榨好榨滿的四週四語言大挑戰！系列第 29 篇

技術 [Day 28] 來看正規表示式

今天要來看看一個大家應該不會太陌生，但對我來說每次只要一久不用就會忘掉的正規表示式 (Regular expression)。正規表示式在處理複雜規則的字串很有...

ryanyang1221 ‧ 2019-10-15

2 Like 2 留言 1173 瀏覽

鐵人賽 Modern Web DAY 30

用Python開發的網頁不能放到Github上？Lektor說可以！！系列第 30 篇

技術完賽，是另一個階段的開始！

晃眼間，就到鐵人賽最後一天。經過一個月的努力，也讓我深入瞭解Lektor的功能，最後也成功地完成一開始訂下的目標：『將Lektor網頁部署到GitHub上。』...

塔塔墨 ‧ 2019-10-15 ‧團隊Amos的推坑教2.0

1 Like 0 留言 4636 瀏覽

鐵人賽 AI & Data DAY 30

爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰系列第 30 篇

技術【Day 29】在 Scrapy 中處理請求和回應 - Downloader Middlewares

在 Day 22 的文章中有提到 Scrapy Engine 和 Downloader 間的資料傳遞會經過一系列的 Downloader Middlewares...

Rex Chien ‧ 2019-10-14

1 Like 0 留言 1816 瀏覽

鐵人賽 Modern Web DAY 29

用Python開發的網頁不能放到Github上？Lektor說可以！！系列第 29 篇

技術他，是Github的好夥伴

說的其實就是Travis-CI，提供github持續整合專案的平台。設定Travis-CI部署的方式共分4個步驟： .travis.yml .lekto...

塔塔墨 ‧ 2019-10-14 ‧團隊Amos的推坑教2.0

0 Like 0 留言 7700 瀏覽

鐵人賽 Software Development DAY 28

30 天把自己榨好榨滿的四週四語言大挑戰！系列第 28 篇

技術 [Day 27] 自己的程式自己測

先前寫了那麼多程式，是時候來談談測試了。這裡的測試指的是 Unit test，大部分的時間是以一個 Function、Class 等等為單位去測試，看輸入幾組設...

ryanyang1221 ‧ 2019-10-14

1 Like 0 留言 3381 瀏覽

鐵人賽 AI & Data DAY 29

爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰系列第 29 篇

技術【Day 28】Item Pipelines 應用 - 儲存資料到 MongoDB

延續昨天的主題，今天要建立一個 Pipeline 元件，用來將爬到的資料存到 MongoDB 中。建立 Pipeline 元件在專案目錄的 pipeline...

Rex Chien ‧ 2019-10-13

1 Like 0 留言 1852 瀏覽

鐵人賽 Modern Web DAY 28

用Python開發的網頁不能放到Github上？Lektor說可以！！系列第 28 篇

技術你問我Lektor愛Github有多深？

Lektor 在GitHub Pages支援上比GitLab還要好一點，可以不用自己手動push上去，與前幾天提到的ftp、rsync一樣，可以直接在.lekt...

塔塔墨 ‧ 2019-10-13 ‧團隊Amos的推坑教2.0

1 Like 0 留言 2910 瀏覽

鐵人賽 Software Development DAY 26

30 天把自己榨好榨滿的四週四語言大挑戰！系列第 26 篇

技術 [Day 25] 與時間複雜度的競賽

今天 Hackerrank 的主題是探討時間複雜度，透過的題目是給定一個整數，看看這個整數是不是質數。假設這個質數是 n 的話，希望解法的時間複雜度是 O(根號...

ryanyang1221 ‧ 2019-10-12

0 Like 0 留言 1715 瀏覽

鐵人賽自我挑戰組 DAY 27

猶豫就會敗北，果斷就會白給｜園藝 boy 的生物資訊冒險記趣，跟上學術潮流不走冤望路 feat. RNA-Sick 系列第 27 篇

技術 RNA-Sick@Day27 > 嘴巴說可以，身體卻一點也不老實啊｜程式碼筆記本保證研究可再現性 feat. NextJournal

每次遇到宣稱很棒很優秀實際上傲嬌不給用的軟體實在是很困擾啊生物資訊研究中，研究者時常需要自己編寫客製化的程式碼腳本。不論是視覺化或是統計分析的功能，通常都是引...

Chen (Benjamin) Hsieh ‧ 2019-10-12

1 Like 0 留言 3685 瀏覽

鐵人賽 AI & Data DAY 28

爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰系列第 28 篇

技術【Day 27】在 Scrapy 中處理爬取結果 - Item Pipelines

當 scrapy.Spider 爬蟲抓到資料後，會將資料送往 Item Pipelines 進行一系列的處理。常見的使用情境是：清理 HTML 資料驗證資...

Rex Chien ‧ 2019-10-12

0 Like 0 留言 4694 瀏覽

鐵人賽 Software Development DAY 27

30 天把自己榨好榨滿的四週四語言大挑戰！系列第 27 篇

技術 [Day 26] 以組合代替繼承？

老實說今天 Hackerrank 的主題讓我有點不想浪費一天的篇幅去講，因為是在講 Nested Logic，說穿了就只是要你練習兩層以上的 If Else 之...

ryanyang1221 ‧ 2019-10-13

1 Like 0 留言 1668 瀏覽

鐵人賽 Modern Web DAY 27

用Python開發的網頁不能放到Github上？Lektor說可以！！系列第 27 篇

技術 Git界的狐狸，與Lektor也有聯盟！！

在git平台中，比較著名的Github及GitLab兩大平台，Lektor都有提供部署方法。當然除了這兩個平台，還有Bitbucket等強大的平台，只是目前Le...

塔塔墨 ‧ 2019-10-12 ‧團隊Amos的推坑教2.0

0 Like 0 留言 1327 瀏覽

鐵人賽 Software Development DAY 25

30 天把自己榨好榨滿的四週四語言大挑戰！系列第 25 篇

技術 [Day 24] 一條獨一無二的鏈

今天在 Hackerrank 的主題是，延續我們之前研究的 Linked list，為這個 Linked list 去增加一個 Function 來把 Link...

ryanyang1221 ‧ 2019-10-11

1 Like 0 留言 3505 瀏覽

鐵人賽 AI & Data DAY 27

爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰系列第 27 篇

技術【Day 26】Scrapy 的結構化資料 - Item

在前幾天的爬蟲中，我們都是以 Python dict 的結構在儲存爬取結果，隨著爬蟲數量增加，會在越來越多的程式中使用到相同的結構來儲存資料，但同時也容易在不同...

Rex Chien ‧ 2019-10-11

1 Like 0 留言 1417 瀏覽

鐵人賽 Modern Web DAY 26

用Python開發的網頁不能放到Github上？Lektor說可以！！系列第 26 篇

技術沒在用FTP？沒關係，我們還有更厲害的武器！

FTP相對來說是比較不安全的傳輸方式，而SSH可以提供安全的傳輸管道。 SSH以非對稱加密實現身分驗證。身分驗證有多種途徑，例如其中一種方法是使用自動生成的公鑰...

塔塔墨 ‧ 2019-10-11 ‧團隊Amos的推坑教2.0

0 Like 0 留言 8083 瀏覽

鐵人賽 Software Development DAY 24

30 天把自己榨好榨滿的四週四語言大挑戰！系列第 24 篇

技術 [Day 23] 再好好看看這棵樹

今天的主題是延續昨天的 Binary Search Tree，我們要來看其中一種 Traversal 的方法，所謂 Traversal 就是用某種順序來走訪 B...

ryanyang1221 ‧ 2019-10-10

1 Like 0 留言 3947 瀏覽

鐵人賽 AI & Data DAY 26

爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰系列第 26 篇

技術【Day 25】用 Scrapy 爬取 iT 邦幫忙的技術文章

大概兩個禮拜前我們已經有用 requests + BeautifulSoup 兩個套件來把文章爬取下來了，今天會把相關的邏輯都移植到 Scrapy 框架中。先附...

Rex Chien ‧ 2019-10-10

1 Like 0 留言 1710 瀏覽

鐵人賽 Modern Web DAY 25

用Python開發的網頁不能放到Github上？Lektor說可以！！系列第 25 篇

技術古董級的傳輸協定！FTP部署方法

從小時候就存在的FTP，現在依舊還是偶爾會使用到。貼心的Lektor也提供FTP部署的設定： [servers.production] target = ftp...

塔塔墨 ‧ 2019-10-10 ‧團隊Amos的推坑教2.0

1 Like 0 留言 1073 瀏覽

鐵人賽 Modern Web DAY 24

用Python開發的網頁不能放到Github上？Lektor說可以！！系列第 24 篇

技術一條龍的服務，發布專案依舊不馬虎

接下來終於要進入正題了。前面介紹完Lektor基本功能後，也需要介紹部署到github的方法，不然怎麼符合一開始的目標呢！在部署的時候有兩個步驟，第一個為bu...

塔塔墨 ‧ 2019-10-09 ‧團隊Amos的推坑教2.0

0 Like 0 留言 3855 瀏覽

鐵人賽 Software Development DAY 23

30 天把自己榨好榨滿的四週四語言大挑戰！系列第 23 篇

技術 [Day 22] 種下一棵有用的樹

今天我們要來看的是 Binary Search Tree (BSTs)。Tree 是由有限節點組成具有層次關係的集合。以下圖為例，最上面的節點稱作根節點 (Ro...

ryanyang1221 ‧ 2019-10-09

2 Like 0 留言 6486 瀏覽

鐵人賽 AI & Data DAY 25

爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰系列第 25 篇

技術【Day 24】第一個 Scrapy 爬蟲

昨天用 scrapy genspider ithome ithome.com 指令建立出來的爬蟲檔案 ithome.py 內容是這樣： import scrap...

Rex Chien ‧ 2019-10-09

0 Like 0 留言 5077 瀏覽

鐵人賽 Software Development DAY 22

30 天把自己榨好榨滿的四週四語言大挑戰！系列第 22 篇

技術 [Day 21] 什麼類型都可以

今天要來談談 Generic。由於靜態語言對於宣告的類型有嚴格的規定，Generic 的出現則是讓這件事情變得更加彈性，可以將一套程式碼複用在不同類型的資料上。...

ryanyang1221 ‧ 2019-10-08

1 Like 0 留言 3728 瀏覽

鐵人賽 AI & Data DAY 24

爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰系列第 24 篇

技術【Day 23】準備 Scrapy 開發環境

安裝安裝套件 pipenv install scrapy 曾經在安裝的時候遇到 Twisted 一直安裝失敗，無法透過 pip 安裝。如果有遇到的讀...

Rex Chien ‧ 2019-10-08

1 Like 0 留言 1168 瀏覽

鐵人賽 Modern Web DAY 23

用Python開發的網頁不能放到Github上？Lektor說可以！！系列第 23 篇

技術 Lektor強身健骨丸，建構你的強大model觀

在lektor中，model扮演著很重要的角色(當然content及template也是)。接下來會以models/page.ini檔案作為範例，說明model...

塔塔墨 ‧ 2019-10-08 ‧團隊Amos的推坑教2.0

0 Like 0 留言 2612 瀏覽

鐵人賽自我挑戰組 DAY 22

猶豫就會敗北，果斷就會白給｜園藝 boy 的生物資訊冒險記趣，跟上學術潮流不走冤望路 feat. RNA-Sick 系列第 22 篇

技術 RNA-Sick@Day22 > 誰能阻止少年專題生呢？他們聽不到｜用程式上 NCBI 資料庫 feat. NCBI Entrez

請證明你不是機器人繪製親緣關係樹的前置工作中，搜集所有適合一起比對的基因之序列是十分累人的工作。我不寫程式以前，會找一首喜歡的專輯，放著聽，然後開始開啟大量瀏...

Chen (Benjamin) Hsieh ‧ 2019-10-07

1 Like 0 留言 4395 瀏覽

鐵人賽 AI & Data DAY 23

爬蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰系列第 23 篇

技術【Day 22】Scrapy 簡介

寫了好幾天的爬蟲，不知道大家有沒有感覺同一支程式中要關注的事情太多。目前我們爬蟲的流程大概是這樣：發送請求，取得網頁 HTML 原始碼可能需要額外的重試...

Rex Chien ‧ 2019-10-07

0 Like 0 留言 3956 瀏覽

鐵人賽 Software Development DAY 21

30 天把自己榨好榨滿的四週四語言大挑戰！系列第 21 篇

技術 [Day 20] 把東西給我排好

今天我們要來談談 Sorting，也就是排序。排序看似不起眼，但其實在電腦的世界扮演了許多關鍵的角色，例如當我們要更有效率地搜尋出某個東西的時候，又例如我們要按...

ryanyang1221 ‧ 2019-10-07

技術 【Day 31】在 Scrapy 中操作瀏覽器

技術 【Day 30】在程式中啟動 Scrapy 爬蟲

技術 [Day 29] 一起做事效率高

技術 [Day 28] 來看正規表示式

技術 完賽，是另一個階段的開始！

技術 【Day 29】在 Scrapy 中處理請求和回應 - Downloader Middlewares

技術 他，是Github的好夥伴