在本日,我要展示的是該如何使用排程工作與爬蟲案例1-1專案做結合,所以今日會著重在以下幾點:
首先,我們要將排程設定方法以Linux作業系統為例,排程工作通常都是要先設定指定日期,再來是對應的工作,通常都是一個指令,命令。
首先,先把我們要的Docker爬蟲環境跑起來
docker run --name=php_crawler -d -it php_crawler bash
接著把lab1-1.php
程式複製到Docker爬蟲環境。用以下指令:
docker cp lab1-1.php php_crawler:/root/
接著,設定排程設定檔,這時候是要打開在host上面的排程設定檔,利用下面的設定檔打開:
sudo crontab -e
打開之後,會看到如下的設定檔:
接著,在最下面加上一行排程工作,那一行如下:
0 * * * * docker exec php_crawler php lab1-1.php
上述代表的是說,在每個小時去執行lab1-1.php
程式,意思就是去擷取指定的學校最新的消息。
接著,這樣排程工作就達成了。
因為一天的章節無法把案例整合完整的使用,這邊用描述方式表示,案例整合可以更深入如下:
本案例整合是透過排程將lab1-1.php
做結合,讓其有個固定時間會抓取學校最新消息資料,再更進一步工作,是可以更新到指定的資料表。