iT邦幫忙

0

爬取網頁、產生CSV檔案、匯入WooCommerce

  • 分享至 

  • xImage
  •  

由於最近接到一個廚具經銷商,要架設一個商品型錄網站(採用 WordPress + WooCommerce),商品資料要從原廠網站抓取,所以才會有這一系列的文章,這一篇的進度是透過 Python 寫的爬蟲工具,抓取原廠官網上的商品資料,並寫成一個可用來匯入 WooCommerce 網站的 CSV 商品檔案。

雖然此次的工作,是爬取廚具原廠的商品,自動轉換成經銷商架設的網站,但其實很多的行業,都是適用這一種作業模式的,例如冷氣經銷商、家電經銷商、3C產品經銷商、美妝用品、電動工具等等,真的非常多。

前一篇文章已經匯出了含有一筆簡單商品的 CSV 檔,用文字編輯器開啟檔案,就可以看到這個 CSV 檔的內容,有2列資料。

貨號,名稱,簡短內容說明,描述,有庫存?,原價,分類,圖片
R3261,R3261斜背式除油煙機(高速雙渦輪),商品簡短說明,商品詳細說明,1,8840,"櫻花除油煙機 > 斜背系列, 櫻花除油煙機",http://localhost/woo5/wp-content/uploads/2022/06/R3261-1.png

第一列是欄位名稱,爬蟲程式產製 CSV 檔時,第一列直接複製這邊者一列過去用即可,以幫助匯入時的欄位辨識,而第二列,就是我們的商品資料了。

所謂的 CSV 檔案,就是一個以逗號(,)來分隔欄位資料的檔案,所以對工程師來說,很容易了解並製作一個 CSV 檔案,目前比較需要注意的是 “分類” 這個欄位,因為這個商品屬於 2 個分類,而匯出時這 2 個分類是以逗號(,)隔開,並存入到 CSV 檔的一個欄位中,為了避免這個分隔分類用的逗號(,),被誤判為分隔欄位用的逗號(,),所以這整個分類欄位的資料內容,必須用一組雙引號(“)將它包夾起來,以便判讀 CSV 檔的程式能正確解析資料的內容。

有了 CSV 的樣板檔案之後,就可以讓爬蟲工具依此格式來產生檔案,檔案產生之後就可以來做匯入的測試了。

選好檔案後按 [繼續]

系統收到檔案之後,會讀出第一列的欄位名稱及第二列的資料內容,顯示成入上圖的畫面,讓使用者核對資料內容與欄位,是否有正確對應,如果產製的檔案格式不正確,例如缺少某個逗號(,)、或是內容含有干擾格式的字元時,都有可能影響系統判讀,拆解對應到錯誤的欄位,所以此處的核對非常重要,可以確認檔案有正確被解析,若核對過欄位對應沒問題,就可以點擊 [執行匯入器],進行資料的寫入。

執行匯入之後,會顯示匯入的結果,匯入完成,代表檔案格式大致沒有問題,但匯入 1 商品失敗,看起來還是發生了一些問題,下一篇再來研究一下發生了什麼事,如何修正。


Free Styler 軟體工作室 : https://coding.freestyler.cc/


圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言