以前好像沒有那麼多python的書,爬蟲這個詞也僅限專業人士才知道。
近幾年不知道什麼緣故,
爬蟲幾乎變成家喻戶曉有在用網路的人,似乎都要知道的東西。
為什麼python爬蟲那麼紅啊?
最近也開始想了解後端的語言,發現node.js其實也能做爬蟲,
不知道用node.js寫的爬蟲效果是不是一樣,
照理說差不多,那有點好奇為什麼紅起來的不是node.js!?
是不是說pyhton這個語言真的有他的簡單之處!?
還是這只是一種商業炒作,或者流行?(書局逛一下真的很多python+爬蟲的書XDDDD)
有沒有前輩有相關經驗可以分析這幾年的趨勢?
先說身為非本科純學興趣之人,其實我不是很建議python當後端。雖然我很喜歡django,也用過flask,也聽說過fastAPI有多快(沒用過)...。我還是覺得python的速度跟效能可能無法符合業界的需求,如要考慮後端語言,PHP(好像7板以後)還是效率快python蠻多的,何況還有GO等更有效率且熱門的後端語言
但Python會紅不是沒有道理的,關於你的問題:
結論就是:Python強大之處就是簡單好學,以致有很多非工程師都能寫出一些套件跟工具,自然有著較大的受眾跟社群,但受限於速度與效能,不見得是專業工程師的主力工具:
個人建議是有空可以學,但我覺得不見得對web工程師工作有很大的幫助,反而是對其他需要寫些電腦工具的專業領域,如科學家(以前都用R跟perl),工科領域的工程師,或是做報表整理資料的上班族是很有用的技能
補充一下: Python是好上手,但其實python也不是那麼好精通,學他語法的過程中你可以感受到發明者的理念(zen),若以非功利導向我是非常推薦去玩一玩
Tauri不錯,只是後端是rust要學一陣子。
終於有有機會可以幹掉 electron 的東西了。
我還是覺得python的速度跟效能可能無法符合業界的需求
這取決於你的網站目標客群多大,中小型網站 Django、flask綽綽有餘,大型網站要用python硬上也不是不行,優化要做好。
另外網站的最大瓶頸還是在資料庫的存取速度。
在台灣業界是因為習慣上還是php、.net為大宗就是了。
收到 感謝django高手force大的補充
大大您說的基本上我都認可,但 ML 那塊不太認同就是
我知道 Python 尤其是 NumPy 和 PyTorch/TensorFlow 背後是 C++/CUDA/C code 但實際上 ML 真的要搞到那個程度的很少⋯⋯
基本上 ML 的軟韌體甚至 Verilog 我覺得那叫寫軟韌體和硬體並非做 ML
python爬蟲會紅的原因。是因為它有幾點好處。
其一工具套件已經很全。
已經簡單到,設定好網址就可以爬了。
再加上其有存在就可以直接利用的PROXY套件。
其二不需要再多假設SERVER。只要套件程式下載下來,下指令就行了。
這樣可以省下架 SERVER 這件事。
對於一些只是單純要拉資料的使用者來說。它是一個很方便使用的語言。
且一般爬蟲也不太會去跑很高並發的請求。畢竟太快太多連結也容易被對方網站給鎖住。
不過像我還是會用PHP跑,但有時也會用GO來跑。
原因是其效能比較好。當然也是因為我對PHP比較熟。
上面說的優點之一,不用架SERVER。對我來說是可有可無的優點。