2018年3月30日 星期五

Python網路爬蟲王者-Selenium


相信時致今日,沒有人可以否認網路上的資料近乎無窮無近,只端看你要如何使用它。

「Python網路爬蟲王者-Selenium」完全是目的導向的工具書。目標讀者是有心瞭解網路爬蟲技術的人。書中從基本的網頁結構開始講解,尊定讀者後績學習的基礎。再藉由一小段一小段的程式練習範例,讓讀者自然而然地熟習網頁元素定位的技巧。在看完第4章之後,我已經能完成工作上需要的網路爬蟲任務了。

書本的中後半段,是把重心轉向網頁程式的自動化測試。這原本就是Selenium當初出被開發出來的用途。只是Selenium實在太好用,所以僅是拿來當成網路爬蟲的工具,就已經是值回票值了。網頁程式自動化測試目前在台灣IT圈,應該不算普遍被採用的技術(人工測試比較多),對於網頁程式工程師來說,多瞭解絕對是好事,或許能有派上用場的一天。

如前文所述,網路上的資料什麼都有、什麼都不奇怪,藉由網路爬蟲的協助,取得有意義的資料來做分析、應用,用以優化企業流程,在未來是各行各業都可能探用的作法。從事後端工程師職務的從業人員,都應視為基礎能力的一環。
 

沒有留言:

張貼留言