商品編號:DJBS3S-D900HUL1G

Python網路爬蟲:大數據擷取、清洗、儲存與分析-王者歸來(Pubu電子書)

$600
$600
付款方式
配送資訊
  • 電子書
    非實體商品,發送方式詳見商品頁說明
    商品詳情
    ISBN:
    9789860776478
    出版社:
    出版日期:
    2021/10/01
    • 內文簡介

    • Python網路爬蟲 大數據擷取、清洗、儲存與分析 王者歸來(第二版) ★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★ ★★★★★【26個主題】+【400個實例】★★★★★ ★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★ ★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★ ★★★★★【網路趨勢】+【了解輿情】★★★★★   第二版和第一版做比較,增加下列內容:   ★:全書增加約50個程式實例   ★:網路趨勢,了解輿情   ★:網路關鍵字查詢   ★:YouBike資訊   ★:國際金融資料查詢   ★:博客來圖書排行榜   ★:中央氣象局   ★:租屋網站   ★:生活應用   下列是本書有關網路爬蟲知識的主要內容:   ★:認識搜尋引擎與網路爬蟲   ★:認識約定成俗的協議robots.txt   ★:從零開始解析HTML網頁   ★:認識與使用Chrome開發人員環境解析網頁   ★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組   ★:說明lxml模組   ★:XPath方法解說   ★:css定位網頁元素   ★:Cookie觀念   ★:自動填寫表單   ★:使用IP代理服務與實作   ★:偵測IP   ★:更進一步解說更新的模組Requests-HTML   ★:認識適用大型爬蟲框架的Scrapy模組   在書籍內容,筆者設計爬蟲程式探索下列相關網站:   ☆:國際與國內股市資訊   ☆:基金資訊   ☆:股市數據   ☆:人力銀行   ☆:維基網站   ☆:主流媒體網站   ☆:政府開放數據網站   ☆:YouBike服務網站   ☆:PTT網站   ☆:電影網站   ☆:星座網站   ☆:小說網站   ☆:博客來網站   ☆:中央氣象局   ☆:露天拍賣網站   ☆:httpbin網站   ☆:python.org網站   ☆:github.com網站   ☆:ipstack.com網站API實作   ☆:Google API實作   ☆:Facebook API實作   探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:   ★:CSV檔案格式   ★:JSON檔案格式   ★:XML、Pickle   ★:Excel   ★:SQLite   在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:   ☆:URL編碼與中文網址觀念   ☆:將中文儲存在JSON格式檔案   ☆:亂碼處理   ☆:簡體中文在繁體中文Windows環境資料下載與儲存   ☆:解析Ajax動態加載網頁,獲得更多頁次資料   ☆:使用Chromium瀏覽器協助Ajax動態加載

    規格說明
    1. 本商品為數位內容商品,非實體紙本書籍 2. 電子書兌換網址:https://www.pubu.com.tw/voucher 3. Pubu 電子書僅適用在手機、平板下載 Pubu App(前往下載)、Pubook 電子閱讀器,或以瀏覽器閱讀。
    備註
    1. 訂單確認交易成功後,請稍候 5 分鐘待系統派送兌換碼後前往 PChome 會員中心 > 查訂單 > 看明細 > 內容,取得「兌換碼」,再前往「Pubu 電子書」專屬頁面進行兌換:https://www.pubu.com.tw/voucher 2. 訂單及書籍問題請聯繫 PChome 客服中心
    購物須知