特徵工程不再難:資料科學新手也能輕鬆搞定!
- P幣
全盈+PAY單筆消費滿1200回饋80P幣(每帳號限乙次,限量5000名)
- 登記送
【OK】單筆滿$1純取貨/取貨付款訂單登記送OK購物金50元(限量)
- 登記送
【7-11】單筆滿$350純取貨/取貨付款訂單登記送一顆檸檬青茶兌換券乙張(限量)
- 信用卡、無卡分期、行動支付,與其他多種方式
- PChome 聯名卡最高6%,新戶再享首刷禮1000P
- PChome 倉庫出貨,24小時到貨
- 宅配到府(本島/低溫)滿$699免運
- 宅配到府(本島/常溫)滿$490免運
- 超商取貨(常溫)滿$350免運
- 超商取貨(低溫)滿$699免運
- i郵箱(常溫)滿$290免運
作者: | |
譯者: | 莊嘉盛、博碩文化 |
ISBN: | 9789864344765 |
出版社: | |
出版日期: | 2020/03/31 |
內文簡介
從資料集識別獨一無二的特徵,
建構功能強大的機器學習系統!
特徵工程(Feature Engineering)是建立強大機器學習系統的首要步驟,也是最重要的步驟。特徵選擇錯誤,甚至可能使得某些機器學習演算法毫無用處。故而特徵工程可說是機器學習的重中之重。本書將帶你了解特徵工程的完整流程,讓機器學習更有系統、更有效率。
你將從理解資料(data)開始學習。機器學習模型的成功之處,正是取決於如何利用不同類型的特徵,例如:連續特徵、分類特徵等等。透過理解錯誤分析和模型的可接受性,你將了解何時該納入一項特徵、何時又該忽略一項特徵,以及其中的原因。你還會學習如何將問題陳述轉換為有用的新特徵、如何提供由商業需求和數學見解驅動的特徵,以及如何在自己的機器上進行機器學習,進而自動學習資料中的特徵。
適用讀者
本書適合所有希望全面了解特徵工程的讀者,特別適合具有機器學習應用知識並希望改進機器學習模型結果的資料科學家。讀完這本書,讀者將能精通特徵選擇、特徵學習和特徵最佳化!
在這本書中,你將學到:
?識別和利用不同類型的特徵
?清洗資料中的特徵,提升預測能力
?了解為何以及如何進行特徵選擇和模型誤差分析
?利用領域知識建構新特徵
?以數學知識為基礎並交付特徵
?使用機器學習演算法建構特徵
?精通特徵工程與特徵最佳化
?在真實世界的應用程式中利用特徵工程
【下載範例程式檔案】
本書的程式碼是由GitHub託管,可以在如下網址找到:https://github.com/PacktPublishing/Feature-Engineering-Made-Easy。
【下載本書的彩色圖片】
我們還提供您一個PDF檔案,其中包含本書使用的彩色圖表,可以在此下載:https://www.packtpub.com/sites/default/files/downloads/FeatureEngineeringMadeEasy_ColorImages.pdf。- 作者簡介
Sinan Ozdemir
是生活在舊金山灣區的資料科學家、新創公司創辦人和教育家。 他曾在約翰霍普金斯大學(Johns Hopkins University)學習純數學。在花了幾年的時間,於約翰霍普金斯大學講授關於資料科學的課程之後,他成立了自己的新創公司:Kylie.ai,該公司使用人工智慧clone品牌個性,並自動化客戶服務的通訊。
Sina也是《Principles of Data Science》的作者。
Divya Susarla
是經驗豐富的領導者,在資料方法、各種產業和領域(例如:投資管理、社會企業諮詢和葡萄酒行銷)之中實作並應用策略。她在美國加州大學爾灣分校攻讀了商業經濟學和政治學。
Divya目前在Kylie.ai致力於自然語言處理和生成技術,該公司協助客戶自動化他們的客戶服務對話。目錄前言
第1章:特徵工程簡介
激勵人心的例子:AI驅動的聊天系統
特徵工程的重要性
特徵工程是什麼?
機器學習演算法和特徵工程的評估
特徵理解:我的資料集裡面有什麼?
特徵改進:清洗資料集
特徵選擇:對壞屬性說不
特徵建構:我們能建置全新的特徵嗎?
特徵轉換:數學登場囉!
特徵學習:以AI促進AI
小結
第2章:特徵理解:我的資料集裡面有什麼?
資料結構的有無
非結構化資料的例子:伺服器日誌
定量資料和定性資料
資料的4個等級
資料等級總結
小結
第3章:特徵改進:清洗資料集
識別資料中的遺漏值
處理資料集中的遺漏值
標準化和常態化
小結
第4章:特徵建構
檢查資料集
填補分類特徵
編碼分類變數
擴展數值特徵
針對文本的特徵建構
小結
第5章:特徵選擇
在特徵工程中實現更好的效能
建立基準機器學習管線
特徵選擇的類型
選用正確的特徵選擇方法
小結
第6章:特徵轉換
維度縮減:特徵轉換、特徵選擇與特徵建構
主成分分析
scikit-learn的PCA
中心化和縮放對PCA的影響
深入解釋主成分
線性判別分析
LDA與PCA:使用鳶尾花資料集
小結
第7章:特徵學習
資料的參數假設
受限玻爾茲曼機
伯努利受限玻爾茲曼機
在機器學習管線中應用RBM
學習文本特徵:詞向量
小結
第8章:案例分析
案例1A:臉部辨識-使用JAFFE
案例1B:臉部辨識-使用Olivetti Face
案例2:預測飯店評論資料的主題
小結
相關分類
寄送時間 | 全台灣24h到貨,遲到提供100元現金積點。全年無休,週末假日照常出貨。例外說明 |
---|---|
送貨方式 | 透過宅配送達。除網頁另有特別標示外,均為常溫配送。 消費者訂購之商品若經配送兩次無法送達,再經本公司以電話與Email均無法聯繫逾三天者,本公司將取消該筆訂單,並且全額退款。 |
送貨範圍 | 限台灣本島與離島地區註,部分離島地區包括連江馬祖、綠島、蘭嶼、琉球鄉…等貨件,將送至到岸船公司碼頭,需請收貨人自行至碼頭取貨。注意!收件地址請勿為郵政信箱。 註:離島地區不配送安裝商品、手機門號商品、超大材商品及四機商品。 |
售後服務 | 缺掉頁更換新品 |
執照證號&登錄字號 | 本公司食品業者登錄字號A-116606102-00000-0 |
- PChome24h購物的消費者,都可以依照消費者保護法的規定,享有商品貨到次日起七天猶豫期的權益。(請留意猶豫期非試用期!!)您所退回的商品必須回復原狀(復原至商品到貨時的原始狀態並且保持完整包裝,包括商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性)。商品一經拆封/啟用保固,將使商品價值減損,您理解本公司將依法收取回復原狀必要之費用(若無法復原,費用將以商品價值損失計算),請先確認商品正確、外觀可接受再行使用,以免影響您的權利,祝您購物順心。
- 如果您所購買商品是下列特殊商品,請留意下述退貨注意事項:
- 易於腐敗之商品、保存期限較短之商品、客製化商品、報紙、期刊、雜誌,依據消費者保護法之規定,於收受商品後將無法享有七天猶豫期之權益且不得辦理退貨。
- 影音商品、電腦軟體或個人衛生用品等一經拆封即無法回復原狀的商品,在您還不確定是否要辦理退貨以前,請勿拆封,一經拆封則依消費者保護法之規定,無法享有七天猶豫期之權益且不得辦理退貨。
- 非以有形媒介提供之數位內容或一經提供即為完成之線上服務,一經您事先同意後始提供者,依消費者保護法之規定,您將無法享有七天猶豫期之權益且不得辦理退貨。
- 組合商品於辦理退貨時,應將組合銷售商品一同退貨,若有遺失、毀損或缺件,PChome將可能要求您依照損毀程度負擔回復原狀必要之費用。
- 若您需辦理退貨,請利用顧客中心「查訂單」或「退訂/退款查詢」的「退訂/退貨」功能填寫申請,我們將於接獲申請之次日起1個工作天內檢視您的退貨要求,檢視完畢後將以E-mail回覆通知您,並將委託本公司指定之宅配公司,在5個工作天內透過電話與您連絡前往取回退貨商品。請您保持電話暢通,並備妥原商品及所有包裝及附件,以便於交付予本公司指定之宅配公司取回(宅配公司僅負責收件,退貨商品仍由特約廠商進行驗收),宅配公司取件後會提供簽收單據給您,請注意留存。
- 退回商品時,請以本公司或特約廠商寄送商品給您時所使用的外包裝(紙箱或包裝袋),原封包裝後交付給前來取件的宅配公司;如果本公司或特約廠商寄送商品給您時所使用的外包裝(紙箱或包裝袋)已經遺失,請您在商品原廠外盒之外,再以其他適當的包裝盒進行包裝,切勿任由宅配單直接粘貼在商品原廠外盒上或書寫文字。
- 若因您要求退貨或換貨、或因本公司無法接受您全部或部分之訂單、或因契約解除或失其效力,而需為您辦理退款事宜時,您同意本公司得代您處理發票或折讓單等相關法令所要求之單據,以利本公司為您辦理退款。
- 本公司收到您所提出的申請後,若經確認無誤,將依消費者保護法之相關規定,返還您已支付之對價(含信用卡交易),退款日當天會再發送E-mail通知函給您。