近日,工業和信息化部教育與考試中心印發了“2019年上半年信息技術水平考試工作安排的通知”,公布了2019年上半年信息技術水平考試科目及考試時間、工作日程安排以及教材目錄等。其中,由劉鵬教授主編、清華大學出版社出版的“大數據應用人才培養系列教材”中的《Python語言》、《數據清洗》、《大數據系統運維》三冊圖書同時入選“2019年上半年信息技術水平考試教材目錄”。
全國信息技術水平考試是由工業和信息化部教育與考試中心(全國電子信息應用教育中心)負責具體實施的全國統一考試。該考試是對從事或即將從事信息技術的專業人員技術水平的綜合評價,其目的是加快國民經濟信息化技術人才的培養,同時為企業合理選拔聘用信息化技術人才提供有效憑證。
本書以WIN10 和Python3.6.5 搭建Python開發基礎平臺為起點,重點闡述Python語言的基礎知識和三個典型的項目實戰案例。全書以理論引導、案例驅動、上機實戰為理念打造Python語言學習的新模式。具體內容分為兩大部分:第一部分以Python編程語言基礎知識普及為主,分別介紹了Python3概述、基本語法、流程控制、Python組合數據類型、字符串與正則式、函數、模塊、類和對象、異常處理、文件操作;第二部分:以項目實戰為核心,以學以致用為導向,以切近生活的案例為依托,分別介紹 Python爬蟲項目實戰、Python數據可視化項目實戰、Python數據分析項目實戰。本書以作者十多年的計算機專業課程教學經驗及相應的項目實戰心得為依托,力爭做到以理論知識為基礎、以案例實戰為手段、以解決問題為根本的初衷。讓讀者從書中汲取他們所需要的編程知識和實戰體驗。
本書可作為高等學校尤其是高職院校各專業的Python語言啟蒙教材,同時也可作為廣大Python語言愛好者自學的參考書。
數據清洗是大數據領域不可缺少的環節,用來發現并糾正數據中可能存在的錯誤。該步驟針對數據審查過程中發現的錯誤值、缺失值、異常值、可疑數據,選用適當方法進行“清理”,使“臟”數據變為“干凈”數據。本書共分為8章:第1章主要介紹數據清洗的概念、任務和流程,數據標準化概念及數據倉庫技術等;第2章主要介紹Windows和類UNIX操作系統下的數據常規格式、數據編碼及數據類型轉換等;第3章介紹ETL概念、數據清洗的技術路線、ETL工具及ETL子系統等;第4章介紹了Excel、Kettle、OpenRefine、DataWrangler和Hawk的安裝及使用等;第5章介紹Kettle下文本文件抽取、Web數據抽取、數據庫數據抽取及增量數據抽取等;第6章介紹數據清洗步驟、數據檢驗和數據錯誤處理,數據質量評估及數據加載;第7章介紹網頁結構,利用網絡爬蟲技術進行數據采集,利用JavaScript技術進行行為日志數據采集等;第8章介紹RDBMS的數據清洗方法和數據脫敏處理技術等。
本書系統地講解了數據清洗理論和實際應用,可以作為培養應用型人才的課程教材,也適用于希望了解數據清洗的廣大讀者。
本書是大數據應用人才培養系列教材中的一冊,講解了大數據系統運行維護過程中的各個主要階段及其任務,包括配置管理、系統管理、故障管理、性能管理、安全管理、高可用性管理、應用變更管理、升級管理及服務資源管理,內容全面且翔實,兼具基礎理論知識與運維實踐經驗,特別是重點介紹了大數據系統的運維特點及運維技能,以保障大數據系統的穩定可靠運行,更好地支撐大數據的商業應用價值。
本書具有很強的系統性和實踐指導性,可以作為培養應用型人才的課程教材,也同樣適合于有意從事IT系統運維工作的廣大從業者和愛好者作為參考書。
在大數據行業愈發火熱,人才需求不斷增加的趨勢下,清華大學博士、南京大數據研究院院長劉鵬教授策劃編寫了這套“大數據應用人才培養系列教材”。除了以上3冊圖書之外,該套叢書還包括《大數據實踐》、《大數據導論》、《數據挖掘基礎》、《R語言》、《云計算導論》、《數據標注工程》6冊圖書。此外,該套叢書還有配套資源,免費提供教學課件PPT,學習以及實驗資料等。
本套叢書的講解側重于應用,對知識點給出具體的操作,并且有配套的動手實驗。內容安排遵循從簡單到復雜、從理論到實踐的學習過程;同時也遵循系統性和覆蓋面寬的原則。本套叢書可以作為培養應用型人才的課程教材,也同樣適用于有意從事大數據系統基礎工作的IT從業人員作為參考書。
訂購圖書可前往天貓搜索“清華大學出版社官方旗艦店”店鋪:
