摘要:大數(shù)據(jù)工程師認證考試知識點有大數(shù)據(jù)計算服務 Maxcompute、數(shù)據(jù)工場 DataWorks、數(shù)據(jù)集成等,其中大數(shù)據(jù)計算服務 Maxcompute部分占比較高,有55%的內(nèi)容。大數(shù)據(jù)工程師認證考試知識點及占比詳見正文。
大數(shù)據(jù)工程師認證考試知識點及占比具體如下:
產(chǎn)品名稱 | 試題占比 |
大數(shù)據(jù)計算服務 Maxcompute | 55% |
數(shù)據(jù)工場 DataWorks | 20% |
數(shù)據(jù)集成 | 10% |
Quick BI | 5% |
機器學習 PAI | 5% |
和其他云產(chǎn)品配合的應用及架構 | 5% |
大數(shù)據(jù)工程師認證考試知識點詳細如下:
一、大數(shù)據(jù)計算服務考試內(nèi)容:
(1)熟悉大數(shù)據(jù)計算服務基本概念,包括項目空間、表、分區(qū)、資源、任務等。
(2)了解大數(shù)據(jù)計算服務的組成架構和各組成部分功能。
(3)掌握大數(shù)據(jù)計算服務的特點、優(yōu)勢以及適用場景。
(4)掌握大數(shù)據(jù)計算服務的連接和使用方式,包括使用客戶端、管理控制臺、Java SDK 等。
(5)掌握大數(shù)據(jù)計算服務的數(shù)據(jù)上傳和下載,可以熟練的使用Tunnel 命令行工具,了解 Tunnel SDK。
(6)掌握大數(shù)據(jù)計算服務的 SQL 命令,包括 DDL、DML 以及常見內(nèi)置函數(shù)。
(7)熟悉大數(shù)據(jù)計算服務的用戶自定義函數(shù),包括 UDF、UDAF以及 UDTF,可以編寫簡單的自定義函數(shù)。
(8)熟悉大數(shù)據(jù)計算服務的 MapReduce 編程框架,可以配置Eclipse 的環(huán)境,編寫簡單的 MR 程序。
(9)了解大數(shù)據(jù)計算服務的 Graph 編程框架,包括基本概念、處理流程等,可以編寫簡單的 Graph 程序。
(10)了解大數(shù)據(jù)計算服務 DataHub 的相關概念和使用方法。
(11)熟悉大數(shù)據(jù)計算服務的安全和權限管理的概念和實際操作, 包括用戶、角色、授權(ACL&Policy)、項目空間保護、例外以及安全等級等。
二、數(shù)據(jù)工場 DataWorks 考試內(nèi)容:
(1)熟悉 DataWorks 的基本功能模塊,包括數(shù)據(jù)開發(fā)、數(shù)據(jù)管理、運維中心、組織管理以及項目管理等。
(2)了解 DataWorks 的基本特點,包括角色隔離、環(huán)境隔離等。
(3)可以使用項目管理和組織管理模塊搭建環(huán)境。
(4)熟練使用 DataWorks 的數(shù)據(jù)開發(fā)模塊進行設計開發(fā),包括建表、任務開發(fā)、資源上傳、數(shù)據(jù)上傳、新增函數(shù)等。
(5)熟練使用 DataWorks 的數(shù)據(jù)開發(fā)模塊進行工作流任務和節(jié)點任務的開發(fā)設計,并且可以配置合適的依賴和周期性調(diào)度。
(6)熟練使用數(shù)據(jù)管理模塊進行數(shù)據(jù)管理,包括血緣分析、表的使用權限申請和授權等。
(7)對于使用過程中出現(xiàn)的問題,能夠識別、定位,對其中基本的問題能進行修復。
三、數(shù)據(jù)集成考試內(nèi)容:
(1)了解數(shù)據(jù)集成的基本概念和工作流程。
(2)熟練使用數(shù)據(jù)集成進行多種場景下的數(shù)據(jù)同步,可以從不同的數(shù)據(jù)源同步數(shù)據(jù)到大數(shù)據(jù)計算服務。
(3)了解數(shù)據(jù)集成中的 DataX 組件,包括概念、功能以及實際使用。
(4)了解并能正確使用數(shù)據(jù)集成中的字段映射、常量使用、變量使用、導入導出規(guī)則等。
(5)了解數(shù)據(jù)集成的最佳實踐,比如切分鍵配置等。
(6)能夠對使用過程中出現(xiàn)的常見問題進行排查,并能解決其中的基本問題。
(7)對于數(shù)據(jù)集成中的臟數(shù)據(jù)能夠進行正確的處理。
四、Quick BI 考試內(nèi)容:
(1)了解 QuickBI 的產(chǎn)品特點和使用場景。
(2)掌握服務開通、數(shù)據(jù)源配置、數(shù)據(jù)分析等基本操作。
(3)了解各種常見統(tǒng)計圖表的適用場景和使用方法。
(4)能夠使用 Quick BI 進行儀表盤設計、報表門戶設計。
五、機器學習 PAI 考試內(nèi)容:
(1)了解機器學習的基本知識。
(2)掌握常見的機器學習算法。
(3)能夠使用機器學習 PAI 對數(shù)據(jù)集進行數(shù)據(jù)處理和探索式統(tǒng)計分析。
(4)能夠使用機器學習 PAI 對數(shù)據(jù)集進行聚類、分類等數(shù)據(jù)分析。
(5)能夠使用 DataWorks 部署應用機器學習中的模型。
六、應用和架構考試內(nèi)容:
(1)了解其他相關云產(chǎn)品的特點和應用場景,包括云數(shù)據(jù)庫RDS、分布式關系型數(shù)據(jù)庫 DRDS、表格存儲(Table Store)、分析型數(shù)據(jù)庫(Analytic DB)、對象存儲 OSS 等。
(2)了解大數(shù)據(jù)計算服務、數(shù)據(jù)工場 DataWorks、數(shù)據(jù)集成、QuickBI 及機器學習 PAI 等如何與其他相關產(chǎn)品配合使用。
(3)能根據(jù)實際的應用場景,結合阿里云產(chǎn)品的特點設計合理的基礎架構。
阿里云認證備考資料免費領取
去領取
阿里云認證