无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

網(wǎng)易云微專業(yè)大數(shù)據(jù)開發(fā)工程師

2022-09-28 13:44 作者:血霽玫瑰與櫻花  | 我要投稿

大數(shù)據(jù)計算原理

  1. 在待處理的數(shù)據(jù)存儲在服務器集群的所有服務器上,主要使用HDFS系統(tǒng),將文件分成很多塊(Block),以塊為單位存儲在集群的服務器上

  2. 大數(shù)據(jù)引擎根據(jù)集群里的不同服務器的計算能力,在每臺服務器上啟動若干分布式任務執(zhí)行進程,這些進程會等待給它們分配執(zhí)行任務

  3. 使用大數(shù)據(jù)計算框架支持的編程模型進行編程,比如Hadoop的MapReduce編程模型,或Spark的RDD編程模型,編寫應用程序,例如python或java程序

  4. 用Haddop或Spark的啟動命令執(zhí)行這個應用程序,執(zhí)行引擎會解析程序要處理的數(shù)據(jù)輸入路徑,根據(jù)輸入數(shù)據(jù)量的大小,將數(shù)據(jù)分片,每個片分配給一個任務執(zhí)行進程去處理

  5. 任務執(zhí)行進收到任務后檢查是否有任務對應的程序包,沒有就去下載,下載后加載程序

  6. 加載程序后,任務根據(jù)分配的數(shù)據(jù)片的文件地址和數(shù)據(jù)在文件內(nèi)的偏移量讀取數(shù)據(jù),并把數(shù)據(jù)輸入給應用程序相應的方法去執(zhí)行,從而實現(xiàn)分布式服務器集群中并行處理的計算目標


網(wǎng)易云微專業(yè)大數(shù)據(jù)開發(fā)工程師的評論 (共 條)

分享到微博請遵守國家法律
东乡| 邵阳市| 宁阳县| 平谷区| 集贤县| 鄂伦春自治旗| 东乡| 南召县| 来凤县| 武冈市| 满洲里市| 崇左市| 巴南区| 阜新市| 锡林郭勒盟| 南城县| 泰宁县| 扶余县| 建平县| 屏边| 当雄县| 罗山县| 瓦房店市| 浦县| 密云县| 西畴县| 高邮市| 瑞安市| 万载县| 沙田区| 石河子市| 吉木萨尔县| 阳城县| 莫力| 左贡县| 璧山县| 高青县| 文安县| 高雄市| 南川市| 手机|