Hadoop жүйесінде деректерді локализациялауға қалай қол жеткізіледі?
Hadoop жүйесінде деректерді локализациялауға қалай қол жеткізіледі?

Бейне: Hadoop жүйесінде деректерді локализациялауға қалай қол жеткізіледі?

Бейне: Hadoop жүйесінде деректерді локализациялауға қалай қол жеткізіледі?
Бейне: hadoop yarn architecture 2024, Қараша
Anonim

Деректерді локализациялау ішінде Hadoop . Сөздердің көпшілігі 5 лак немесе одан да көп рет қайталанған Wordcount үлгісін алыңыз. Бұл жағдайда Mapper фазасынан кейін әрбір карташы шығысында 5 лак диапазонында сөздер болады. LFS жүйесіне Mapper шығысын сақтаудың бұл толық процесі деп аталады Деректерді локализациялау.

Осыны ескере отырып, Hadoop-та деректерді локализациялау дегеніміз не?

Тұжырымдамасы Деректер елді мекен Hadoop деректері елді мекен MapReduce есептеуді нақты орынға жақындату мүмкіндігін білдіреді деректер үлкен жылжытудың орнына түйінде орналасады деректер есептеуге. Бұл желінің кептелуін азайтады және жүйенің жалпы өткізу қабілетін арттырады.

Сондай-ақ, үлкен деректер қалай сақталады? Көптеген адамдар HDFS немесе Hadoop таратылған файлдық жүйесін Hadoop-пен автоматты түрде байланыстырады деректер қоймалар. HDFS ақпаратты кішірек блоктардан тұратын кластерлерде сақтайды. Бұл блоктар сақталады орнында физикалық сақтау ішкі диск жетектері сияқты блоктар.

Сонымен, Hadoop-та деректер қалай сақталады?

Үстінде Hadoop кластер, деректер HDFS ішінде және MapReduce жүйесі кластердегі әрбір машинада орналасқан. Деректер болып табылады сақталады ішінде деректер DataNodes жүйесіндегі блоктар. HDFS оларды қайталайды деректер блоктар, әдетте өлшемі 128 Мбайт және оларды кластер бойынша бірнеше түйіндерде қайталанатындай етіп таратады.

HDFS жүйесінде файлдар қалай сақталады?

HDFS әшкерелейді а файл жүйелік аттар кеңістігі және пайдаланушы деректерінің болуына мүмкіндік береді сақталады ішінде файлдар . Ішкі, А файл бір немесе бірнеше блоктарға бөлінген және бұл блоктар сақталады DataNodes жиынында. NameNode орындалады файл ашу, жабу және атын өзгерту сияқты жүйелік аттар кеңістігіндегі операциялар файлдар және каталогтар.

Ұсынылған: