Amazon Elastic MapReduce артындағы деректерді өңдеу механизмі қандай?
Amazon Elastic MapReduce артындағы деректерді өңдеу механизмі қандай?

Бейне: Amazon Elastic MapReduce артындағы деректерді өңдеу механизмі қандай?

Бейне: Amazon Elastic MapReduce артындағы деректерді өңдеу механизмі қандай?
Бейне: Introduction to Amazon Elastic MapReduce 2024, Қараша
Anonim

Amazon EMR тарату ретінде Apache Hadoop пайдаланады деректерді өңдеу қозғалтқышы . Hadoop – бұл қолдайтын ашық бастапқы Java бағдарламалық жасақтамасы деректер -үлкен кластерлерде жұмыс істейтін интенсивті таратылған қолданбалар ның тауарлық аппаратура.

Сонымен қатар, Amazon Elastic MapReduce дегеніміз не?

Amazon Elastic MapReduce ( EMR ) болып табылады Amazon веб-қызметтері ( AWS ) үлкен деректерді өңдеу және талдау құралы. Amazon EMR виртуалды серверлердің Hadoop кластері арқылы үлкен деректерді өңдейді Amazon Elastic Есептеу бұлты ( EC2 ) және Amazon Қарапайым сақтау қызметі ( S3 ).

Сонымен қатар, Amazon EMR толығымен басқарылады ма? Бұл толығымен басқарылады деректер қоймасын есептеу ресурстарынан ажырата алатын және оның орнына есептеу кластерлерін масштабталатын, сұраныс бойынша пайдалануға қолжетімді ететін деректер көлі қызметі және бірнеше кластерлердің бірдей деректер жиынына бірден қатынасу мүмкіндігін қамтиды.

Сондай-ақ, AWS EMR қалай жұмыс істейді?

Әдетте, деректерді өңдеу кезінде Amazon EMR , кіріс таңдалған негізгі файлдық жүйеде файлдар ретінде сақталған деректер, мысалы Amazon S3 немесе HDFS. Бұл деректер өңдеу тізбегінде бір қадамнан келесіге өтеді. Соңғы қадам шығыс деректерін көрсетілген орынға жазады, мысалы Amazon S3 шелек.

ec2 мен EMR арасындағы айырмашылық неде?

Ұнайды EMR , EC2 бағынышты түйіндерді негізгі және тапсырма түйіндеріне жіктемейді. Бұл түйін жойылған/жоғалған жағдайда HDFS деректерін жоғалту қаупін арттырады. EC2 s3 жүйесіндегі деректерге қол жеткізу үшін Apache кітапханаларын (s3a) пайдаланады. Басқа жақтан, EMR s3 жүйесіне жылдамырақ қол жеткізу үшін AWS меншік кодын пайдаланады.

Ұсынылған: