Паркет деректер пішімі дегеніміз не?
Паркет деректер пішімі дегеніміз не?

Бейне: Паркет деректер пішімі дегеніміз не?

Бейне: Паркет деректер пішімі дегеніміз не?
Бейне: Data Science with Python! Analyzing File Types from Avro to Stata 2024, Қараша
Anonim

Апачи Паркет тегін және ашық бастапқы коды бар бағанға бағытталған деректер сақтау пішім Apache Hadoop экожүйесінің. Ол көпшілігімен үйлесімді деректер Hadoop ортасында өңдеу фреймверктері. Ол тиімді қамтамасыз етеді деректер күрделі өңдеу үшін жақсартылған өнімділігі бар қысу және кодтау схемалары деректер жаппай.

Қарапайым, паркет файл пішімі қандай?

Паркет , ашық дереккөз файл пішімі Hadoop үшін. Паркет кірістірілген деректер құрылымдарын жалпақ бағанада сақтайды пішім . Деректер жолға бағытталған тәсілде сақталатын дәстүрлі тәсілмен салыстырғанда, паркет сақтау және өнімділік тұрғысынан тиімдірек.

Сонымен қатар, паркет не үшін қолданылады? Паркет Hadoop экожүйесіндегі кез келген жобаға қолжетімді ашық бастапқы файл пішімі. Апачи Паркет CSV немесе TSV файлдары сияқты жолға негізделген файлдармен салыстырғанда деректердің тиімді және тиімді жалпақ бағаналық сақтау пішіміне арналған.

Сонымен қатар, паркет пішімі деректерді қалай сақтайды?

ДЕРЕКТЕР BLOCK ішіндегі әрбір блок паркет файл болып табылады сақталады қатар топтары түрінде. Сонымен, деректер ішінде паркет файл бірнеше жол топтарына бөлінген. Бұл жол топтары өз кезегінде ішіндегі бағанға сәйкес келетін бір немесе бірнеше баған бөліктерінен тұрады деректер орнату. The деректер беттер түрінде жазылған әрбір баған бөлігі үшін.

Паркет адам оқуға жарамды ма?

ORC, Паркет және Авро да машина- оқылатын екілік пішімдері, яғни файлдар бос сөз сияқты көрінеді адамдар . Қажет болса адам - оқылатын JSON немесе XML сияқты пішім болса, онда сіз бірінші кезекте Hadoop-ты неліктен пайдаланып жатқаныңызды қайта қарастыруыңыз керек.

Ұсынылған: