Hadoop

Материал из ALT Linux Wiki
Stub.png
Данная страница находится в разработке.
Эта страница ещё не закончена. Информация, представленная здесь, может оказаться неполной или неверной.


Что это такое?

Wikipedia: Apache Hadoop является свободным Java фреймворком, поддерживающим выполнение распределённых приложений, работающих на больших кластерах, построенных на обычном оборудовании. Hadoop прозрачно предоставляет приложениям надёжность и быстродействие операций с данными.

Как установить Hadoop на ALT Linux

Данная инструкция описывает ALT-специфику установки Hadoop-кластера из двух машин. Пусть в нашем кластере есть две машины - hadoopt1 и hadoopt2. DNS-резолвинг работает.

  1. Устанавливаем rpm-ки hadoop-* из ftp://ftp.altlinux.org/pub/people/vitty/hadoop/
  2. Редактируем /etc/hadoop/masters, где пишем кто у нас будет master-нодой
cat /etc/hadoop/masters
hadoopt1
  1. Редактируем /etc/hadoop/slaves, где перечисляем все slave-ноды:
cat /etc/hadoop/slaves
hadoopt1
hadoopt2

Как пользоваться Hadoop