HadoopDB архитектурный гибрид технологий

         

Родственные работы


В последнее время выполнялись некоторые исследовательские работы, посвященные объединению идей MapReduce и параллельных систем баз данных; однако в этих исследованиях основное внимание уделялось языковым и интерфейсным аспектам. Проекты Pig (Yahoo, ), SCOPE (Microsoft, ) и Hive (проект с открытыми исходными текстами, ) направлены на интеграцию в программное обеспечение MapReduce конструкций декларативных запросов, используемых в системах баз данных, с целью обеспечения большей независимости данных, повторной используемости кода и автоматической оптимизации запросов. В продуктах компаний Greenplum и Asterdata добавлена возможность определения MapReduce-функций (вместо SQL-функций или впридачу к ним) над данными, хранимыми под управлением этих продуктов .

Хотя, безусловно, в этих пяти проектах делаются важные шаги на пути к построению гибридных систем, остается потребность в гибридном решении на системном уровне. В данной статье речь идет именно о гибриде на системном уровне.

1 Более точно, Exadata является системой без совместного использования ресуров только на уровне хранения данных.

2 Это определение слегка отличается от определений параллельных систем баз данных, приводимых в учебниках, где в их число иногда включаются еще и системы, основанные на архитектурах с совместно используемой общей памятью (shared memory) и совместно используемыми дисками (shared disk).



Содержание раздела