Линейка специализированных "экзасистем" в сочетании с новыми программными решениями позволяют Oracle создать единый технологический цикл работы с Большими Данными

11:30 02.05.2012   |   1352 |  Леонид Черняк |  «Открытые системы»

Рубрика Технологии



Результатом трех лет совместного сосуществования очень разных, казалось бы, производственных программ Oracle и Sun Microsystems стало появление семейства специализированных систем, предназначенных для работы с большими объемами данными и создания частных облачных инфраструктур. Этот факт соответствует общей тенденции: корпорация Oracle в данном случае не одинока, еще несколько крупных ИТ-вендоров производят системы, которые можно назвать аналогами — но только условно, так как  различий между ними гораздо больше, чем, скажем, между равными по мощности серверами.

Три из этих специализированных систем объединены общим префиксом в названии — Exadata, Exalogic и Exalytics. Представленная в 2008 году Exadata была первой, она создавалась еще в кооперации с HP как машина для поддержки баз данных и обработки транзакций. За ней последовала машина для поддержки приложений Exalogic (2010 год), а последней стала машина для поддержки аналитики Exalytics (2011-й). В том же ряду стоят объявленные в 2011 году Oracle Big Data Appliance, ориентированная на совместную работу Apache Hadoop с СУБД Oracle NoSQL Database, и Oracle Database Appliance, уменьшенная версия Exadata. Все эти системы стали предметом обсуждения на конференции Extreme Analytics Summit, прошедшей в Москве 11 апреля, однако, поскольку они же были в центре внимания недавней конференции «Аппаратная платформа Oracle: максимальная производительность для ваших информационных систем» (см. «Oracle 'кует железо'», Computerworld Россия, № 06, 2012), остановимся на том, о чем на предыдущем мероприятии сказано не было.

Совокупность перечисленных выше устройств в сочетании с необходимым программным обеспечением позволяет создать единый технологический цикл работы с данными, состоящий из четырех этапов: получение (aquire), предварительная обработка (organize), анализ (analyze) и принятие решений (decide). Принципиально новым является последний этап, он нов для отрасли в целом и для Oracle в частности. С этой точки зрения ключевыми были два доклада: «Oracle Endeca — анализ и исследование структурированной и неструктурированной информации» и «Oracle R Enterprise — среда статистических исследований и визуализации», сделанные Ольгой Горчинской, а также выступление Александра Рындина «Аналитика сложных событий (Oracle CEP)».

В декабре 2011 года Oracle приобрела компанию Endeca, известную своей специализацией на корпоративном поиске и извлечении информации из знаний, не случайно ее название образовано от entdecken, что в переводе с немецкого означает «обнаружение смысла». Бывает, что покупка даже небольшой компании сильно меняет позицию крупной, например когда приобретение Siebel и Hyperion вывело Oracle в лидеры в области бизнес-аналитики, уравняв ее с IBM и SAP. Но тем не менее до последнего времени Oracle оставалась в традиционном пространстве BI, то есть отчетности и анализа, построенном на реляционных СУБД. Теперь же, когда все важнее работа с негармонизированными и неструктурированными данными, овладение интеллектуальным капиталом Endeca позволяет Oracle сделать следующий шаг в соперничестве с конкурентами по «новой бизнес-аналитике»: SAP HANA в сочетании с BusinessObjects Explorer, Microsoft FAST Search, QlikView, Tibco Spotfire, а также IBM в партнерстве с компанией Attivio.

Oracle R Enterprise, новый компонент аналитического пакета Oracle Advanced Analytics Option, дает возможность использовать популярный язык статистического программирования R для обработки больших данных. Программирующие на R аналитики могут получать доступ к данным, хранящимся в СУБД, напрямую из R без использования SQL в качестве промежуточного средства. Аналитики и разработчики аналитических приложений могут использовать код R непосредственно в базах данных, без какого-либо его перемещения, что повышает безопасность и снижает задержки. Oracle R Enterprise интегрирован с Oracle Database 11g.

Oracle Complex Event Processing — законченное решение, позволяющее создавать приложения, которые в реальном времени фильтруют, обрабатывают и устанавливают связи между событиями, скрытыми в потоке поступающих внешних данных. Oracle вышла на рынок CEP в 2006 году, лицензировав открытый движок у компании EsperTech. Дальнейшее развитие это направление получило после приобретения в 2008 году компании BEA (созданный ею WebLogic Event Server вошел в релиз Oracle 11g). Организовать потоковую обработку данных помогает специально разработанный Oracle язык запросов CQL (Continuous Query Language). В феврале Oracle CEP пополнился средствами визуализации от известной в этом сегменте шведской компании Panopticon.


Теги: