Feed on Posts or Comments

Advanced Analytics &Data Mining &Data Models &Exadata &NoSQL &OADM &OCDM &OLAP &Oracle Database &ORDM &R &Общее Андрей Пивоваров on 13 Feb 2012 10:05 am

Про R, Advanced Analytics и другие новости

С начала нового 2012 года появилось несколько интересных новостей, некоторые из которых заслуживают отдельных статей.

Но так как у меня не очень получается последнее время писать большие статьи, то напишу хотя бы о самих новостях – надеюсь, кому надо – сможет раскопать информацию самостоятельно.

Начну с конца.

Oracle Data Mining + Oracle R Enterprise = Oracle Advanced Analytics.

9 февраля Oracle объявил о появлении опции Advanced Analytics к Oracle Database. Пресс-релиз на эту тему можно прочитать здесь.

Что это за опция? Произошло вот что. Этим анонсом Oracle объявляет о том, что теперь в нашем арсенале появился язык статистического программирования и визуализации R.

Этот язык не был придуман в Oracle, это Open Source проект, но довольно популярный, существует с середины 90х. Вот здесь находится страница проекта. До появления R у Oracle не было мощного языка для аналитиков. Да, есть PL/SQL и Java, но эти языки не заточены специально на аналитическую обработку данных. Поэтому было решено добавить язык R. А так как он достаточно известен и популярен среди аналитиков и особенно статистиков, то для них не будет проблем с использованием этой опции.

Но причем тут опция базы данных? А вот причем. Среда программирования R обычно для вычислений использует ресурсы рабочей станции статистика. То есть, это десктоп приложение. И, следовательно, вычислительные возможности ограничены объемом памяти и процессором, находящемся на этой рабочей станции. Если же объем данных, которые нужно обработать большой, то возможностей ноутбука не хватит.

И вот тут появляется Oracle R Enterprise.

Поскольку язык R очень хорошо расширяется, то в Oracle написали библиотеки к R, которые позволяют, во-первых, непосредственно манипулировать из R данными, которые находятся в базе данных Oracle, а, во-вторых, обработка тяжелых вычислений может проводиться также внутри Oracle Database. Очевидно, что у серверов, где крутятся базы данных Oracle, мощности гораздо больше, чем у десктопов. Расширение R для работы с Oracle Database назвали Oracle R Enterprise.

Плюс, как вы знаете, у Oracle существовала опция Data Mining. И вот теперь опция Data Mining и Oracle R Enterprise составляют вместе опцию Oracle Advanced Analytics. Опции Data Mining в прайслите теперь не будет. Цена при этом не изменится. Сам софт Oracle Data Mining остается.

Скачать Oracle R Enterprise можно тут.

А в блоге Саши Рындина можно найти отличную подборку обучающих материалов по R и R Enterprise.

Официальный блог по Oracle R Enterprise тут.

Пока я изучал, что такое R, наткнулся на отличный сайт http://www.statmethods.net/. Там есть ответы почти на все вопросы, которые у меня возникали про R. А также, автор сайта, Robert Kabacoff (судя по фамилии, имеет русские корни), написал хорошую книжку (видимо по мотивам материалов сайта) R in Action.

Новости одной строкой:

Появился новый продукт Oracle Airline Data Model. Про нее хорошо написал Саша, так что повторяться не буду. Это в дополнение к Retail Data Model и Communications Data Model.

Появился Oracle TimesTen 11g Release 2. Пресс-релиз тут. Гена Сигалаев написал на эту тему статью, правда на английском.

Появилась статья Oracle OLAP Exadata X2-2 Performance Demonstration. Про то, как работает Oracle OLAP на Exadata.

Charles Lamb опубликовал пост с бенчмарками Oracle NoSQL Database. Часто спрашивают. Вообще, если вас интересует тема Oracle NoSQL DB, читайте его блог. Вот, например статья, как запустить Oracle NoSQL DB за пять минут.

Появился демо-сервер в интернете, с помощью которого можно попробовать поработать с Oracle BI Mobile, то есть с BI на iPad. Документ с настройками тут.

Хорошее видео с Oracle OpenWorld 2011 с демонстрацией работы Oracle Exalytics.

Ну и, наконец, был опубликован новый квадрат Гартнера Magic Quadrant for Business Intelligence Platforms 2012. (Как читать эти квадраты, я когда-то писал тут) Oracle традиционно в лидерах. Но новостью этого квадрата для меня стало попадание в него российской компании Прогноз из Перми. Несмотря на то, что мы в какой-то степени конкуренты с ними, очень рад за соотечественников. Молодцы, ребята. Поздравляю.

__________________________________
Читайте также:
А еще можно почитать мой твиттер @apivovarov

2 Responses to “Про R, Advanced Analytics и другие новости”

  1. on 13 Feb 2012 at 11:37 pm 1.Алексей said …

    Т.е. все R-модули типа nnet тоже можно подключать? Следующий шаг — пробросить этот функционал в OBIEE, и можно будет предлагать заказчикам прогнозные модели :)

  2. on 14 Feb 2012 at 10:01 am 2.Андрей Пивоваров said …

    Алексей,

    насчет все-не все не знаю, не буду утверждать на 100%, но по идее он ничем не должен отличаться от обыного R, кроме библиотек работы с Oracle.
    Насчет проброса – хорошая мысль, я тоже думал об этом, но в контексте проброса графиков. Надо посмотреть, можно ли функции R вызывать из PL/SQL пакетов или функций Oracle и если да, то проброс сделать можно. Но я не уверен, что можно сделать такой вызов.

Trackback This Post | Subscribe to the comments through RSS Feed

Leave a Reply