В данном пособии приводятся примеры использования аналитической платформы «Deductor». Рассматриваются некоторые возможные реализации нейронных сетей, кластеризация с помощью карт Кохонена, прогнозирование временных рядов и создание баз знаний.
Наличие достаточно развитых инструментальных программных средств аналитической платформы «Deductor» позволяет аналитику при построении модели прогнозируемого процесса руководствоваться такими понятиями, как опыт и интуиция. В ряде случаев, когда нет необходимости в строгой математической спецификации модели, такой подход представляется вполне допустимым, что особенно ценно при анализе плохо формализуемых процессов.
Изучение пособия дает возможность студентам бакалавриата и магистратуры существенно продвинуться в освоении совокупности методов и средств аналитической обработки информации.
Пособие предназначено для студентов факультета государственного управления МГУ, а также студентов гуманитарных специальностей, изучающих информационные технологии в управлении.
Хочу выразить свою благодарность доценту Кафедры математических методов и информационных технологий Факультета государственного управления МГУ И.А.Смольниковой за оказанную помощь и полезные советы при редактировании этой книги.
Если у Вас возникнут вопросы, то пишите мне [email protected]
I. Аналитическая платформа Deductor
Аналитическая платформа платформа Deductor – это отечественный программный продукт, разработанный компанией BaseGroup Labs. С его помощью возможно решение самого широкого спектра задач, начиная от создания систем корпоративной отчетности и до решения задач Data Mining.
Это специализированное программное решение выполнено на базе единой платформы и содержит в себе необходимые инструменты для извлечения закономерностей из «сырых» данных. Оно позволяет пройти все этапы построения аналитической системы: от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов.
Система позволяет анализировать любые табличные данные и для решения аналитических задач. В ней предусмотрена возможность использования следующих специальных технологий:
– Data Warehouse (хранилища данных) – консолидация данных и обеспечение быстрого и понятного для аналитика доступа к ним
– OLAP (многомерный анализ) – визуализация, отчетность и удобное манипулирование большими объемами данных
– Data Mining (моделирование, интеллектуальный анализ данных) – поиск скрытых закономерностей, выявление причинно-следственных связей, анализ рисков
– KDD – Knowledge Discovery in Databases (обнаружение, извлечение знаний) – построение сценариев обработки от очистки и предобработки данных до моделирования.
В настоящем пособии рассматриваются только некоторые технологии из приведенного списка.
Последовательность действий (импорт, экспорт, обработка, визуализация) при решении конкретных задач в Deductor задается сценарием обработки. Сами же сценарии формируются специальным приложением Deductor Studio, которое является рабочим местом аналитика.
В профессиональной версии системы для импорта и анализа пригодны разнообразные табличные данные из стороннего источника (Oracle, MS SQL, Sybase, MS Access, Excel, 1С и др.). В учебной версии Deductor Academic – импортируются только данные в формате текстовых файлов с разделителями в виде табуляции.
Под обработкой данных в системе подразумевается любые действия, связанные с их преобразованием, такие как очистка данных, их трансформация и построение разнообразных моделей Data Mining.
При визуализации производится отображение полученных и обработанных данных. Аналитическая платформа самостоятельно анализирует формат отображения, предоставляя пользователю возможность выбора необходимого варианта.
В профессиональной версии системы предусмотрен экспорт (вывод) результатов обработки в виде файлов для последующего использования. В учебной версии Deductor Academic данная опция отсутствует.
В платформе Deductor представлено большинство основных технологий анализа, позволяющих достаточно быстро проектировать законченные аналитические решения, охватывающие весь цикл обработки данных. Это – многомерный анализ, нейронные сети, деревья решений, самоорганизующиеся карты, спектральный анализ и ряд других.
Применение подобных самообучающиеся методов и машинного обучения дает возможность создавать адаптивные информационные системы. Во многом такой подход делает более мягкими требования к квалификации персонала, приближая современные информационные технологии к более широкому кругу пользователей.
С помощью аналитической платформой Deductor появляется возможность извлекать из ранее накопленных и хранящихся в организации (в компании, в фирме, в департаменте государственного учреждения и др.) данные, интересную и практически полезную информацию, и тем самым трансформировать ее в знания, дающие существенные конкурентные преимущества.
Тиражирование же знаний обеспечивается за счет того, что все отчеты, модели, правила, полученные экспертом с помощью аналитической платформы Deductor, могут использоваться другими сотрудниками организации без необходимости понимания способов и методов получения этих результатов.