Предсказательная или прогнозная аналитика (англ. predictive analytics) представляет собой класс методов анализа данных, позволяющих предсказывать будущее поведение объектов и субъектов путем анализа текущей и исторической информации для принятия верных решений.
Предсказательная аналитика развивается вместе с наукой о данных и является одной из самых перспективных и быстроразвивающихся сфер IT. Наряду с классическими статистическими методами она использует методы интеллектуального анализа данных, теории игр. Прогнозы данных строятся с применением самых актуальных технологий: машинного обучения, регрессионного анализа, построения деревьев решений. Также в предсказательной аналитике при анализе моделей данных широко используются нейронные сети.
Использование прогрессивных технологий в предиктивной аналитике, а также работа анализа бизнес-процессов на грани объединения с математикой, статистикой и эконометрикой позволяет достаточно точно оценивать риски и возможности, исходя из текущей ситуации и конкретного набора условий и максимально способствовать принятию оптимального решения.
В условиях цифровой экономики и быстрых темпов развития, прогнозная аналитика получила широкое применение в бизнес-окружении для преобразования бизнес-процессов, начиная с автоматизации подготовки данных и заканчивая использованием прогнозной оценки для принятия стратегических бизнес-решений.
В 2013 году компания SAP, один из мировых лидеров на рынке решений для анализа больших данных , представила отдельный десктопный продукт, содержащий методы предиктивной аналитики - SAP Predictive Analytics.
Рисунок 1. Preview интерактивного проекта SAP Predictive Analytics
SAP Predictive Analytics
Общее описание
SAP Predictive Analytics – это решение, позволяющее осуществлять сбор данных и строить на основе этих данных прогнозные модели, позволяющие предсказывать ход последующих событий. Построение прогнозных моделей осуществляется путем поиска закономерностей и взаимосвязей в исторических и текущих данных.
Прогнозные модели могут быть построены с помощью таких инструментов как Automated Analytics (позволяет создавать простые модели, например модели классификации, регрессии, кластеризации, временных рядов) и Expert Analytics (позволяет использовать сложные алгоритмы анализа с применением языка статистического анализа и открытым исходным кодом на языке R).
Особая ценность этого решения для бизнеса состоит в возможности связать SAP Predictive Analytics с продуктивными БД, где хранятся оперативные данные. А это позволяет легко создавать актуальные прогнозы данных. Удобный интерфейс обеспечивает возможность работы с простыми предиктивными моделями, не прибегая к помощи специалистов. Поэтому процесс принятия решений значительно ускоряется. В качестве примера можем рассмотреть конкретный кейс, опубликованный компанией SAP:
C помощью SAP Predictive Analytics европейской специализированной комиссией по контролю перевозок животных и продуктов животного происхождения была решена проблема обнаружения мошенничества: ранее контроль осуществлялся по индивидуальному подозрению инспектора, что позволяло обнаруживать только небольшой процент неправомерных перевозок. После внедрения SAP Predictive Analytics проверка 30% контейнеров привела к обнаружению 85% нарушений.
Результат, как говорится, на лицо.
Функциональные возможности
SAP Predictive Analytics позволяет работать с данными, загруженными из продуктивных баз данных (поддерживаются таблицы и различные view SAP HANA, SQL view на SAP HANA, виртуальные таблицы Smart Data Access). Также существует возможность работы с данными, загруженными из плоских файлов (файлов Microsoft Excel и текстовых файлов). Все это упрощает работу с источниками данных и делает работу SAP Predictive Analytics более универсальной.
Рисунок 2. Подготовка данных в SAP Predictive Analytics
На этапе подготовки модели данных существует возможность с помощью удобных инструментов с интуитивным интерфейсом изменять вид источника данных: скрывать и переименовывать показатели и аналитики, создавать новые аналитические объекты (популяции с меткой времени, сущности, основные показатели эффективности (KPI) и аналитические записи).
Для построения предиктивных моделей данных используются инструменты Automated Analytics и Expert Analytics. А прогнозирование и анализ данных в инструменте Automated Analytics осуществляется с помощью нескольких модулей:
- Модуль Data Manager помогает в предварительной подготовке аналитических данных. Есть возможность выполнять агрегацию журнала событий для объединения информации из различных источников, выполнять анализ последовательности (агрегировать события в цепочку переходов), выполнять предварительный анализ и оценку текстовых переменных.
- Модуль Modeler предлагает широкие возможности создания аналитических моделей данных: создание классификационной/регрессионной модели, создание модели кластеризации, анализа временного ряда - идентифицировать и понять явление, представляемое временным рядом, и предсказать его развитие в краткосрочной и долгосрочной перспективе, генерации правил ассоциации на основе справочной таблицы и таблицы транзакций а также загрузки ранее сгенерированной модели данных.
- Также Automated Analytics является мощным инструментом анализа информации из социальных сетей. В модуле Social присутствуют возможности извлечения и использования неявной структурной реляционной информации, которая хранится в наборах данных разных видов, в том числе и из социальных сетей. Существует возможность анализа геолокаций и частых путей в соцсетях, также можно загрузить готовую модель анализа информации из социальных сетей.
- Модуль Recommendation позволяет на основе информации, полученной из социальных сетей выработать систему рекомендаций по продуктам для клиентов, а также загрузить готовый механизм рекомендаций.
Так при анализе социальных сетей клиентов аптек в США было выявлено мошенничество со стороны пациентов и врачей. Были составлены базы уже известных случаев мошенничества, построена схема связей пациентов, врачей и аптек, построены сети связей. В результате эффективность обнаружения случаев мошенничества значительно увеличилась.
А компания SKYLARK, владеющая крупнейшей сетью ресторанов в Японии использовала анализ социальных сетей и заказов для повышения уровня индивидуальных маркетинговых предложений клиентам. В результате этой компанией была налажена система, позволяющая каждому клиенту подбирать оптимальные предложения в оптимальное для него время.
Рисунок 3. Построение модели прогнозирования данных в Expert Analytics
Инструмент Expert Analytics является более сложным инструментом для углубленного анализа и более точного прогнозирования данных. Доступны возможности прогнозирования временного ряда, обнаружения посторонних значений, анализа трендов, классификационного анализа, сегментного анализа и анализа аффинитивности. Особую гибкость Expert Analytics обеспечивает то, что в Expert Analytics реализован широкий диапазон алгоритмов прогнозирования с использованием языка статистического анализа с открытым исходным кодом R и функций сбора данных в памяти для эффективной обработки больших объемов данных.
Expert Analytics также обладает удобными инструментами визуализации данных, что позволяет представлять результаты анализа в том числе и в таких формах, как точечные матричные диаграммы, параллельные координаты, кластерные диаграммы и деревья принятия решений.
Рисунок 4. Визуализация данных
Преимущества SAP Predictive Analytics
- Поддержка алгоритмов на языке R
Одним из главных преимуществ SAP Predictive Analytics является поддержка пользовательских алгоритмов прогнозирования данных на языке R, что обеспечивает гибкость и широкие возможности приложения в использовании для нестандартных кейсов прогнозирования данных. Также очевидным преимуществом является набор готовых моделей прогнозирования с открытым кодом на языке R, что позволяет модифицировать уже готовые алгоритмы прогнозирования.
- Удобный интерфейс
SAP Predictive Analytics обладает удобным, интуитивно понятным интерфейсом моделирования, прогнозирования и визуализации данных, что позволяет не только сократить трудозатраты на прогнозирование данных, но также и обеспечить возможность прогнозирования последствий своих решений непосредственно лицами, принимающими решения без необходимости прибегать к помощи специалистов по прогнозированию данных, что может сократить время принятия решений и сделать работу компании более мобильной.
- Широкие возможности визуализации данных
В SAP Predictive Analytics присутствуют широкие возможности визуализации данных, аналогичные SAP Lumira. Это позволяет наглядно продемонстрировать результаты прогноза и четко видеть картину последствий принятий решений. Графики и диаграммы, построенные на базе данных прогноза, могут быть экспортированы в виде плоских инфографик, интерактивных бордов, а также могут быть интегрированы в отчеты.
- Интеграция с продуктивными базами данных
SAP Predictive Analytics поддерживает данные, загруженные из продуктивных БД (таблицы и различные view SAP HANA, SQL view на SAP HANA, виртуальные таблицы Smart Data Access). Это позволяет строить продуктивные прогнозы на базе самой актуальной информации.
- Отслеживание моделей на протяжении всего их жизненного цикла
Возможность отслеживать прогнозные модели в процессе их работы и изменять их позволяет переобучать и корректировать модели по мере изменения данных. Таким образом, существует возможность добиться максимальной продуктивности и точности прогнозных моделей.
- Возможность импорта существующих моделей связанных с бизнес-контентом
SAP Predictive Analytics позволяет использовать стандартные модели прогнозирования данных, связанные с бизнес-контентом SAP. Таким образом, готовые SAP решения могут быть использованы на полную мощность, предоставляя возможность модификации и реализации готовых кейсов также и в прогнозировании данных.
- Возможность работать с различными объемами данных
В SAP Predictive Analytics осуществляется поддержка различных объемов данных. Можно оперировать как данными из небольших CSV-файлов, так и очень большими наборами данных в SAP HANA. Это позволяет не только работать любыми продуктивными данными, но и осуществлять разработку и тестирование моделей на данных небольшого объема
SAP Predictive Analytics является универсальным инструментом для обработки, анализа, прогнозирования и визуализации данных. Этот продукт позволяет создавать и поддерживать прогнозные модели любой сложности на основе данных любого объема из разных источников. Понятный интерфейс и широкие возможности визуализации результатов прогнозирования в самых разных формах способствуют быстрому и точному принятию оптимальных решений на всех уровнях управления в компании, что является залогом успешного функционирования и развития компании.