Главная \ Новости \ Фирма «ДАТА-ЦЕНТР Автоматика» и Уральский Федеральный Университет теперь работают в альянсе. Открыта совместная базовая кафедра. Направления деятельности - BIG DATA и методы видеоанализа.

Новости

Фирма «ДАТА-ЦЕНТР Автоматика» и Уральский Федеральный Университет теперь работают в альянсе. Открыта совместная базовая кафедра. Направления деятельности - BIG DATA и методы видеоанализа.

26 февраля 2014

В 2013 году в Уральском Федеральном Университете им. Б.Н.Ельцина (УрФУ) совместно с компанией ООО "ДАТА-ЦЕНТР Автоматика" была открыта базовая кафедра "Аналитика больших данных и методы видеоанализа". Целью деятельности кафедры является подготовка специалистов в быстроразвивающейся области информационных технологий – системы хранения и аналитической обработки больших объемов неструктурированных данных (Big Data), а также выполнение научных исследований и прикладных проектов для отраслей промышленности.

1. Подготовка специалистов

Кафедра специализируется в подготовке магистров по специальности "информационные технологии" и обеспечивает углубленную подготовку студентов в области технологий аналитики больших данных (Big Data). Платформы аналитики больших данных поддерживают такие технологии как Hadoop, MapReduce, анализ графов, шаблонов, путей и многих других аспектов и являются оптимальным как для сложной обработки больших объемов неструктурированных данных , так и для хранения больших объемов.

Система распределенных вычислений предоставляет широкие возможности для высокопроизводительной и сложной аналитики данных и широкий набор готовых к использованию аналитических модулей, исключая необходимость их полной разработки. Массовая параллельная обработка (MPP), как архитектура программного обеспечения и встроенного механизма MapReduce позволяют обеспечить непрерывный параллелизм данных и аналитической обработки. Загрузка данных, выполнение запросов, экспорт, резервное копирование, восстановление, установки и обновления выполняются с поддержкой параллелизма.

Для анализа данных предлагаютcя следующие инструменты:

  • Анализ путей и шаблонов
Позволяет находить закономерности в данных для дальнейшего использования в прогнозной и веб-аналитике.
   
  • Статистика
Высокопроизводительная обработка важных статистических показателей для дальнейшего использования в приложения анализа портфолио, рыночных цен, поведения абонентов и безопасности.
   
  • Анализ графов
Набор встроенных функций для обнаружения важных связей между данными для использования при анализе социальных сетей, лог-файлов, топологий сетей и многого другого.
   
  • Текстовый анализ
Функции анализа текста для проведения статистического анализа, выявления закономерностей в наличии слов, однокоренных слов, относительного расположения слов друг от друга и многое другое.
   
  • Преобразования
Преобразования данных внутри базы данных для предоставления возможностей более сложной аналитики.

 А также такие модули статистического анализа как:

  Анализ кластеров 
  • k-Means. Один из простейших самообучаемых алгоритмов для определения кластеров в данных. Функция позволяет анализировать входные данные и выявлять в них кластеры (группы). Основной задачей является нахождение центров для каждого кластера. Алгоритм работает за счет минимизации среднеквадратичного отклонения между центрами кластера и его элементами.
  • Kmeansplot. Позволяет анализировать модели данных на основании кластеров, найденных с помощью функции.
  • k-Means. Таким образом, это позволяет анализировать один набор данных с помощью найденной взаимосвязи в другом наборе.
  • Minhash. Вероятностный метод кластеризации, который присваивает двух абонентов в один и тот же кластер с вероятностной пропорцией пересечения услуг, которыми эти абоненты пользуются.
  • Canopy. Простой, быстрый и точный метод группирования объектов в предварительные кластеры. Каждый объект представляется как точка в многомерном пространстве признаков. Данный метод кластеризации часто используется в качестве первого шага в более строгих методов кластеризации, такие как k-means.
  Интеллектуальный анализ 
  • Наивный байесовский классификатор. Вероятностный классификатор, основанный на применении Теоремы Байеса со строгими предположениями о независимости.
  • Метод опорных векторов. Наиболее популярный набор готовых алгоритмов для задач классификации. Алгоритмы приобрели высокую популярность, т.к. имеют всего несколько настраиваемых параметров, а качество результатов работ являются вполне сопоставимыми с наивным байесовским классификатором или логистической регрессией.
  • Деревья принятия решений: набор функций позволяющий создавать прогностические модели, основанные на комбинациях различных алгоритмов машинного обучения деревьев принятия решений.
  Расширенный регрессионный анализ 
  • Логистическая регрессия. Это статистическая модель, используемая для предсказания вероятности возникновения некоторого события путём приведения данных к логистической кривой. Данный модуль включает набор функций, для построения моделей с использованием логистической регрессии.

Технологии аналитики больших данных нашли применение в решении таких задач как:

   Обеспечение безопасности и контроля качества на производстве: 
- мониторинг сенсорных данных с датчиков агрегатов, механизмов, сетей + геопространственные данные - состояние в режиме реального времени, предиктивный анализ выхода из строя механизмов для планирования оперативного и техобслуживания и пр.
- мониторинг расхода топлива и энергии – выявление закономерностей, детальный учет, выработка и контроль применения наиболее экономичных технологий работы (в т.ч. для разработки программ мотивации персонала, например, машинистов).
   Обеспечение корпоративной безопасности: 
- мониторинг по персоналиям, оказывающим влияние на деятельность компании – текстовый анализ (интервью, блоги, связи с конкурентами и пр.);
- выявление рисков и угроз по персоналу: негативное влияние на сотрудников и компанию, правонарушения, конфликты, нелояльность, негативное настроение и пр. – текстовый анализ, соцсети, связи;
- выявление рисков и угроз по контрагентам: мониторинг по компаниям («досье»), их руководителям и пр.
   Анализ мобильного трафика передачи данных (DPI).
  • Гео-аналитика.
  • Аналитика социальных связей (SNA) и мультиSIM клиентов.
  • Web аналитика.
  • Сентимент-анализ («анализ отношения»).

2. НИОКР

В рамках 218 постановления Министерства образования РФ Уральский федеральный университет им. Б.Н.Ельцина является исполнителем работ с существенным участием сотрудников кафедры “Аналитика больших данных и методы видеоанализа” по теме: "Разработка автоматизированной системы слежения, контроля, моделирования, анализа и оптимизации полного цикла выпуска металлургической продукции на основе создания и интеграции математических моделей технологических, логиcтических и бизнес-процесcов предприятия" или с более коротким названием "АВТОМАТИЗИРОВАННАЯ СИСТЕМА ВЫПУСКА МЕТАЛЛУРГИЧЕСКОЙ ПРОДУКЦИИ".

3. ИСТОРИЯ УСПЕХА

  • 1993 год – поставка системы STARC (Статистика Анализ Распознавание Кластеризация),фирма Парситек, Германия.
  • 1998 год – демонстрация аппаратно – программного комплекса для оптического распознавания образов на международной выставке CeBit, Германия.
  • 1998-2004 год – разработаны и установлены склады- автоматы для ответственного хранения ценностей в ЦБ РФ, ЦБ Белоруссии, Гознаке.
  • 2002 год – поставка системы распознавания номеров ЖД вагонов, ММК. Проведенные испытания показали достоверность распознавания - 98% при любых погодных условиях.
  • 2003 год – установка комплекса оптического распознавания образов в коммерческих и центральных банках более чем в 12 стран мира.
  • 2004 год – поставка системы 3D-моделирование в рамках проекта МНЛЗ, ММК. Проект награжден Государственной премией.
  • 2008 год – Гознак покупает патенты и технологию оптического контроля качества продукции.
  • 2010 год – разработана автоматизированная система мониторинга и статистического контроля процессов производства в КП, ЛПЦ-2, ПХЛ, ЛПЦ-3, ОАО "Северсталь", г.Череповец. Объединены данные более чем с 7 тыс источников.
  • 2012 год – разработка системы распознавания пассажиропотоков, очередей в кассы и на турникетах для Московской железной дороги.
  • 2013 год – разработка системы 3D-моделирования в управлении пригородным сообщением Московской Железной Дороги.
  • 2014 год - Открыта базовая кафедра совместно с УрФУ "Аналитика больших данных и методы видеоанализа".

Благодарность
за качественную работу

За  качественное   и   своевре-
менное   выполнение   электро-
монтажных и пусконаладочных работ  по реконструкции Аккер-
мановского рудника дирекцией ООО "ЮУГПК" была выражена благодарность компании "ДАТА-ЦЕНТР Автоматика". Также отдельно был отмечен произведенный монтажный инжиниринг по дополнениям и изменениям в проектах и своевременное участие в пусконаладочных работах с сотрудниками фирмы "KHD" по настройке технологической линии.