Как добыть необходимую достоверную информацию для принятия решений?

| статьи | печать

Развитие сервисной составляющей бизнеса, а также повышение его энергоэффективности как основного направления предполагают сбор и обработку больших объемов различных типов данных и информации для принятия обоснованных стратегических и оперативных решений. Причем новые методы, подходы и технологии работы с такими данными, например big data1, позволяют проводить более качественный анализ, получать достоверные результаты и в то же время значительно ускорить этот процесс. Знания и навыки в этой области — важное конкурентное преимущество. Но готовы ли специалисты к такой работе? Чтобы правильно поставить задачу и получить на выходе необходимую информацию, важно знать принципы работы, модели и методы таких технологий и использовать их возможности на практике. Расскажем о них.

Информационные технологии преобразуют материальную основу современного мира, а технологические изменения приобретают все более революционный характер. В этой связи в деятельности современных организаций происходят определенные изменения:

  • производительность все в большей степени зависит от использования достижений науки и техники, а также от качества информации и менеджмента;

  • производители и потребители все больше времени и внимания уделяют работе с информацией;

  • в организации производственного процесса происходят глубокие преобразования: от стандартизированного массового в направлении кастомизированного, от вертикально интегрированной организации в сторону горизонтальных сетевых взаимодействий и взаимосвязей между подразделениями;

  • в экономике и деятельности организаций все больше проявляются взаимосвязи и взаимозависимости, информация стала более доступной и превратилась в один из главных ресурсов и товаров.

Меняются и способы обработки данных и информации.

Принципы работы новых технологий обеспечили решение большого круга практических задач

С целью подготовки информации для принятия решений в середине ХХ века уже использовались суперкомпьютеры. Экономисты формулировали задачу, математики занимались написанием алгоритмов по наводке экономистов, а программисты реализовывали работу с написанными алгоритмами. Так решался вопрос кодирования информации, ее распределения, а также хранения. В результате данные объединяли и одновременно классифицировали в большой информационной таблице.

Затем персональные ЭВМ (ПЭВМ) позволили бизнесмену самостоятельно выполнять функции постановки задачи, алгоритмизации и программирования, что привело к резкому ухудшению качества процесса обработки данных. Во-первых, мощности у ПЭВМ были значительно меньше, во-вторых, процессом начал управлять не специалист.

Появление в общем доступе широкополосного интернета (с 1991 г.) позволило обмениваться данными, находясь в разных точках мира. С ростом объемов данных изменился и способ их хранения. Данные распределялись в большой таблице (долгосрочная память) и стали защищенными. В то же время дополнительно был создан небольшой блок для информации — мини-база данных, которая в течение дня аккумулирует информацию, обновляет ее, вносит поправки, а через сутки отправляет все данные в главную таблицу и становится пустой — готовой к следующему дню. Интеграция данных в большую защищенную таблицу требовала огромного количества времени и сил, поэтому данные в этой таблице стали храниться в статичном неизменном виде (рис. 1).


На основе развития современных технологий появилась система блокчейн, которая относительно решила проблему защищенности данных.

Блокчейн подразумевает закрытую систему защиты информации и транзакций путем разделения обязанностей между майнерами, которые разрешают или отклоняют проведение транзакции, имея уникальный код. Для осуществления транзакции необходимо согласие всех, что нивелирует ответственность и возможность авторитарного контроля. Такую систему трудно взломать, потому что всей системой управляет не один код, а тысячи трансформирующихся кодов на разных этапах осуществления транзакции. Однако сегодняшние технологии, например оптоволоконные сети, многократно увеличивают риск взлома, поскольку увеличение скорости компьютера позволяет ему увеличивать количество операций, в том числе касающихся взлома защищенных систем.

Облачные технологии позволили решить проблему быстрой и качественной обработки данных, ускорив тем самым процесс подготовки решений. Как бизнес работает с такими технологиями?

На ПЭВМ он задает запрос и направляет его в облако, выполняющее роль некоего суперкомпьютера, а обработанный запрос возвращается в виде сформулированного прогноза.

Обработка данных в облаке, где нагрузка распределена между большим количеством машин, происходит по технологии map reduce — модели программирования, предназначенной для параллельной обработки больших объемов данных с разделением работы на множество независимых задач.

На первой стадии (map — дорожная карта) осуществляется предобработка и фильтрация данных с помощью пользовательской функции, на второй стадии (shuffle — тасовать) происходит вывод функции map, где данные «разбираются по корзинам», каждая из которых соответствует одному ключу вывода стадии map. На завершающем этапе (reduce — сокращение) каждая «корзина» со значениями, сформированная на предыдущей стадии, попадает на вход функции reduce (рис. 2).


Принципиальные изменения структуры и типов данных способствовали появлению новых механизмов, классификаторов, нейросетей. Основные же возможности хранения данных кардинально не изменились. Можно выйти за границы привычных для нас графических, текстовых и числовых ресурсов, появилась возможность иметь дело с новыми форматами данных — фото, видео, аудио, а также со специфическими данными — психологическими, поведенческими характеристиками клиентов, их субъективной оценкой. Научились кодировать даже такую тактильную информацию, как вкус, запах и т. д.

Приведем основные принципы работы с большими данными:

  • горизонтальная масштабируемость — система обработки больших данных должна быть расширяемой;

  • отказоустойчивость — вышеупомянутый принцип подразумевает, что машин в кластере может быть много, а методы работы с большими данными должны учитывать возможность сбоев и переживать их без каких-либо значимых последствий;

  • локальность данных — расходы на передачу данных могут превысить расходы на их обработку, поэтому обрабатывать данные нужно на той же машине, где они хранятся.

Современные технологии big data позволяют решать следующие задачи:

  • классификации — отнесения входного вектора (объекта, события, наблюдения) к одному из заранее известных классов, например целенаправленного найма специалистов;

  • кластеризации — разделения множества входных векторов на группы (кластеры) по степени похожести друг на друга, например сегментирования рынка. Есть метод DQC, который работает без предварительного знания о структурах, их типе и топологии скрытых в данных и позволяет выявить такие характеристики. Парадигма такова: пусть данные говорят о себе сами. Такой метод позволяет решать задачу как искать иголку в многомерном стоге сена, не зная, как она выглядит, и не зная, есть ли она в этом стоге. Метод хорошо работает с многомерными данными, время анализа линейно зависит от размерности данных;

  • сокращения описания в целях быстрого и емкого информирования, визуализации данных, лаконизма моделей, упрощения счета и интерпретации, сжатия объемов собираемой и хранимой информации;

  • ассоциации — поиска повторяющихся образцов (устойчивых связей);

  • прогнозирования;

  • анализа отклонений.

Среди методов, позволяющих решать такие задачи, назовем также анализ выбросов, скрытых закономерностей, например анализ рыночной корзины, и, конечно, эволюционные алгоритмы, которые запускают весь этот процесс.

Использование приведенных принципов, моделей, методов, технологий позволяет провести более качественный анализ, сделать прогноз и быстро подготовить обоснованные бизнес- и финансовые решения.

Как специалистам использовать возможности работы с технологиями big data для выполнения своих задач

Наряду с преимуществами и новыми возможностями больших данных в экономических исследованиях существуют также проблемы получения и управления данными, разработки новых подходов к их анализу и интерпретации (рис. 3). Чтобы пользоваться всеми возможностями, необходимо разработать структуру и механизмы работы именно с новыми типами данных.


Для современного экономиста не обязательно глубоко погружаться в тонкости технологий, позволяющих обрабатывать и анализировать большие данные, он должен понимать основы, так как его задачей, как и задачей менеджера, является правильная постановка задачи, а построением алгоритмов и созданием программ занимаются профильные специалисты — математики и программисты.

В этой связи будущим экономистам необходимо владеть языками программирования SQL (применяется для создания баз данных) и R (анализ данных), считают эксперты передовых университетов.

Ключевой проблемой современных организаций становится поиск информации. Для маркетинга, например, это вопрос данных о клиенте. Современный клиент купается в предложениях. При этом делиться своими мыслями относительно продукта он не очень любит. А чтобы достучаться до него, компании часто применяют неверные решения, как выудить информацию у клиента (отзыв, мнение, предложение, его личные данные и т. д.). Например, занимаются рассылкой, которая в 80—90% случаев неэффективна, она не дает ни данных, ни анализа поведения клиента на сайте, ведь он не реагирует на рассылку. Компании часто присылают SMS со скидками и акциями на свою продукцию, что часто раздражает клиента.

Существуют и другие пути, Google и Mail добывают информацию с помощью новых технологий. Устанавливая невидимый контроль за клиентом и не нарушая напрямую его личные границы, в нужный момент они демонстрируют ему свое готовое уникальное торговое предложение (УТП). Пользователь думает, «как здорово», а не «где они взяли информацию». Так появляются лояльные клиенты, согласные предоставить необходимую для компании информацию.

При стандартном же подходе к поиску Google и прочие общедоступные поисковые системы не позволяют найти необходимую информацию. Поисковый робот выдает только 1—2% всей собранной информации, при этом лишь порядка 10% ее является релевантной запросу. Введя один запрос в одно время с разных компьютеров, можно получить различные результаты. Почему это так?

Дело в том, что технологии Google дают возможность анализировать различные факторы о владельце ПК и выдавать ту информацию, которую пользователь хочет увидеть, но не ту, которая ему нужна. Несколько дней ранее владелец ПК посещал разные развлекательные сайты, искал, как можно отдохнуть в городе или за городом, хотел купить овощи. После анализа таких действий поисковой системой в ответ на запрос «купить дом с зеленой крышей» пользователь может получить «анекдот про то, как купить дом с зеленой крышей», «фильм про зеленую крышу» или просто открыть ссылку «купить дом», попасть на выставку «дом с зеленой крышей» и т. д.

Не только система несовершенна, но и пользователь не понимает принципов ее работы. В таком случае возникают разногласия в позиции клиента и организации, барьер в развитии отношений с рынком.

Есть несколько способов решить такую проблему. Можно использовать поисковых операторов, позволяющих построить более точный запрос. Другой подход — воспользоваться специальными поисковыми программами, которые дают более релевантные результаты2.

И третий, самый лучший, но и самый дорогой вариант — создать собственного поискового робота, который способен удовлетворить специализированные запросы наиболее полно и точно.

Чтобы управлять информацией, нужно понимать ключевые задачи и иметь навыки постановки правильных запросов

Динамичные изменения спроса в связи с технологической революцией привели к тому, что фокус внимания ряда современных компаний сместился на клиента и они изменили свою маркетинговую стратегию 4P (product, place, price, promotion) на 4С (consistency, content, convenience, contextual), которая свелась просто к С-Customer. В клиентоцентричных компаниях все большую роль занимают нематериальные активы — применение знаний, уникальной информации и грамотное управление ими.

Потребитель стал осторожным и невосприимчивым к традиционным инструментам маркетинга, и чтобы удержать его в условиях большого выбора, нужно искать индивидуальный подход к нему и формировать УТП. Если раньше компаниям было все равно, какой путь проходит клиент от работы до дома, какую еду он обычно покупает, с кем общается, чем интересуется и т. д., то сегодня в некоторых компаниях работать с такой индивидуальной информацией для повышения объемов продаж — базовые задачи маркетинга. Владение данными о клиенте, полученными в процессе выстраивания доверительных долгосрочных отношений, представляет собой маркетинговые активы.

Кроме того, возросла роль партнерств. Например, производство компании Samsung, практически полностью основано на аутсорсинге. Производство деталей, сборка, логистика и т. д. осуществляются за физическими пределами компании, что говорит о серьезном расширении значения сотрудничества, сети контактов и связей.

Наряду с маркетинговыми активами, партнерством к базовым элементам нематериальных активов относится также бизнес-интеллект (BI). Роль управления такими новыми процессами и возможностями возрастает настолько, что именно знания становятся основным конкурентным преимуществом компании на современном рынке. Ведь цель компаний по-прежнему состоит в увеличении стоимости, повышении инвестиционной привлекательности, развитии и расширении бизнеса.

Формированию навыков постановки правильных запросов и пониманию ключевых задач нужно учиться. Не случайно тренды исследований лидеров мировых университетов и бизнес-школ в области экономики и финансов (Kellogg, Stanford, HBS) основаны на трех основных темах: данные и знания, управление, инновации. Сюда относятся генерации знаний (наука и ее сегменты в других секторах); распространение и применение знаний (исследования и разработки, производство товаров и услуг, коммерциализация нововведений); рынок научно-технической продукции, рыночные институты. Научные и бизнес-школы видят ценность в подготовке специалистов узкого профиля, осведомленных во всех отраслях3.

Для бизнеса важно построить точный прогноз развития

Для менеджмента клиентоориентированных компаний основная проблема состоит в прогнозе развития бизнеса на основе оценки будущей стоимости и инвестиционной привлекательности компаний. Однако неточности построения таких прогнозов — одна из основных проблем сегодня. Ее решение было найдено с помощью нового подхода к обработке данных — формализации процесса постановки задачи. Для работы с новыми данными сегодня используются когнитивные технологии. Они помогают значительно увеличить скорость обработки данных. Помимо этого, в отличие от привычных поисковиков, которые выдают очень ограниченный перечень источников информации в ответ на запрос, когнитивные технологии способны на основе анализа непрерывно обновляющихся баз данных сформулировать решение и предоставить его в ответ на запрос. Особенности когнитивных технологий таковы:

  • единообразие: одинаковая работа по всем каналам в офлайне и онлайне;

  • контент: обеспечение клиентов и партнеров доступными методами для получения точной и всесторонней информации;

  • удобство: клиент должен иметь возможность взаимодействовать с сервисом различными путями;

  • контекст: вовлечение клиента с учетом индивидуальных нужд.

Существуют также программные решения:

  • для анализа большого количества транзакций, привязанных к профилю пользователя;

  • статистического моделирования, помогающего предсказать поведение клиента;

  • помощи в принятии бизнес-решений: в финансовом менеджменте применяется когнитивная платформа Watson. Эта система воспринимает человеческую речь и может общаться с человеком, рекомендуя ему определенные услуги;

  • поиска, извлечения, обобщения и структуризации информации из практически любого текстового контента на разных языках (PROMT Analyser).

Разработками таких когнитивных технологий, внедряемых в производство, занимаются крупнейшие клиентоориентированные корпорации, такие как IBM, Microsoft, Google и прочие.

С учетом развития новых технологий и экономики знаний специалисты должны уметь работать с современными данными, развитыми аналитическими методами, применяемыми в маркетинговой деятельности клиенториентированных организаций, и правильно пользоваться технологиями big data. Это позволит сформировать и отработать навыки постановки релевантных запросов, работы с программами эффективного мониторинга и понимания ключевых задач бизнеса.

1 «Новые технологии Big Data — результат агрессивной маркетинговой стратегии или инструмент бизнеса?», «ЭЖ», 2015, № 25, с. 16—17.

2 iMetaSearch — поисковая программа, позволяющая получить поисковые результаты, максимально адекватные запросу, сгруппированные по категориям и ключевым словам. В бесплатной версии использует Google, в платной версии может быть подключено до 16 поисковиков. «Нейрон» — включает надстройку для объединения поиска Google и Yandex, а также позволяет осуществлять конкурентный анализ.

3 Университеты Гарварда, Чикаго, Стенфорда, Принстона, Массачусетский технологический институт и др.