Тел.: +7 (495) 708-32-81, (499) 245-02-13  •  E-mail: reclama@tpnews.ru

Большие базы данных как ресурс банка будущего

A A= A+ 02.05.2019

М. К. БЕЛЯЕВ, кандидат экономических наук, эксперт РИСИ

А. Д. ЕРОХОВА, магистрант РАНХ и ГС

Применение компьютеров и программ современного уровня не просто вооружает бизнес-структуры новыми знаниями. Кардинально меняется модель рыночного поведения, а информация становится важнейшим ресурсом. Банки в этом смысле обладают уникальными конкурентными позициями. Только крупнейшие банки США, по оценке консалтинговой компании Alacer, располагают приблизительно эксабайтом (1018 байт) информации [3]. Мало что говорит о предпочтениях людей лучше, чем их счета, отражающие доходы, расходы и цели, размер чека в магазине, кредитные истории и т. п. Подобная информация  – ценнейший ресурс, на основании которого можно таргетировать рекламу и оптимизировать работу с клиентами, создавая продукт с индивидуальными характеристиками, что гарантирует его востребованность. Вот мнение одного из российских экспертов: «Мы стоим на пороге революционных перемен, связанных с развитием сетевого взаимодействия людей, с интеллектуализацией хозяйственной деятельности… Указанные тенденции формируют условия для качественного, а не косметического изменения финансового рынка, очерчивают образ его возможного будущего» [2]. Беспрецедентный объем накопленной информации и перспективы ее использования выдвигают на первый план задачу сбора и обработки сведений самого широкого охвата. Значительная часть таких сведений, находящихся в распоряжении банков, мало соответствует формату структурированных баз данных, с которыми оперируют традиционные информационные системы. Среди таких не унифицированных данных и веб-журналы, и видеозаписи, и текстовые документы, геопространственные характеристики, карты и др. При этом «неформатные» данные могут содержаться в разнообразных хранилищах зачастую за пределами организации. К тому же информация непрерывно пополняется и обновляется. В результате создается парадоксальная ситуация: у банка как будто есть доступ АНАЛ к огромному объему данных и в то же время не хватает инструментов, чтобы эффективно использовать их в работе. Что это дает Инновационные технологии, применяемые для управления данными, помогают финансовым организациям более эффективно справляться с рядом актуальных задач корпоративного менеджмента. Назовем лишь некоторые из них. Улучшение взаимодействия с клиентами. Ограничиваясь только массовым продвижением продуктов, многие банки до сих пор не учитывают потребности отдельных групп клиентов. В результате организации затрачивают избыточные ресурсы, пытаясь продавать не тот продукт не тому клиенту. Большие данные позволяют уточнять запросы потребителей и адресовать им персонализированные предложения. Обеспечение соответствия законодательству и отраслевым стандартам. Требования PSD2, Basel III, FATCA – лишь некоторые примеры нормативов, которые продолжают существенно влиять на расходы банков по оптимизации операционной деятельности. Помимо этого существуют и национальные стандарты со своими наборами правил. Модернизация базовых банковских систем. Многие европейские банки нуждаются в основательном обновлении своих базовых систем, но полностью заменить их новыми в короткие сроки крайне затруднительно. Этот процесс будет проходить поэтапно, по модульному принципу, начиная с модернизации наиболее устаревших систем. Внедрение мобильных решений. Возможность выполнения банковских операций на мобильных устройствах становится одной из наиболее популярных услуг, и большинство банков уже занимаются разработкой новых инструментов для ее внедрения в практику. Ход работ и, соответственно, поступление инвестиций сдерживаются соображениями безопасности и сохранения целостности данных.

Результаты превосходят ожидания Эксперты видят бесспорные перспективы использования больших данных в области управления персоналом, привлечения клиентов, повышения операционной эффективности, оптимизации процессов и выявления рисков. Имеющийся опыт свидетельствует о том, что результаты внедрения инноваций существенно превосходят ожидания. Так, новейшие технологии могут применяться для отслеживания поведения клиентов с целью выявления подозрительной активности, а также для повышения точности данных, сокращения ошибок, своевременного реагирования на претензии клиентов и предотвращения мошенничества. Аналитика нового поколения стала важным фактором в обеспечении эффективной работы банков. Соответственно, требования к ее объемам, качеству и методам обработки информации быстро растут [11]. Немного истории С 1991 г. появился широкополосный Интернет. Он позволил увеличивать скорость передачи данных, а также обеспечил одновременную передачу данных нескольких типов. Кроме того, сделал возможными коммуникацию географических точек на больших расстояниях, осуществление телеметрических услуг (удаленные измерения и сбор данных с удаленных датчиков). В этих условиях объемы получаемой и генерируемой информации резко возросли. На производстве и в управлении стали  использоваться несколько ЭВМ, что усложнило структуру хранилищ данных и способы доступа к ним. Появились не только локальные сети, но и новые носители информации. В финансовой сфере в тот же период возникли новые потоки данных – биржевые и банковские показатели, сведения о финансовых операциях физических лиц. Это привело к колоссальным изменениям базовых финансовых показателей компаний. Доля неснижаемого остатка стоимости в 1991  г. превышала 30%, к 2010  г. она опустилась ниже 3%. Широкополосный Интернет обеспечил участникам биржи возможность работы в реальном времени и при желании в боковом тренде. Возможность уменьшить спред и повысить ликвидность торгуемых активов, в свою очередь, вызвала увеличение объема трансакций и рост популярности финансовых рынков. 

Большие данные Термин «большие данные» (big data) обязан своим появлением Клиффорду Линчу, редактору журнала Nature. В 2008 году журнал выпустил специальный номер, посвященный проблемам работы с огромными объемами разнообразной и разнородной информации. Линч предложил словосочетание по аналогии с такими метафорами, как «большая нефть», «большая руда» и тому подобными, отражающими не столько количество чего-то, сколько переход количества в качество [4]. Большие данные – комплексное понятие, сочетающее в себе непосредственно данные (множество закодированной информации) и совокупность технологий работы с ними.

Методы обработки больших данных В ряду технологий, которые появились в ответ на актуальные запросы практики, следует, в первую очередь, назвать облачные вычисления. Предпосылками их стали распространение высокопроизводительных сетей, недорогих компьютеров и средств хранения данных, а также широкое внедрение аппаратной виртуализации, сервис-ориентированной архитектуры и автономных вычислений. Эта модель обеспечивает повсеместный доступ к общему пулу конфигурируемых вычислительных ресурсов, которые могут быть быстро подготовлены к запуску с минимальными затратами управления. Облачные вычисления и решения для хранения данных предоставляют пользователям и предприятиям возможности для хранения и обработки своих данных либо в собственных, либо в сторонних центрах данных, которые могут быть расположены далеко от пользователей. 

Это позволяет компаниям избежать авансовых расходов на инфраструктуру (например, приобретение серверов). Предприятия могут все быстрее запускать свои приложения с улучшенной управляемостью и упрощенным обслуживанием, а команды ИТспециалистов  – адаптировать ресурсы для удовлетворения непредсказуемого бизнес-спроса. Самыми же эффективными на сегодня инструментами в обработке БД признаны «умные» аналитические системы. Правда, они требуют больших затрат. Расходы необходимы для статистики (разработки форм и сбора информации), проведения анализа (доработки моделей и разработки отчетов), обслуживания в процессе эксплуатации (резервное копирование и обеспечение защиты). Еще в комплекс действий по внедрению такой «умной» структуры входят предварительное обследование организации, анализ нормативноправовой базы, проектирование системы, создание дата-центра, обучение специалистов. Зато использование «умных» систем в сфере финансов позволяет проводить актуальный анализ статуса того же банка, не говоря уже об автоматизации процессов управления и принятии бизнес-решений на операционном уровне [6]. Достоянием практики стала технология блокчейн. Она уже апробирована при обеспечении безопасности данных и предот вращения рисков мошенничества. Эта система открыта в одностороннем порядке. Снабдить ее данными или воспользоваться ими может любой пользователь. Однако доступ к операциям открывается только с разрешения майнеров, которые наделены правами подтверждения осуществления трансакции. Информация попадает в систему с одним кодом, трансформируется и сохраняется с другим, распределяется с третьим. Для разрешения майнеров тоже необходим определенный ключ, подтверждающий или запрещающий операцию. Каждый блок информации  – отражение всей системы и неразрывно связан с другими элементами. Это значит, что в систему нельзя нелегально добавить что-то или внести какоето незаметное исправление. 

MapReduce Одна из разработок хранения данных представлена в 2010 г. компанией Google. Это технология MapReduce. На первой стадии – Map – осуществляются предобработка и фильтрация данных с помощью пользовательской функции. На второй стадии – Shuffle (англ. перетасовка) – происходит вывод функции Мap, где данные «разбираются по корзинам», каждая из которых соответствует одному ключу вывода стадии Map. На завершающем этапе каждая «корзина» со значениями, сформированная на стадии Shuffle, попадает на вход функции Reduce (англ. уменьшать). Reduce – третья и завершающая стадия процесса обработки БД. 

Уже перестал восприниматься как фантастика искусственный интеллект (ИИ) – компьютерные системы, обладающие ключевыми навыками человеческого разума, такими как понимание языка, способность общаться, рассуждать, обучаться, решать проблемы, действовать, делать заключения и т.  д. [1]. Ключевая особенность ИИ − способность к решению поставленных задач по алгоритму, подобному тому, который использует человеческий мозг. В свою очередь, ключевая технология ИИ − машинное обучение, то есть создание комплексного алгоритма для анализа больших  объемов данных, их сопоставления, нахождения в них взаимосвязей, построения предиктивных моделей. Главное в машинном обучении − способность самостоятельно обучаться и улучшать заложенный алгоритм для получения высоких результатов. Первая и самая простая форма машинного обучения − построение регрессионных моделей, которые позволяют на основе имеющихся данных предсказывать значение переменной, например, определять стоимость залога. Одна из последних разработок  − когнитивные вычисления, особенность которых заключается в умении ИИ взаимодействовать с человеком на межличностном уровне. Они не просто распознают человеческую речь, но благодаря анализу данных о других людях могут делать самостоятельные «умозаключения». Например, простой алгоритм может ответить на вопрос: «Где ближайший банкомат банка и как к нему пройти?» ИИ найдет на карте банкомат и проложит маршрут. С помощью когнитивных вычислений машины могут ответить на сложные и нетривиальные вопросы. Например: «С помощью каких инструментов мне лучше накопить определенную сумму на отпуск?» Алгоритм даст несколько вариантов, отреагирует на обратную связь и даст скорректированные советы, после чего порекомендует, куда пользователю отправиться в отпуск, как накопить на это средства и т. д. Когнитивные вычисления позволяют ИИ учиться гораздо быстрее, используя более обширные данные. Пока массовое внедрение когнитивных вычислений сдерживается необходимостью применения суперкомпьютеров с огромной вычислительной мощностью и немалой стоимостью. Через расстояния В арсенал современных банков постепенно входят технологии удаленного доступа. И если с каналами связи вопрос можно считать решенным, то необходимость идентификации и аутентификации клиента пока серьезное препятствие. Идет активная работа над созданием надежных методов распознавания уникальных, неотъемлемых и постоянных характеристик отдельного человека. Будущее здесь за биометрическими технологиями, которые основаны на идентификации индивида по присущим только ему биологическим признакам.

Выделяют два типа биометрических данных:

■ статические  – уникальные признаки, полученные человеком от рождения (такие как ДНК, отпечатки пальцев, геометрия руки, рисунок радужной оболочки глаза);

■ динамические  – характеристики, приобретенные со временем или способные меняться с возрастом либо под внешним воздействием (например, подпись, походка, особенности набора текста, голос) [12]. Объем мирового рынка биометрических систем на конец 2016  г., по данным компании Jhonson & Partners, оценивался в 14,45 млрд долларов США. В ближайшие 6 лет, согласно прогнозу, показатель среднегодового темпа роста (CAGR) рынка биометрических технологий составит почти 18,6 процента, а весь объем рынка к 2022 г. вырастет до 40,2 млрд долларов США [10].

Наиболее распространена двухфакторная модель аутентификации: например, пин-код или одноразовый пароль плюс биометрические технологии. Она используется в онлайн-банкинге, банкоматах, при доступе к банковским ячейкам. Решения трехфакторной аутентификации включают в себя смарт-карты с пин-кодом и биометрическими технологиями, смарт-карты с двумя технологиями биометрического распознавания (пин-код плюс два вида биометрических факторов). Такие решения используются в сферах, требующих строгой конфиденциальности, например, при обеспечении доступа к банковским сейфам, хранилищам секретных данных. Четырех- и пятифакторная аутентификация основана на комбинации смарт-карты с пинкодом и нескольких видов биометрического распознавания (лицо, отпечатки пальцев, радужная оболочка, голос). Такие системы применяются в сложных и дорогих проектах повышенной секретности. Например, швейцарский банк Pictet & Cie для доступа к банковским ячейкам использует четырехфакторную идентификацию: флеш-накопитель (ключ) с пин-кодом, идентификация по радужной оболочке глаза и трехмерному изображению лица. В России удаленная идентификация заработала 30 июня 2018года. С этого момента сбор биометрических данных доступен более чем в 400 точках банковского обслуживания в 140 городах России [13]. Упомянем еще открытые интерфейсы (open API), позволяющие обеспечить получение и передачу данных между информационными системами различных организаций c использованием стандартных протоколов обмена данными без участия человека. Открытые интерфейсы обеспечивают сетевой эффект за счет интеграции и повторного использования сервисов различных производителей, что позволяет компаниям концентрировать ресурсы и усилия на создании только новых решений.

Основные цели внедрения принципов открытых интерфейсов на финансовом рынке следующие:

■ диверсификация применения сервисов банков и финансовых организаций в комплексных сценариях обслуживания физических и юридических лиц;

■ ускорение взаимодействия участников рынка в процессе создания новых продуктов и услуг;

■ обеспечение недискриминационного доступа провайдеров услуг к финансовой инфраструк туре для поддержания конкурентной и экономически эффективной финансовой среды.

* * * Под влиянием складывающихся условий, обострившейся конкуренции с новыми игроками финансового рынка и запросов потребителей довольно быстро и радикально меняется деятельность банков. Работа с большими данными дает им возможность формировать наиболее эффективные бизнес-стратегии и перестраивать свою операционную деятельность, обеспечивая долгосрочную финансовую устойчивость. 

Список литературы

1. Бердышев А. В. Об условиях развития банков в цифровой экономике. Проблемы конфигурации глобальной экономики XXI века: идея социально-экономического прогресса и возможные интерпретации. Сборник научных статей. Том второй / Под ред. д. э. н., проф. М. Л. Альпидовской, д. э. н., проф. С. А. Толкачева. – Краснодар, 2018. 

2. Миловидов В. Д. Будущее финансового рынка // Проблемы национальной стратегии. – 2017, № 5.

3. Дяченко О. Когда данные становятся «умными»: Smart Data имеют прикладную значимость для решения бизнес-задач // Национальный банковский журнал. – 2018, № 5. – С. 90–92

4. Черняк Л. «Большие данные» – новая теория и практика // Открытые системы. – 2011, № 10.

5. Форман Дж. Много цифр. Анализ больших данных при помощи Excel. – «Альпина паблишер», 2016.

6. Volkova U. S. Big data in the modern world // Concept. – 2016, vol. 11, p. 1171–1175,.

7. Гусенков А. М. Интеллектуальный поиск сложных объектов в массивах больших данных // Russian Digital Libraries Journal. – 2016, v. 19, № 1.

8. Локтионова Е. А., Рагозина А. В. Особенности применения систем анализа больших данных в деятельности коммерческого банка // Baikal Research Journal. – 2017.

9. Середненко Е. С. Анализ экономической эффективности решений класса Big Data в коммерческом банке // Современные информационные технологические и ИТ-образование. – 2014.

10. Международная консалтинговая компания [сайт] : URL: http://johnson-partners.com/.

11. Портал деловых новостей [сайт] : URL: https://rbc.ru/.

12. Центральный банк Российской Федерации [сайт] : URL: http://www.cbr.ru/.

13. http://www.cbr.ru/fintech/remote_authentification/.

 

 


Наши проекты