IITU

№AP19576825

Разработка методов и алгоритмов машинного обучения для выявления финансирования террористической деятельности в Республике Казахстан


Руководитель проекта
Болшибаева Айгерим Какимжановна, PhD, ассистент-профессор (kakim-aigerim@mail.ru)

Наименование приоритетного направления: 4 Информационные, коммуникационные и космические технологии. 4.1 Искусственный интеллект и информационные технологии: 4.1.5 Машинное обучение (machine learning)


Цель проекта. Обзор методов интеллектуального анализа, которые можно использовать для выявления финансовых преступлений. Разработка модели машинного обучения для выявления финансирования террористических организаций на основе открытых данных для определения максимально возможного набора аномалий финансирования.

Актуальность. Одной из важнейших угроз современной цивилизации является терроризм, повлиявший на качество жизни людей во всем мире. Цели терроризма заключаются в нестабильности путем создания страха, беспокойства и неуверенности в большом масштабе, чем у отдельного человека. Согласно последним данным глобальной базы данных по терроризму (GTD), только за 2019 год в мире произошло 1211 различных терактов, в результате которых пострадало 6362 человека.

Визуализация карты мира, покрывающая различные виды террористической деятельности, представлена на рисунке 1. Согласно данной карте точки распространения терроризма находятся в непосредственной близости к Казахстану.

6825Fig1

Рисунок 1 Карта мира GTD, показывающая интенсивность терроризма в 2020 году

Выявление подозрительной деятельности, связанной с финансированием терроризма, является существенным и неизбежным, поскольку это затрагивает экономику, промышленность, финансовые учреждения и всю нацию. Из-за большого объема банковских данных и огромного количества задействованных транзакций банки создают удобную среду для лиц, занимающихся финансирования терроризма, чтобы скрыть происхождение финансирования терроризма, так что методы финансирования терроризма стали более изощренными и их трудно отследить. Следовательно, решение по обнаружению финансирования терроризма должно быть сбалансировано между точностью и временем обработки. Поиск подходящего метода обнаружения финансирования терроризма в финансовых учреждениях/банках является наиболее важным шагом для решения, применяя подходящий подход машинного обучения с точки зрения набора данных. Подходы и методы обнаружения аномального финансирования разнообразны, что затрудняет сравнение. «Однако анализ, обзор и сравнение различных методов обнаружения финансирования терроризма необходимы для выявления преступлений, закономерностей, необычного поведения и групп, занимающихся отмыванием денег, с целью финансирования терроризма».

В конце 1990-х годов для обнаружения аномальных транзакций были внедрены статистические методы и сопоставление последовательностей, а затем стали использоваться методы, основанные на правилах. Позже финансовые учреждения начали внедрять статистические модели и модели машинного обучения в свои автоматизированные программы. Эти модели очень сложны из-за растущего числа транзакций клиентов и автоматизированного взаимодействия с клиентами, что усложняет соблюдение требований по борьбе с преступными действиями. В некоторых недавних исследованиях указывалось, что проблему большого размера набора данных можно решить, применяя методы обучения с учителем, которые требуют обучения на основе помеченного набора данных, а затем моделируют классификацию новых данных по различным категориям меток. Таким образом, модели обучения с учителем могут обнаруживать только подозрительные действия, транзакции и шаблоны, которые аналогичны обучающим данным.

При возникновении сложного механизма транзакции, специалистам необходимо проводить процедуру диагностики повторно, с возможной консультацией узкого специалиста, что замедляет своевременное выявление аномальных финансовых процессов. Так же применяемые наборы исследования транзакций специалистами устаревают, и часто бывают неадаптивными.

Одним из путей решения вышеперечисленных барьеров к является использование методов ML. Нейронные сети являются лидирующими методами для проблем классификации, регистрации и автокоррекции данных. Используя нейронные сети как основной метод оценки и аннотации данных в комбинации с классическими методами ML, мы предлагаем разработать систему обнаружения финансовых преступных действий по финансирования терроризма.

Ожидаемые результаты:

  1. Методы интеллектуального анализа данных, использующиеся для выявления финансовых преступлений;
  2. Разработка базового алгоритма, идентифицирующего аномальные объекты финансирования (мошеннические объекты);
  3. Построение сформированного масштабного объема очищенных данных;
  4. Разработка алгоритмов создания тестовых баз данных с максимально возможным набором;
  5. Разработка программного обеспечения для определения мошеннических финансовых транзакций;
  6. Публикация монографии;
  7. Планируется опубликовать:
  • не менее 2 статей и (или) обзоров в рецензируемых научных изданиях по научному направлению проекта, индексируемых в Science Citation Index Expanded базы Web of Science и (или) имеющих процентиль по CiteScore в базе Scopus не менее 35. Например, Lecture Notes in Computer Science, процентиль 57 или Journal of Theoretical and Applied Information Technology, процентиль 37, или International Journal of Electronics and Telecommunications, процентиль 35, а также в журналах, рекомендуемых ККСОН РК. В каждой статье будет информация об идентификационном регистрационном номере и наименовании проекта, с указанием грантового финансирования в качестве источника;
  • либо не менее 1 статьи или обзора в рецензируемом научном издании по научному направлению проекта, индексируемом в Science Citation Index Expanded базы Web of Science и (или) имеющем процентиль по CiteScore в базе Scopus не менее 35 и не менее 1 патента, включенного в базу данных Derwent Innovations Index;
  • либо не менее 1 статьи или обзора в рецензируемом научном издании по научному направлению проекта, индексируемом в Science Citation Index Expanded базы Web of Science и (или) имеющем процентиль по CiteScore в базе Scopus не менее 35 и акта внедрения или лицензионного соглашения на нее;
  • не менее одной статьи или обзора в рецензируемом зарубежном или отечественном издании, рекомендованном КОКСОН;
  • либо не менее одной статьи или обзора в рецензируемом научном издании, входящем в 1 квартиль по импакт-фактору в базе Web of Science.

Достигнутые результаты:

В ходе выполненного исследования решен комплекс научных и прикладных задач, направленных на разработку и апробацию интеллектуальных методов анализа финансовых транзакций для выявления признаков финансирования терроризма и иных аномальных схем.

На основе анализа теоретико-методологических подходов определены ключевые характеристики террористических и экстремистских финансовых потоков, выявлены источники их формирования, типология, поведенческие и структурные индикаторы подозрительных транзакций. Особое внимание уделено проблеме дисбаланса классов и необходимости использования синтетических данных, обеспечивающих возможность моделирования редких сценариев при сохранении статистического реализма.

Проведен обзор современных инструментов и алгоритмов выявления финансовых преступлений; сравнительный анализ rule-based, классических ML-подходов и архитектур глубокого обучения, включая графовые нейронные сети (GNN). Показано, что традиционные методы ограничены в условиях масштабных транзакционных графов и высокой динамичности потоков. Обоснована целесообразность перехода к гибридным архитектурам, объединяющим графовые и глубинные методы.

Предложена структура диск-базированного графового предпроцессора DGFP, направленного на снижение вычислительной нагрузки и обеспечение масштабируемой обработки больших графов за счет разделения хранения и вычислений, ленивых вычислений и иерархического кэширования.

Получены результаты экспериментальных исследований на синтетических наборах данных AMLSim и PaySim. Проведено тестирование DGFP и его интеграции с алгоритмами машинного обучения, включая Isolation Forest. Полученные результаты подтвердили эффективность предложенного подхода: достигнуто сокращение пикового потребления памяти более чем в два раза, снижение времени обработки, а также рост F1-показателя при детектировании аномалий. Экспериментальная часть доказала применимость разработанной архитектуры для анализа потоковых транзакций в условиях ограниченных вычислительных ресурсов.

Разработан и описан прототип, включающий модуль машинного обучения с интеграцией DGFP, блок визуализации и аналитики, а также интерфейс взаимодействия с внешними системами. Проведено финальное тестирование с участием независимых экспертов, подтверждающее работоспособность и технологическую готовность решения для интеграции в инфраструктуру финансового мониторинга.

Таким образом, поставленная цель — разработка и экспериментальная проверка гибридных методов машинного обучения для выявления финансирования террористической деятельности — достигнута.

Основные научные и практические результаты заключаются в следующем:

  • Проведен комплексный анализ теоретических, правовых и технологических аспектов выявления финансирования терроризма;
  • Разработана и реализована архитектура DGFP, обеспечивающая масштабируемую обработку транзакционных графов;
  • Проведена экспериментальная проверка эффективности предложенных алгоритмов на синтетических и потоковых данных;
  • Создан прототип платформы, интегрирующий DGFP в модуль искусственного интеллекта системы финансового мониторинга;
  • Разработанная технология DGFP находится на уровне TRL-5 — валидация технологии в лабораторных условиях (экспериментальная проверка на синтетических и тестовых данных). При этом архитектура и программный прототип готовы к переходу на уровень TRL-6, предполагающий демонстрацию интеграции в целевой инфраструктуре системы финансового мониторинга.

Результаты исследования могут быть использованы в деятельности государственных органов, банков и финансовых организаций в рамках систем противодействия отмыванию денег и финансированию терроризма (AML/CFT), а также в образовательных и исследовательских проектах по анализу транзакционных данных и применению методов машинного обучения в сфере финансовой безопасности.

Список публикаций (2023-2025):

  • Bolshibayeva A., Rakhmetulayeva S., Kulbayeva A. Machine Learning Methods to Detect Terrorist Financing. — Proceedings of the 8th International Conference on Digital Technologies in Education, Science and Industry (DTESI 2023), 06–07 Dec 2023, Almaty, Kazakhstan https://ceur-ws.org/Vol-3680/S3Paper7.pdf.
  • Kulbayeva A.K., Rakhmetulayeva S.B., Bolshibayeva A., Yasar A.-U.-H. Data Processing Methods for Financing Terrorism: The Role of Microsoft Power BI in Money Laundering Detection. — Procedia Computer Science, Vol. 238, 2024, pp. 528–535. DOI: 10.1016/j.procs.2024.06.056 (ANT / EDI40 2024, Hasselt University, Belgium; Scopus, CiteScore = 2.4, процентиль = 54).
  • Valyayev D., Mukasheva A., Yedilkhan D., Mukhammejanova D. FMEA variables of software failure risks based on journals and metrics. — 2024 IEEE 4th International Conference on Smart Information Systems and Technologies (SIST), Astana, Kazakhstan, 2024, pp. 302–307. DOI: 10.1109/SIST61555.2024.10629469 (IEEE Xplore, Scopus).
  • Bolshibayeva A., Kozhamzharova D., Kulbayeva A., Rakhmetulayeva S. Analyzing Existing Patterns in Transactions for Terrorism Financing Detection. — 2024 Eighth IEEE International Conference on Robotic Computing (IRC), Tokyo, Japan, 2024, pp. 284–289. DOI: 10.1109/IRC63610.2024.11053980 (IEEE Xplore, Scopus).
  • Rakhmetulayeva S., Kulbayeva A., Bolshibayeva A., Serbin V. Identifying the graph-based typology features for machine learning models in financial fraud detection. — Eastern-European Journal of Enterprise Technologies, 2025, 3(9(135)), pp. 40–54. DOI: 10.15587/1729-4061.2025.327410 (Scopus, CiteScore = 2.4, процентиль = 54).
  • Bolshibayeva A., Rakhmetulayeva S., Kulbayeva A., Yasar A.-U.-H. Design and implementation of disk-based graph feature preprocessor for terrorist financing detection. — Eastern-European Journal of Enterprise Technologies, 2025, 5(9(137)), pp. 11–24. DOI: 10.15587/1729-4061.2025.340033 (Scopus, CiteScore = 2.4, процентиль = 54).
  • Кулбаева А.К., Рахметулаева С.Б., Болшибаева А.К., Мукашева А.К. Применение метода машинного обучения для исследования проблем отмывания денег и финансирования терроризма в Республике Казахстан. — Вестник АУЭС, №4(63), 2023, с. 67–76, DOI: 10.51775/2790-0886_2023_63_4_67.
  • Кулбаева А.К., Рахметулаева С.Б., Болшибаева А.К. Detecting money laundering activities in Kazakhstan: a machine learning approach and a comprehensive study. — Вестник ВКТУ, №104(2), 2024, с. 53–64. DOI: 10.51885/1561-4212_2024_2_53.
  • Болшибаева А.К., Рахметулаева С.Б., Бишманов К.М., Муратжан З. Обнаружение аномальных финансовых транзакций с использованием методов машинного обучения: модель, эксперимент и оценка распределения памяти. — Вестник АУЭС, №2(69), 2025, с. 124–134. DOI: 10.51775/2790-0886_2025_69_2_124.
  • Болшибаева А.К., Кулбаева А.К., Рахметулаева С.Б. Веб-приложение мониторинга финансовых транзакций. — Свидетельство о внесении сведений в Государственный реестр прав на объекты, охраняемые авторским правом, №56472 от 07.04.2025 г.
  • Болшибаева А.К., Рахметулаева Б.С., Бишманов К.М., Изенов Е.Н., Жанабеков Ж.О., Үкібасов Б.М., Сарсембаев А.А., Кулбаева А.К., Идельбаев Е.С., Рахметулла Г.Б., Муратжан З. Система выявления аномальных финансовых транзакций. — Патент на полезную модель №10841 от 11.07.2025 г.
  • Акт о внедрении результатов научно-исследовательской работы по теме: «Разработка методов и алгоритмов машинного обучения для выявления финансирования террористической деятельности в Республике Казахстан» (№ AP19576825) — Астана, Агентство Республики Казахстан по финансовому мониторингу, октябрь 2025 г. — 4 с.

Состав исследовательской группы:

№ п/п

Ф.И.О., ученая степень, ученое звание

Основное место работы, должность

Публикационная активность

1

Болшибаева Айгерим Какимжановна, PhD

АО МУИТ, ассистент-профессор

Scopus ID: 57209662829 Google Scholar ID: https://scholar.google.com/citations?hl=ru&user=o5KZBgMAAAAJ ORCID: 0000-0003-1191-4249

2

Рахметулаева Сабина Батырхановна, PhD

АО МУИТ, ассоциированный профессор

Scopus ID: 56181453800 Google Scholar ID: https://scholar.google.com/citations?user=RoyTsYgAAAAJ&hl ORCID: 0000-0003-4678-7964

3

Мукашева Асель Коптлеувна, PhD

КБТУ, ассоциированный профессор

Scopus ID: 57198816714 Google Scholar ID: https://scholar.google.com/citations?user=CxUvBk8AAAAJ&hl=enORCID: 0000-0001-9890-4910

4

Жанабеков Жандос Омарович, магистр

КБТУ, сениор-лектор, докторант

Scopus ID: 57422410600 ORCID: 0000-0001-5984-7132

5

Үкібасов Баубек Мұратұлы, магистр

АО МУИТ, сениор-лектор, докторант

Scopus ID: 58759292400 ORCID: 0000-0002-0439-0187

6

Кульбаева Алия

АО МУИТ, докторант

Scopus ID: 58249864100 ORCID: 0009-0002-7245-8312

7

Муртажан Зарина

Алматинская академия МВД РК им. Макана Есбулатова, старший научный сотрудник Научно-исследовательского центра, докторант

8

Болшибаев Айдос Алтынбаевич

ТОО «Мобайл Телеком Сервис», системный аналитик

9

Бегзатқызы Ырысгул

АО МУИТ, бухгалтер

Версия сайта для слабовидящих