Институт проблем информатики Российской Академии наук
Институт проблем информатики Российской Академии наук
Российская Академия наук

Институт проблем информатики Российской Академии наук




«Информатика и ее применения» (Том 14, Выпуск 4, 2020)

Оглавление | Об авторах

О вероятностных оценках достоверности эмпирических выводов

  • А. А. Грушо  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, grusho@yandex.ru
  • М. И. Забежайло  Вычислительный центр Федерального исследовательского центра "Информатика и управление" Российской академии наук, m.zabezhailo@yandex.ru
  • Д. В. Смирнов  ПАО Сбербанк России, dvlsmimov@sberbank.ru
  • Е. Е. Тимонина  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, eltimon@yandex.ru

Аннотация: Работа посвящена некоторым особенностям анализа данных в задачах поиска инсайдеров. Обсуждаются возможности использования различных подходов к описанию диагностики действий инсайдеров при анализе больших эмпирических данных. В задачах этого типа необходимо установить (спрогнозировать, диагностировать и др.) наличие или отсутствие целевых свойств у каких-либо пользователей из заданного множества. Оценка правильности правдоподобных рассуждений проверяется на основе оценок вероятностей случайного появления найденных закономерностей в простейших вероятностных моделях. Рассмотренные примеры показывают, при каких соотношениях параметров возможно эффективное выявление корреляционных связей между событиями, с помощью которых можно выявлять инсайдеров. Указаны два способа управления соотношениями между параметрами, позволяющие получать содержательную информацию. Первый способ основан на разделении периода наблюдений на промежутки, в течение которых искомая корреляция может проявиться. Второй способ связан со способами сокращения множества пользователей, которые потенциально могут стать инсайдерами, т. е. речь идет о формировании кластеров, в которых вероятностные оценки становятся работоспособными. Искомые соотношения между параметрами для поиска корреляций можно определять с помощью предельных теорем в схеме серий.

Ключевые слова: враждебный инсайдер; каузальный анализ; вероятностные оценки случайного появления свойств

Влияние параметров изоляции на разделение ресурсов при нарезке сети

  • Ф. А. Москалева  Российский университет дружбы народов, moskaleva-fa@rudn.ru
  • Ю. В. Гайдамака  Российский университет дружбы народов; Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, gaidamaka-yuv@rudn.ru
  • В. С. Шоргин  Институт проблем информатики Федерального исследовательского центра "Информатика и управление " Российской академии наук, vshorgin@ipiran.ru

Аннотация: Технология нарезки радиоресурсов сети определяется как один из основных компонентов пятого поколения мобильных коммуникаций, способных решить проблему колоссального роста объема трафика данных в сотовых сетях. Ключевая особенность нарезки радиоресурсов сети, или сетевого слайсинга, позволяющая ограничить влияние одного слайса на другой, заключается в обеспечении изолированных гарантий производительности для предоставления высокого качества обслуживания (QoS, Quality of Service). В статье с помощью аппарата теории массового обслуживания построена модель разделения ресурсов при нарезке сети, позволяющая исследовать разделение ресурсов в соответствии с различными стратегиями справедливости. Задача разделения ресурсов сформулирована в форме задачи оптимизации относительно зависящей от параметра изоляции весовой функции ресурса системы, занятого заявками каждого слайса. Проведенный численный анализ показал существенное влияние параметра изоляции на изменение характеристик производительности системы.

Ключевые слова: нарезка сети; справедливое разделение ресурсов; изоляция слайсов; параметр изоляции

Система массового обслуживания с орбитами для анализа совместного обслуживания трафика с малыми задержками URLLC и широкополосного доступа eMBB в беспроводных сетях пятого поколения

  • П. А. Харин  Российский университет дружбы народов, pxarin@mail.ru
  • Е. Д. Макеева  Российский университет дружбы народов, len16730637@yandex.ru
  • И. А. Кочеткова  Российский университет дружбы народов; Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, gudkova-ia@rudn.ru
  • Д. В. Ефросинин  Университет имени Иоганна Кеплера, Австрия; Российский университет дружбы народов, dmitry.efrosinin@jku.at
  • С. Я. Шоргин  Институт проблем информатики Федерального исследовательского центра "Информатика и управление " Российской академии наук, sshorgin@ipiran.ru

Аннотация: Для современных беспроводных сетей пятого поколения (5G) характерны три сценария их использования - крупномасштабные системы межмашинной связи (massive machine-type communication, mMTC), сверхнадежная передача данных с малой задержкой (ultrareliable low-latency communication, URLLC) и усовершенствованная подвижная широкополосная связь (enhanced mobile broadband, eMBB). Требования к качеству предоставления услуг и их параметры в рамках данных сценариев существенно разнятся: так, для URLLC характерна сверхнизкая, до 1 мс, задержка, а для eMBB - сверхвысокая скорость передачи данных. Возникает актуальная задача организации совместного предоставления таких услуг В статье построена схема совместного обслуживания трафика URLLC и eMBB, исходя из того что данные URLLC имеют малый объем и могут занимать менее одного ресурсного блока (physical resource block, PRB). Анализ схемы проведен при помощи разработанной системы массового обслуживания (СМО) с двумя орбитами, предназначенными для временного хранения прерываемых и ожидающих начала обслуживания менее приоритетных запросов eMBB. Получен матричный алгоритм для расчета распределения вероятностей и формулы для вероятностных характеристик системы.

Ключевые слова: 5G; сверхнадежная передача данных с малой задержкой (URLLC); усовершенствованная подвижная широкополосная связь (eMBB); система массового обслуживания с орбитами; прерывание обслуживания

Стационарные характеристики системы Geo/G/1/infinity с неординарным входящим потоком, управляющим размером очереди

  • С. И. Матюшенко  Российский университет дружбы народов, matyushenko_si@pfur.ru
  • Р. В. Разумчик  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, rrazumchik@ipiran.ru

Аннотация: Рассматривается функционирующая в дискретном времени система массового обслуживания (СМО) с одним прибором, очередью неограниченной емкости и неординарным геометрическим потоком заявок. В системе реализован специальный механизм управления очередью: в момент поступления в систему новой группы заявок ее размер сравнивается с текущим общим числом заявок в системе и, если число заявок в новой группе превышает общее число заявок в системе, новая группа целиком принимается в систему, вытесняя при этом все прежде находившиеся в ней заявки; в противном случае новая группа покидает систему, не оказывая на нее никакого воздействия. Заявки обслуживаются прибором по одной. В предположении, что заявки в группе независимы, а распределения чисел заявок в группе и времени обслуживания являются произвольными дискретными, найдены основные стационарные характеристики функционирования.

Ключевые слова: дискретное время; неординарный поток; управление очередью; выходящий поток

О распределении отношения суммы элементов выборки, превосходящих некоторый порог, к сумме всех элементов выборки. II

  • В. Ю. Королев  Факультет вычислительной математики и кибернетики Московского государственного университета имени М. В. Ломоносова; Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, vkorolev@cs.msu.ru

Аннотация: Рассматривается задача описания распределения доли суммы независимых случайных величин, которая составлена из слагаемых, превосходящих некоторый заданный порог. В отличие от известных вариантов такой задачи, в которых фиксируется число суммируемых крайних порядковых статистик, особенность рассматриваемой здесь задачи заключается в том, что заданный порог может быть превзойден не предсказуемым заранее числом элементов выборки. Для случая, когда порог неограниченно возрастает с увеличением объема выборки, показано, что распределение указанного отношения может быть приближено обобщенным пуассоновским распределением, в котором обобщающим служит обобщенное распределение Парето.

Ключевые слова: сумма независимых случайных величин; случайная сумма; биномиальное распределение; смесь распределений вероятностей; экстремальная порядковая статистика; теорема Балкема-Де Хаана - Пикандса; обобщенное распределение Парето; обобщенное пуассоновское распределение

О марковских и рациональных потоках случайных событий. II

  • В. А. Наумов  Исследовательский институт инноваций, г. Хельсинки, Финляндия, valeriy.naumov@pfu.fi
  • К. Е. Самуйлов  Российский университет дружбы народов; Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, samouylov-ke@rudn.ru

Аннотация: Статья представляет собой вторую часть обзора, выполненного в рамках проекта РФФИ № 19-17-50126. Цель обзора - ознакомление заинтересованных читателей с основами теории марковских потоков событий для более подробного изучения и облегчения применения этих моделей на практике. В первой части приведены свойства общих марковских потоков событий и показана их связь с марковскими аддитивными процессами и процессами марковского восстановления. Во второй части обзора рассмотрены важные для приложений частные случаи таких потоков - подклассы марковских потоков событий, а именно: простые и групповые потоки однородных и неоднородных событий. Показано, как свойства марковских потоков событий связаны с мультипликативностью стационарных распределений марковских систем. Обсуждаются матрично-экспоненциальные распределения и рациональные потоки событий, расширяющие возможности марковских потоков для моделирования сложных систем, при этом сохраняющие удобство их анализа с помощью вычислительной техники.

Ключевые слова: марковские процессы; марковские аддитивные процессы; потоки без последействия; МС-потоки

Методы детерминированных и рандомизированных энтропийных проекций для редукции размерности матрицы данных

  • Ю. С. Попков  Федеральный исследовательский центр "Информатика и управление " Российской академии наук; Институт проблем управления им. В. А. Трапезникова Российской академии наук; ОРТ Брауде Колледж, Кармиель, Израиль, popkov@isa.ru
  • А. Ю. Попков  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, apopkov@isa.ru
  • Ю. А. Дубнов  Федеральный исследовательский центр "Информатика и управление" Российской академии наук; Национальный исследовательский университет "Высшая школа экономики", yury.dubnov@phystech.edu

Аннотация: Предложены методы детерминированного и рандомизированного проектирования, ориентированные на решение задачи понижения размерности. В случае детерминированного проектирования развивается параллельная процедура сжатия матрицы данных, минимизирующая кросс-энтропию Куль- бака-Лейблера с учетом ограничения на информационную емкость, основанная на методе проекции градиента. Для рандомизированного проектирования рассматривается задача понижения размерности признакового пространства. Идея применения процедур проектирования для сжатия матрицы данных реализуется в предлагаемом методе рандомизированного энтропийного проектирования, где используется принцип сохранения среднего расстояния между многомерными и маломерными точками в соответствующих пространствах. Задача поиска оптимальных проекторов сводится к поиску распределения вероятностей, максимизирующего информационную энтропию Ферми при ограничении на среднее расстояние между точками многообразия, которые отображаются матрицами данных и оптимальной проекции.

Ключевые слова: понижение размерности; кросс-энтропия Кульбака-Лейблера; энтропия

Оптимизация структуры сетей глубокого обучения

  • М. С. Потанин  Московский физико-технический институт, mark.potanin@phystech.edu
  • К. О. Вайсер  Московский физико-технический институт, vajser.ko@phystech.edu
  • В. А. Жолобов  Московский физико-технический институт, zholobov.va@phystech.edu
  • В. В. Стрижов  Вычислительный центр имени А. А. Дородницына Федерального исследовательского центра "Информатика и управление" Российской академии наук; Московский физико-технический институт, strijov@ccas.ru

Аннотация: Исследуется проблема выбора оптимальной структуры модели. Моделью служит суперпозиция обобщенных линейных моделей, элементами которой являются линейная регрессия, логистическая регрессия, метод главных компонент, автоэнкодер и нейросеть. Под структурой модели понимаются значения структурных параметров модели, задающих вид итоговой суперпозиции. Исследуется свойства алгоритма выбора структуры модели. Исследуется зависимость точности, сложности и устойчивости модели от способа задания структуры. Создан алгоритм выбора оптимальной структуры нейронной сети. Проведен вычислительный эксперимент с использованием реальных и синтетических данных. В результате эксперимента существенно снижена структурная сложность моделей с сохранением точности аппроксимации.

Ключевые слова: выбор моделей; линейные модели; автокодировщик; нейронные сети; структура; генетический алгоритм

Повышение сбоеустойчивости самосинхронных схем

  • И. А. Соколов  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, ISokolov@ipijran.ru
  • Ю. А. Степченков  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, YStepchenkov@ipijran.ru
  • Ю. Г. Дьяченко  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, diaura@mail.ru
  • Ю. В. Рождественский  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, YUogdest@ipijran.ru

Аннотация: Анализируется проблема устойчивости самосинхронных (СС) схем, изготовленных по технологии комплементарный металл-диэлектрик-полупроводник (КМДП), к кратковременным логическим сбоям (ЛС), генерируемым внешними воздействиями: ядерными частицами, космическими лучами, электромагнитными наводками. Практические СС-схемы реализуются в виде конвейера с запрос-ответ- ным взаимодействием между его ступенями и двухфазной дисциплиной работы с чередованием рабочей фазы и спейсера. Комбинационная часть ступени конвейера использует парафазное со спейсером кодирование информационных сигналов. Индикаторная подсхема ступени конвейера подтверждает окончание переключения всех элементов ступени, возбужденных в текущей фазе работы, и формирует сигналы управления запрос-ответным взаимодействием ступеней конвейера. Рассмотрены физические причины появления ЛС и проанализированы типы сбоев, возможных в КМДП-СС-схемах с проектными нормами 65 нм и ниже. Сравниваются характеристики сбоеустойчивости разных вариантов СС-регист- ров хранения. Предлагаются схемотехнические и топологические методы повышения сбоеустойчивости СС-конвейера. Даются оценки сбоеустойчивости СС-конвейера в зависимости от места появления ЛС.

Ключевые слова: самосинхронная схема; сбоеустойчивость; конвейер; рабочая фаза; спейсер

Об одном подходе к формированию в условиях высокой неопределенности маркеров конфиденциальности в системах интенсивного использования данных

  • В. И. Будзко  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, vbudzko@ipiran.ru
  • В. В. Ядринцев  Федеральный исследовательский центр "Информатика и управление" Российской академии наук; Российский университет дружбы народов, vvyadrincev@gmail.com
  • И. В. Соченков  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, sochenkov@isa.ru
  • В. И. Королёв  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, vkorolev@ipiran.ru
  • В. Г. Беленков  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, vbelenkov@ipiran.ru

Аннотация: Основные задачи, результаты решения которых отражены в статье, связаны с формированием маркеров конфиденциальности (МК) при их применении в системах интенсивного использования данных (СИИД) в условиях, когда состав и структура охраняемых сведений не может быть заранее определена в связи с отсутствием данных или с высокой динамикой их изменения либо их определение нецелесообразно в связи с большим (или неограниченным) количеством сущностей, сведения о которых подлежат охране. В данной работе предложен подход к формированию в указанных условиях МК текстовых материалов. Сформулирована логика процесса семантической обработки текста, позволяющего в условиях высокой неопределенности состава и структуры охраняемых сведений формировать МК при их применении для обеспечения информационной безопасности в СИИД. Полученные экспериментальные результаты позволяют перейти к практической реализации рассмотренного подхода в СИИД.

Ключевые слова: маркер конфиденциальности; информационная безопасность; интенсивное использование данных; кластер; семантика; технические средства обеспечения безопасности; интеллектуальные задачи безопасности; текстовая классификация; обнаружение текстовых заимствований

Метод визуального представления конфликтов в гибридных интеллектуальных многоагентных системах

  • С. Б. Румовская  Калининградский филиал Федерального исследовательского центра "Информатика и управление" Российской академии наук, sophiyabr@gmail.com
  • И. А. Кириков  Калининградский филиал Федерального исследовательского центра "Информатика и управление" Российской академии наук, baltbipiran@mail.ru

Аннотация: Малые коллективы экспертов, включающие специалистов различных направлений, эффективно решают сложные проблемы благодаря их анализу с различных точек зрения и получению более качественного интегрированного решения. Конфликт в малых коллективах экспертов может как завести в тупик процесс принятия решения, так и породить позитивные изменения: развитие группы, диагностику отношений, сплачивание группы. Конфликт порождает дискуссии, позволяющие получить более продуманные и согласованные решения. Подобные коллективы эффективно решают проблемы, и моделирование их работы, в частности возможной конфликтной ситуации и процесса управления ею, позволяет вырабатывать метод решения, релевантный сложной задаче. Визуализация конфликтной ситуации делает возникшие противоречия контрастными, видимыми. В работе коллектив агентов-экспертов представляется в виде неориентированного взвешенного графа и рассматриваются методы визуализации (укладки) графов. Для визуализации проблемно- и процессно-ориентированных конфликтов в рамках гибридных интеллектуальных многоагентных систем (ГиИМАС) предложен метод, разработанный на базе пружинной модели укладки графов.

Ключевые слова: : коллектив экспертов; конфликт агентов; визуализация конфликта

Оценка стоимости опционов на основе моделей ARIMA-GARCH с ошибками, распределенными по закону SU Джонсона

  • А. Р. Данилишин  Московский государственный университет имени М.В. Ломоносова, факультет вычислительной математики и кибернетики, danilishin-artem@mail.ru
  • Д. Ю. Голембиовский  Московский государственный университет имени М. В. Ломоносова, факультет вычислительной математики и кибернетики; Московский финансово-промышленный университет "Синергия", golemb@cs.msu.su

Аннотация: В продолжение статьи "Риск-нейтральная динамика для модели ARIMA-GARCH с ошибками, распределенными по закону SU Джонсона" в данной работе приводятся результаты экспериментов для моделей ARIMA-GARCH (autoregressive integrated moving average - generalized autoregressive conditional heteroskedasticity) с нормальными (N), экспоненциальными бета второго типа (EGB2) и SU Джонсона (JSU) распределениями ошибок. Стоимость европейских опционов оценивается методом Монте-Карло на основе результатов, полученных в указанной статье при помощи расширенного принципа Гирса- нова. Параметры моделей ARIMA-GARCH-N, ARIMA-GARCH-EGB2 и ARIMA-GARCH-JSU были найдены методом квазимаксимального правдоподобия. Эффективность полученных риск-нейтральных моделей исследовалась на примере биржевых европейских опционов PUT и CALL на базовые активы DAX (Deutscher Aktienindex) и Light Sweet Crude Oil.

Ключевые слова: ARIMA; GARCH; риск-нейтральная мера; расширенный принцип Гирсанова; распределение SU Джонсона; ценообразование опционов

Применение многомасштабного подхода и методов анализа данных для моделирования теплопроводности в слоистых структурах

  • К. К. Абгарян  Вычислительный центр им. А. А. Дородницына Федерального исследовательского центра "Информатика и управление" Российской академии наук; Московский авиационный институт (национальный исследовательский университет), kristal83@mail.ru
  • И. С. Колбин  Вычислительный центр им. А. А. Дородницына Федерального исследовательского центра "Информатика и управление " Российской академии наук; Московский авиационный институт (национальный исследовательский университет), eugavrilov@gmail.com

Аннотация: Моделирование тепловых свойств слоистых структур в настоящее время стало востребованным направлением научных исследований. Это связано с постоянно растущей скоростью работы микроэлектронных элементов на основе слоистых структур, выделяющих при работе все большее количество энергии в виде тепла, которое требуется отводить, чтобы избежать перегрева и потери функциональных свойств устройств. В работе представлен интеграционный подход, позволяющий объединить методы многомасштабного моделирования и анализа данных. Применение данного подхода дает возможность получить новое качество при решении задачи построения модели теплопереноса в двухслойной структуре GaAs/AlAs. Показана эффективность применения методов машинного обучения для анализа зависимости эффективного коэффициента теплопроводности слоистых материалов от структурных особенностей и внешних факторов. Развитие предложенного подхода сможет обеспечить формирование информации для обоснованного подбора материалов слоистых структур для микроэлектронных устройств.

Ключевые слова: многомасштабное моделирование; интеграционный подход; слоистые структуры; предсказательное моделирование; кинетическое уравнение Больцмана; коэффициент теплопроводности; методы анализа данных

О цифровой грамотности и средах ее формирования

  • В. Б. Бетелин  Федеральный научный центр Научно-исследовательский институт системных исследований Российской академии наук, betelin@niisi.msk.ru
  • А. Г. Кушниренко  Федеральный научный центр Научно-исследовательский институт системных исследований Российской академии наук, agk_@mail.ru
  • А. Л. Семенов  Московский государственный университет имени М. В. Ломоносова; Институт кибернетики и образовательной информатики им. А. И. Берга Федерального исследовательского центра "Информатика и управление" Российской академии наук; НИУ Московский физико-технический институт, alsemno@ya.ru
  • С. Ф. Сопрунов  Центр педагогического мастерства, soprunov@mail.ru

Аннотация: Цифровая грамотность становится ключевой характеристикой личности человека XXI в. Ее можно и нужно формировать с раннего возраста. Цифровые среды могут быть средами достижения предметных, метапредметных и личностных образовательных результатов. В работе анализируется отечественный и международный опыт в данном направлении начиная с 1960-х гг., приводится система принципов, обеспечивших эффективность для образовательных целей цифровых сред и систем, разработанных под руководством и при участии авторов. Эти среды и системы эффективно используются сегодня в РФ в формировании у детей раннего возраста цифровой грамотности и основы для computational thinking _ системного мышления XXI в. В статье приводится обзор результатов, полученных в данном направлении. Специальное внимание уделяется проблеме визуализации и представления в реальном мире алгоритмических процессов и задающих их программ.

Ключевые слова: информатика; цифровая грамотность; computational thinking; робот; язык программирования; Лого; ПервоЛого; ПиктоМир; визуализация

Эволюция классификаций в надкорпусных базах данных

  • А. А. Гончаров  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, a.gonch48@gmail.com
  • И. М. Зацман  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, izatsman@yandex.ru
  • М. Г. Кружков  Институт проблем информатики Федерального исследовательского центра "Информатика и управление " Российской академии наук, magnit75@yandex.ru

Аннотация: Рассматривается задача фиксации изменений, вносимых в описания значений немецких модальных глаголов в процессе аннотирования параллельных немецко-русских текстов с использованием надкорпусной базы данных (НБД). На примере этой задачи проанализирована специфика использования динамической классификационной системы (ДКС) в информационных системах. Специфика ДКС состоит в том, что смысловое содержание ее рубрик может меняться в процессе аннотирования, а это нередко влечет за собой потребность в реклассификации ранее сформированных аннотаций с измененными впоследствии рубриками. Основная цель статьи состоит в поиске ответов на два вопроса: (1) от каких факторов зависит необходимость редактирования и реклассификации аннотаций, сформированных до изменения рубрик; (2) с помощью каких операций можно вносить изменения в дефиниции рубрик ДКС. В статье определены семь типов возможных изменений дефиниций и описаны соответствующие им операции, применяемые к рубрикам ДКС в процессе аннотирования. Операции распределены на три группы в зависимости от того, требуют ли они программной или экспертной реклассификации ранее сформированных аннотаций.

Ключевые слова: динамическая классификация; фасетная классификация; реклассификация; надкор- пусная база данных