Институт проблем информатики Российской Академии наук
Институт проблем информатики Российской Академии наук
Российская Академия наук

Институт проблем информатики Российской Академии наук




«Информатика и ее применения» (Том 15, Выпуск 1, 2021)

Оглавление | Об авторах

Нормальные субоптимальные фильтры для дифференциальных стохастических систем, не разрешенных относительно производных

  • И. Н. Синицын  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, sinitsin@dol.ru

Аннотация: Рассмотрены вопросы синтеза среднеквадратичных (с.к.) нелинейных нормальных (гауссовских) субоптимальных фильтров (НСОФ) для дифференциальных стохастических систем (СтС), не разрешенных относительно производных. Представлены уравнения состояния и наблюдения нелинейных дифференциальных СтС, не разрешенных относительно производных. Один из разделов посвящен синтезу НСОФ при следующих условиях: (1) отсутствуют пуассоновские шумы в наблюдениях; (2) коэффициент при гауссовском шуме не зависит от состояния. Рассмотрен синтез НСОФ при аддитивных шумах в уравнениях состояния и наблюдения. Для иллюстрации методов синтеза НСОФ приведен пример. Рассмотрены вопросы качества НСОФ.

Ключевые слова: метод аналитического моделирования (МАМ); метод нормальной аппроксимации (МНА); метод статистической линеаризации (МСЛ); нормальный субоптимальный фильтр (НСОФ); стохастическая система (СтС); стохастические системы, не разрешенные относительно производных; формирующий фильтр (ФФ)

О некоторых частных случаях в задаче управления выходом стохастической дифференциальной системы по квадратичному критерию

  • А. В. Босов  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, ABosov@frccsc.ru

Аннотация: Общее исследование задачи оптимального управления для диффузионного процесса Ито и линейного управляемого выхода с квадратичным критерием качества выполнено в предыдущих работах автора (совместно с А. И. Стефановичем). Анализ имеющихся результатов позволяет выделить некоторые модели, носящие частный характер в отношении общей постановки, но имеющие особую практическую значимость. В данной статье рассмотрены две такие частные модели. Первая модель определяется предположением о линейном сносе в уравнении состояния при сохранении нелинейной диффузии. Показано, что такая модель обеспечивает линейность оптимальному управлению и отсутствие необходимости для его реализации решать параболическое уравнение. При этом квадратичной функции Беллмана в задаче не возникает, соответствующее выражение описывается, как и в общем случае, решением параболического уравнения и сохраняет содержательную стохастическую интерпретацию, выражаемую формулой Фейнмана-Каца. Вторая модель реализует предположение о зависимости возмущений в уравнениях состояния и выхода. Модифицированное уравнение динамического программирования решается тем же способом, что и в общем случае, рассмотренном в предыдущих работах, в том числе в рамках объединенной модели, включающей оба представленных случая. Данная модель окажется особо востребованной в задачах с неполной информацией, когда предположение о наличии полной информации о состоянии и выходе будет заменяться описанием системы наблюдения, в которой выход интерпретируется как косвенные наблюдения за состоянием. Кратко обсуждается численный пример, детально исследованный в предыдущих работах автора (совместно с А. И. Стефановичем), так как оказывается, что он удовлетворяет предположению о линейном сносе в уравнении состояния и, соответственно, полученные ранее приближенные решения удается уточнить.

Ключевые слова: стохастическое дифференциальное уравнение; оптимальное управление; управление выходом; дифференциальные системы с мультипликативными и зависимыми возмущениями

Связность конфигурационных графов в моделях сложных сетей

  • Ю. Л. Павлов  Институт прикладных математических исследований КарНЦ РАН, ФИЦ "Карельский научный центр РАН", pavlov@krc.karelia.ru

Аннотация: Рассматриваются конфигурационные графы, степени вершин которых являются независимыми случайными величинами, одинаково распределенными по обобщенному дискретному степенному закону. Связи между вершинами формируются равновероятно в соответствии со степенями вершин. Эти случайные графы часто используются для моделирования сложных сетей коммуникаций, таких как интернет и социальные сети. В статье предполагается, что распределение степеней вершин неизвестно, поскольку зависит от медленно меняющейся функции с неизвестными свойствами. При стремлении числа вершин к бесконечности найдены условия, при выполнении которых граф становится асимптотически достоверно связным. При этих условиях получены оценки скорости сходимости к нулю вероятности того, что граф не связен. Для доказательства результатов статьи использовались свойства устойчивых распределений и медленно меняющихся функций.

Ключевые слова: случайные графы; конфигурационные графы; случайные степени вершин; связность графа

Методы теории категорий в цифровом проектировании гетерогенных киберфизических систем

  • С. П. Ковалёв  Институт проблем управления им. В. А. Трапезникова Российской академии наук, kovalyov@sibnet.ru

Аннотация: Развивается предложенный ранее математический аппарат на базе теории категорий, предназначенный для формального описания и строгого исследования процедур инженерной деятельности на базе математического и компьютерного моделирования. При помощи аппарата описаны и исследованы высокоавтоматизированные процедуры проектирования гетерогенных киберфизических систем на основе цифровых двойников, востребованные грядущей четвертой промышленной революцией. Для этого впервые введена конструкция категории мультизапятой, объектами которой служат архитектурные модели некоторой гетерогенной киберфизической системы с заданной схемой структурной иерархии, представленные с некоторой фиксированной точки зрения, а морфизмы отвечают действиям по подбору составных частей (СЧ) для сборки системы из них. Рассмотрено применение категории мультизапятой в решении прямых и обратных задач проектирования отдельных систем и состоящих из них так называемых систем систем (СС).

Ключевые слова: киберфизическая система; цифровой двойник; порождающее проектирование; система систем; теория категорий; категория мультизапятой

Методы обнаружения переводных заимствований в больших текстовых коллекциях

  • Р. В. Кузнецова  Московский физико-технический институт, rita.kuznetsova@phystech.edu
  • О. Ю. Бахтеев  Компания Антиплагиат; Московский физико-технический институт, bakhteev@ap-team.ru
  • Ю. В. Чехович  Вычислительный центр им. А. А. Дородницына Федерального исследовательского центра "Информатика и управление" Российской академии наук, chehovich@ap-team.ru

Аннотация: Рассматривается задача обнаружения переводных заимствований. Для решения предлагается использовать моноязыковой подход - свести задачу обнаружения заимствований к одному языку, используя машинный перевод. В связи со спецификой рассматриваемой задачи предлагаемый алгоритм обнаружения должен быть устойчив к неоднозначностям перевода. Предлагается декомпозировать задачу на несколько этапов. Сначала отбираются документы-кандидаты, устойчивость к неоднозначности перевода достигается за счет замены слов на метки кластеров, полученных с помощью дистрибутивной модели. Затем происходит сравнение найденных кандидатов и рассматриваемого документа, для этого используется отображение текстовых фрагментов документов в векторное пространство высокой размерности. Вычислительный эксперимент проводится для языковой пары "русский-английский" на двух выборках - синтетическом корпусе и на статьях из журналов, входящих в Российский индекс научного цитирования (РИНЦ).

Ключевые слова: автоматическая обработка текстов; машинный перевод; глубокое обучение; переводные заимствования; обнаружение переводных заимствований; дистрибутивная семантика

Вариационная оптимизация модели глубокого обучения с контролем сложности

  • О. С. Гребенькова  Московский физико-технический институт, grebenkova.os@phystech.edu
  • О. Ю. Бахтеев  Компания Антиплагиат; Московский физико-технический институт, bakhteev@ap-team.ru
  • В. В. Стрижов  Вычислительный центр имени А. А. Дородницына Федерального исследовательского центра "Информатика и управление" Российской академии наук; Московский физико-технический институт, strijov@phystech.edu

Аннотация: Исследуется задача построения модели глубокого обучения. Предлагается способ контроля ее сложности. Под сложностью модели понимается минимальная длина описания, минимальный объем информации, который требуется для передачи информации о модели и о выборке. Предлагается метод оптимизации параметров модели, основанный на представлении модели глубокого обучения в виде гиперсети с использованием байесовского подхода. Под гиперсетью понимается модель, которая порождает параметры оптимальной модели. Вводятся вероятностные предположения о распределении параметров модели глубокого обучения. Предлагается алгоритм, максимизирующий нижнюю вариационную оценку байесовской обоснованности модели. Вариационная оценка рассматривается как условная величина, зависящая от требуемой сложности модели. Для анализа качества предлагаемого алгоритма проведены эксперименты на выборке MNIST.

Ключевые слова: вариационная оптимизация модели; гиперсети; глубокое обучение; нейронные сети; байесовский вывод; заданная сложность модели

Информационная модель весового облика летательных аппаратов

  • Л. Л. Вышинский  Вычислительный центр им. А. А. Дородницына Федерального исследовательского центра "Информатика и управление" Российской академии наук, wyshinsky@maii.ru
  • Ю. А. Флёров  Вычислительный центр им. А. А. Дородницына Федерального исследовательского центра "Информатика и управление" Российской академии наук, fler@ccas.ru

Аннотация: Статья посвящена описанию информационной модели весового облика летательных аппаратов (ЛА). Под весовым обликом ЛА здесь понимается совокупность взаимосвязанных между собой информационных объектов, содержащих описание конструкции, параметров и характеристик ЛА, достаточное для проведения весовых расчетов, весового анализа и весового контроля на всех этапах жизненного цикла изделия. Описанная информационная модель может служить основой логической схемы базы данных (БД) при разработке автоматизированных систем весового проектирования (АСВП). В статье модель весового облика ЛА описана в терминах сетевых структур данных.

Ключевые слова: автоматизация проектирования; летательный аппарат; весовое проектирование; весовая модель; дерево конструкции; генератор проектов

Оптимальное пороговое управление доступом в системе M/M/s с неоднородными приборами и общим накопителем

  • Я. М. Агаларов  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, agglar@yandex.ru

Аннотация: Рассматривается система M/M/s с неоднородными приборами и общим накопителем с возможностью управления длиной очереди с целью максимизации среднего предельного дохода. Функция дохода включает плату за успешно обслуженную заявку, штраф за каждую отклоненную заявку, штрафы за единицу времени простоя каждого прибора, штраф за единицу времени ожидания заявки (или за превышение допустимого времени ожидания заявки), затраты, связанные с техническим обслуживанием мест в накопителе. Ставится задача максимизации предельного дохода на множестве простых пороговых стратегий управления длиной очереди. Доказано свойство выпуклости функции дохода и получены условия существования конечного оптимального порога длины очереди.

Ключевые слова: система массового обслуживания; оптимизация; пороговая стратегия; длина очереди

Вероятностные характеристики индекса баланса факторов, имеющих обобщенные гамма-распределения

  • Е. Н. Арутюнов  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, enapoleon@maiLru
  • А. А. Кудрявцев  Московский государственный университет имени М. В. Ломоносова, факультет вычислительной математики и кибернетики, nubigena@mail.ru
  • Ю. Н. Недоливко  Московский государственный университет имени М. В. Ломоносова, факультет вычислительной математики и кибернетики, mouse98@mail.ru

Аннотация: Приводятся основные вероятностные характеристики индекса баланса в байесовской постановке в предположении, что негативный и позитивный факторы имеют априорные обобщенные гамма-распределения. Формулировка задачи сводится к изучению характеристик масштабной смеси обобщенных гамма-законов. Особое внимание уделяется случаю, в котором распределения факторов имеют параметры формы противоположных знаков. Приводятся моментные характеристики и различные представления для плотности в терминах гамма-экспоненциальной функции, функций Фокса и Макдональда, а также обобщенной гипергеометрической функции. Метод анализа основан на применении преобразования Меллина и его обращении. Приводятся новые свойства гамма-экспоненциальной функции. Полученные результаты могут найти широкое применение в естественно-научных моделях, использующих для описания процессов и явлений распределения с положительным неограниченным носителем.

Ключевые слова: байесовский подход; обобщенное гамма-распределение; гамма-экспоненциальная функция; модели баланса; смешанные распределения; преобразование Меллина; функция Фокса; гипергеометрическая функция

Неасимптотический анализ статистики Бартлетта–Нанда–Пилая для данных большой размерности

  • А. А. Липатьев  Московский государственный университет имени М. В. Ломоносова, факультет вычислительной математики и кибернетики, кафедра математической статистики, allipatev@cs.msu.ru

Аннотация: Представлены вычислимые оценки скорости сходимости нормированной статистики Барт- летта-Нанда-Пилая к стандартному нормальному распределению при условии, что размерность данных возрастает пропорционально объему выборки. Приведенный результат позволяет корректно вычислять p-значения в прикладных задачах многомерного анализа данных. Задачи в постановке, когда число анализируемых признаков сравнимо с объемом выборки, все чаще возникают в области обработки сигналов. Доказательство базируется существенным образом на нормальности распределения элементов рассматриваемых матриц с распределением Уишарта. Для случайных величин, представляющих собой матричные следы произведения и квадратов матриц с нормированным распределением Уишарта, находятся удобные оценки сверху для 1 - F, где F - функция распределения соответствующего следа матрицы. Применяя свойства обратных матриц и неотрицательно определенных матриц, статистика Бартлетта-Наида-Пилая ограничивается сверху комбинацией из упомянутых выше следов матриц.

Ключевые слова: точность приближений; многомерный дисперсионный анализ; вычислимые оценки; статистика Бартлетта-Нанда-Пилая; данные большой размерности

Архитектура распределенного решения задач анализа данных в области нейрофизиологии

  • Д. О. Брюхов  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, dbriukhov@ipiran.ru
  • С. А. Ступников  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, sstupnikov@ipiran.ru
  • Д. Ю. Ковалев  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, dm.kovalev@gmail.com
  • И. А. Шанин  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, ivan.shanin@gmail.com

Аннотация: С ростом объема и разнообразия нейрофизиологических данных происходит и рост интереса к применению методов информатики, таких как статистический анализ, машинное обучение, нейронные сети, для анализа этих данных. Появляется потребность в создании инфраструктур, обеспечивающих как хранение большого объема данных в области нейрофизиологии, так и их распределенную обработку и анализ. В данной статье предлагается архитектура средств решения задач на основе технологий распределенного хранения и анализа больших данных Hadoop и высокопроизводительных вычислений с применением графических ускорителей.

Ключевые слова: нейрофизиология; нейроинформатика; интенсивное использование данных; инфраструктуры решения задач; анализ данных

Представление новых лексикографических знаний в динамических классификационных системах

  • А. А. Гончаров  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, a.gonch48@gmail.com
  • И. М. Зацман  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, izatsman@yandex.ru
  • М. Г. Кружков  Институт проблем информатики Федерального исследовательского центра "Информатика и управление " Российской академии наук, magnit75@yandex.ru

Аннотация: Характерная особенность динамических классификационных систем (ДКС) состоитвтом, что в процессе применения этих систем в нихв любой момент времени могутдобавляться новые рубрики и/или изменяться дефиниции существующих рубрик, включая перераспределение смыслового содержания между ними. С одной стороны, эта особенность ДКС дает возможность оперативно отражать в них новое знание и сразу начинать его использовать, например в процессе лингвистического аннотирования. С другой стороны, если некоторая рубрика использовалась при аннотировании, а затем была изменена, то аннотации с этой рубрикой, сформированные до внесения изменений, в ряде случаев должны быть реклассифицированы. Статья преследует двоякую цель, которая состоит, во-первых, в сопоставлении подходов к классификации сущностей на основе (1) ДКС и (2) онтологий, изменяемых во времени, а во-вторых, в описании специфики представления новых лексикографических знаний в ДКС.

Ключевые слова: динамическая классификационная система; версионные онтологии; лингвистическое аннотирование; реклассификация аннотаций

Проблемно-ориентированная актуализация словарных статей двуязычных словарей и медицинской терминологии: сопоставительный анализ

  • И. М. Зацман  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, izatsman@yandex.ru

Аннотация: Сопоставляются два подхода к целенаправленному извлечению нового знания из текстовых данных. Первый подход относится к предметной области лексикографии и ориентирован на извлечение новых значений слов из текстов в интересах пополнения словарных статей двуязычных словарей. Второй подход относится к медицинской науке и ориентирован на извлечение новых значений терминов в интересах актуализации терминологического портрета болезни, включающего дефиниции терминов с отражением их динамики во времени, отношения между терминами, контексты их использования и ссылки на источники контекстов. Эти подходы сравниваются по следующим позициям: проблема, для решения которой извлекается новое знание, цель его извлечения, источник концептов нового знания, эталон, сравнение с которым используется как критерий новизны, связь концепта с его источником и динамика концептов. Цель статьи состоит в описании результатов сопоставительного анализа обоих подходов. Результаты анализа предлагается позиционировать как исходные данные для создания концепции системы искусственно-естественного интеллекта (ИЕИ-системы) для целенаправленного извлечения нового знания из данных большого объема, применимой в разных предметных областях.

Ключевые слова: генерация нового знания; извлечение знания из текстов; искусственный интеллект; система искусственно-естественного интеллекта

Моделирование стохастической динамики изменения состояний узлов и перколяционных переходов в социальных сетях с учетом самоорганизации и наличия памяти

  • Д. О. Жуков  МИРЭА - Российский технологический университет, zhukov_do@mirea.ru
  • Т. Ю. Хватова  Санкт-Петербургский политехнический университет Петра Великого, khvatova.ty@spbstu.ru
  • А. Д. Зальцман  МИРЭА - Российский технологический университет, ad.zaltcman@gmaii.com

Аннотация: Обсуждаются вопросы использования подходов теоретической информатики и применение ее приложений для анализа и моделирования процессов в социотехнических системах (социальных сетях). Разработана стохастическая модель динамики изменения состояний (настроений или мнений) пользователей (узлов) и достижения порога перколяции в социальной сети, имеющей случайные связи между узлами. Модель показывает возможность скачкообразных переходов между состояниями (мнений, настроений и т.д.) узлов в социальной сетевой структуре в течение короткого времени без внешнего воздействия, что может быть связано с памятью о предыдущих состояниях и самоорганизацией. При создании модели были рассмотрены схемы вероятностей переходов между возможными состояниями узлов с учетом предыдущих шагов (немарковские процессы с наличием памяти) и выведено нелинейное дифференциальное уравнение второго порядка, которое содержит член, отвечающий за возможность самоорганизации, а также сформулирована и решена граничная задача для определения функции плотности вероятности нахождения системы в определенном состоянии с течением времени. Разработанная модель может быть связана с полученными ее авторами ранее результатами описания процессов в социальных сетевых структурах с помощью теории перколяции (определение времени достижения пороговых значений доли узлов сети, при котором мнения или предпочтения могут беспрепятственно распространяться по сети в целом).

Ключевые слова: стохастическая динамика; состояния узлов социальной сети; самоорганизация систем; процессы с памятью; перколяция в социальных сетях

О системной иерархии искусственного интеллекта

  • С. Н. Гринченко  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, sgrmchenko@ipiran.ru

Аннотация: Искусственный интеллект (ИИ) рассмотрен с позиций информатико-кибернетического моделирования (ИКМ) процесса развития самоуправляющейся иерархосетевой системы Человечества как природный феномен, теснейшим образом сопряженный с понятиями "когнитивные функции человека" и "интеллектуальная деятельность человека". Опираясь на информационно-коммуникационно-инфраструктурную составляющую определения ИИ и на ИКМ, понятие "человеко-аппаратурной интеллектуальной единицы" естественным образом обобщено на все уровни/ярусы системы Человечества, расположенные в ее иерархии выше и ниже относительно уровня/яруса "человек/личность". Как следствие, феномен "личностного естественно-искусственного интеллекта" дополняется феноменом "иерархического ИИ". Его формирование стало возможным начиная примерно с 1946 г. - с возникновением базисной информационной технологии (БИТ) компьютеров - и приняло взрывной характер примерно с 1979 г - с возникновением БИТ телекоммуникаций/сетей. Приводятся типичные размеры ареалов уровней/ярусов в иерархии ИИ системы Человечества (указанные даты и размеры - результат модельного расчета).

Ключевые слова: искусственный интеллект; информационные технологии; информатико-киберне- тическая модель; самоуправляющаяся иерархосетевая система Человечества; человеко-аппаратурная интеллектуальная единица

О точности нормальной аппроксимации при отсутствии нормальной сходимости

  • В. Ю. Королев  Факультет вычислительной математики и кибернетики Московского государственного университета имени М. В. Ломоносова; Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, vkorolev@cs.msu.ru
  • А. В. Дорофеева  Факультет вычислительной математики и кибернетики Московского государственного университета имени М. В. Ломоносова, alex.dorofeyeva@gmail.com

Аннотация: При решении прикладных задач в самых разных областях принято использовать нормальное распределение в качестве модели статистических закономерностей в наблюдаемых данных с аддитивной структурой. В качестве критерия степени адекватности такой модели можно использовать оценки скорости сходимости в центральной предельной теореме (ЦПТ) теории вероятностей, устанавливающей, что при определенных условиях (например, при условии Линдеберга) суммарное воздействие большого числа случайных факторов проявляется в виде случайной величины с нормальным распределением. Классические оценки скорости сходимости в ЦПТ типа неравенства Берри-Эссеена доказаны при условии конечности третьих моментов слагаемых. Известны также оценки скорости сходимости при существовании моментов порядка 2 + 5 с 0 <5 < 1. Если существуют моменты лишь второго порядка, то сходимость в ЦПТ может быть как угодно медленной. Если же у слагаемых моменты второго порядка не существуют, то сходимость распределений сумм независимых случайных величин к нормальному закону не имеет места. Условия, гарантирующие справедливость ЦПТ, практически невозможно достоверно проверить при ограниченном объеме наблюдаемой выборки. Поэтому вопрос о том, какой может быть реальная точность нормальной аппроксимации, когда она теоретически не применима, но используется в практических вычислениях, представляет большой интерес. Более того, в некоторых ситуациях при имитационном моделировании, когда распределения слагаемых принадлежат области притяжения устойчивого закона с характеристическим показателем, меньшим двух, при увеличении числа слагаемых сначала наблюдается убывание расстояния между распределением нормированной суммы и нормальным законом и лишь при довольно большом числе слагаемых это расстояние начинает увеличиваться. В данной заметке предпринята попытка дать ответ на сформулированный выше вопрос и привести некоторые теоретические объяснения указанному эффекту.

Ключевые слова: центральная предельная теорема; точность нормальной аппроксимации; тяжелые хвосты; равномерное расстояние