Институт проблем информатики Российской Академии наук
Институт проблем информатики Российской Академии наук
Российская Академия наук

Институт проблем информатики Российской Академии наук




«Системы и средства информатики»
Том 32, Выпуск 1, 2022г.

Оглавление | Об авторах

Аннотации и ключевые слова.

Информационные аспекты обеспечения безопасности на транспорте: аналитические задачи

  • А. В. Борисов  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, ABorisov@ipiran.ru
  • А. В. Босов  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, AVBosov@ipiran.ru
  • Д. В. Жуков  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, DZhukov@ipiran.ru
  • А. В. Иванов  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, AIvanov@ipiran.ru

Аннотация: В четвертой, заключительной статье цикла, посвященного описанию системы поддержки принятия решений (СППР) в области обеспечения безопасности пассажирских перевозок и противодействия противоправной деятельности на транспорте, базовые концепты, функции поиска и отбора данных и предметно-специализированные аналитические расчеты дополнены постановками, требующими сложной предварительной обработки данных (data processing). Содержание таким постановкам дает изучение совместных перемещений групп пассажиров, а также типовые задачи анализа сводной статистики по пассажироперевозкам. Решения обеспечиваются традиционным инструментом бизнес-аналитики (business intelligence) - технологией OLAP (online analytical processing). Для ее применения сначала формулируются необходимые понятия, описывающие хранилище фактов (витрину данных). Формируются факты в результате дискретизации временной шкалы перемещений пассажиров. Детализация конкретных задач анализа перемещения групп пассажиров обеспечивает формирование решений в форме OLAP-кубов. В заключении статьи подведен итог выполненного исследования.

Ключевые слова: транспортная безопасность; система поддержки принятия решений; транспортная информация; аналитическая обработка больших массивов данных; гиперкуб

Стратегия исследований и разработок в области искусственного интеллекта IV: государственная политика КНР

  • А. В. Борисов  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, ABorisov@ipiran.ru
  • А. В. Босов  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, AVBosov@ipiran.ru
  • Д. В. Жуков  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, DZhukov@ipiran.ru

Аннотация: Статья завершает цикл работ, посвященных анализу влияния государственного управления на эффективность проведения исследований и разработок в области искусственного интеллекта (AI R&D). Четвертая часть цикла представляет результат анализа влияния на область AI R&D государственной политики Китайской народной республики (КНР). Представлены краткие сведения о научно-техническом потенциале КНР и стратегических документах КНР в части развития AI R&D, принятых с 2017 г. Описана структура государственного и частного финансирования AI R&D в КНР. Дано краткое описание организации AI R&D в области обороны и безопасности. Представлены заключительные замечания, в том числе различия в подходах к стратегическому государственному планированию в области AI R&D, принятых в различных государствах.

Ключевые слова: искусственный интеллект; система распознавания лиц; система наблюдения/слежения; умный город/безопасный город

Оценка погрешности аппроксимации неоднородных марковских цепей с непрерывным временем и катастрофами

  • И. А. Усов  Вологодский государственный университет, 293933rus@gmail.com
  • И. А. Ковалёв  Вологодский государственный университет, kovalev.iv96@yandex.ru
  • А. И. Зейфман  Вологодский государственный университет; Федеральный исследовательский центр "Информатика и управление" Российской академии наук; Вологодский научный центр Российской академии наук, a_zeifman@mail.ru

Аннотация: Рассмотрена аппроксимация с помощью усечений цепями меньшей размерности общего класса слабо эргодичных марковских цепей с непрерывным временем в случае наличия катастроф. При этом существенно ослаблены ограничения на структуру инфинитезимальной матрицы. Предполагается, что процесс слабо эргодичен в li-норме и во "взвешенной" норме Iid. Для таких процессов получена новая равномерная по времени оценка погрешности усечения. Полученная оценка справедлива для неоднородных процессов рождения и гибели, а также для систем массового обслуживания (СМО) с групповым поступлением и обслуживанием требований и для нестационарных моделей обслуживания с катастрофами и "тяжелыми хвостами", т. е. когда интенсивности убывают со степенной скоростью. В качестве численного примера рассмотрена неоднородная система обслуживания Mt\Mt\S с катастрофами.

Ключевые слова: аппроксимация; усечение; катастрофы; системы массового обслуживания; слабая эргодичность

Геоинформационная система — инструмент цифровой трансформации геоданных

  • И. Н. Розенберг  Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте (АО НИИАС), I.Rozenberg@vniias.ru
  • С. К. Дулин  Федеральный исследовательский центр "Информатика и управление" Российской академии наук; Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте (АО НИИАС), skdulin@mail.ru
  • Н. Г. Дулина  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, ngdulina@mail.ru

Аннотация: Обсуждаются процессы, характерные для оцифровывания геоинформации в информационной среде географических информационных систем (ГИС). Рассмотрена эволюция обработки оцифрованной геоинформации средствами ГИС. Цифровые геоданные, как показывает опыт, обеспечивают совершенствование деятельности любой компании. Однако большинство современных геоданных не обладают интероперабельностью: они хранятся в изолированных базах геоданных (БГД), неинтероперабельных системах и используются в программах ограниченного доступа. В связи с этим геоданными трудно обмениваться, часто не удается их анализировать и интерпретировать. Показана необходимость существования геоинтероперабельности для проведения цифровой трансформации геоданных. Перечислены существующие модели интероперабельности, используемые для формирования ГИС. Отмечено, что самой неисследованной проблемой ГИС все еще остается ликвидация разрыва между различными моделями интероперабельности, используемыми для ее формирования. Решение этой проблемы обеспечило бы создание объединенного метода, учитывающего сильные стороны и слабости каждой отдельной модели при их интеграции.

Ключевые слова: ГИС; цифровая трансформация; геоинтероперабельность

Создание фонетико-акустической базы русских триграмм

  • Ю. И. Бутенко  Московский государственный технический университет имени Н. Э. Баумана, iubutenko@bmstu. ru
  • Ю. В. Строганов  Московский государственный технический университет имени Н. Э. Баумана, stroganovyv@bmstu. ru
  • А. В. Квасников  Московский государственный технический университет имени Н. Э. Баумана, nv.slavnov@gmail.com
  • Н. В. Славнов  Московский государственный технический университет имени Н. Э. Баумана, videot4pe@gmail.com

Аннотация: Представлена фонетико-акустическая база русских триграмм для анализа и синтеза русской речи. Приведена классификация русских триграмм, выделены легко- и труднопроизносимые триграммы. Отмечено, что триграммы в составе слова полностью или частично совпадают с морфемами русского языка. Проиллюстрированы варианты разметки речевых записей в системе разметки звучащей речи. Проанализирована и проиллюстрирована при помощи осциллограмм вариативность произношения русских триграмм разными дикторами. Показано, что система разметки речи позволяет учитывать персональные характеристики диктора, влияющие на качество произношения. Исследовано влияние расположения фонемы в слове на качество ее распознавания. Предложено использовать частотность употребления и позицию триграммы в слове в качестве весов при использовании триграмм в задачах распознавания и синтеза речи.

Ключевые слова: фонетико-акустическая база; триграмма; диктор; разметка; осциллограмма; произношение; вариативность

Некоторые вопросы оценки внутреннего качества информационных систем

  • А. А. Зацаринный  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, AZatsarinny@ipiran.ru
  • Ю. С. Ионенков  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, UIonenkov@ipiran.ru

Аннотация: Статья посвящена вопросам оценки качества информационных систем (ИС). Основное внимание уделено рассмотрению внутренней стороны качества ИС, связанной с удобством их разработки и производства, технологичностью, безопасностью и снижением издержек проектирования. Рассмотрены исторические аспекты формирования сущности внутренней стороны качества ИС, представленные в работах Уолтера Шухарта, Уильяма Эдварда Деминга и Арманда Фейгенбаума. Представлены основные методы проектирования ИС, направленные на снижение затрат при их проектировании в соответствии с международными и отечественными стандартами. Сформулированы основные проблемы применения этой нормативной базы отечественными заказчиками и разработчиками.

Ключевые слова: качество; внутреннее качество; оценка качества; менеджмент качества; стандарты проектирования; информационная система

К вопросу о соотношении программно определяемых и традиционных IP-сетей

  • В. Б. Егоров  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, VEgorov@ipiran.ru

Аннотация: Программное определение сетей (software-defined networking, SDN) - концепция организации сетей с централизованным программным управлением - стало модным трендом нашего столетия. Концепция постулирует сосредоточение всех функций плоскости управления в логически единственном контроллере сети, упрощение узлов плоскости данных до простых коммутаторов и унифицированный протокол взаимодействия с ними контроллера. Идея SDN родилась и была изначально реализована в университетских лабораториях, однако перенос ее в датацентры, а затем в провайдерские сети выявил в ней ряд слабых мест, в числе которых можно отметить начальный пуск (bootstrapping) сети и удаленное конфигурирование ее узлов, не укладывающиеся в ряде случаев в рамки исходной концепции SDN. Практика развертывания SDN-сетей показала, что в них не удается полностью отказаться от протокольного стека TCP/IP, который остается незаменимым, в частности, при начальном пуске и удаленном конфигурировании SDN-сети.
В результате в реальности узлами SDN-сетей вместо концептуально простых коммутаторов оказываются традиционные полнофункциональные маршрутизаторы, лишь дополненные возможностями SDN, а сами SDN-сети остаются обычными IP-сетями, в которых централизованное управление оказывается не более чем дополнительной функциональной возможностью.

Ключевые слова: начальный пуск сети; программно определяемая сеть; удаленное конфигурирование сети; OF-CONFIG; OpenFlow

Анализ монотонного тренда в многопараметрическом случае

  • М. П. Кривенко  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, mkrivenko@ipiran.ru

Аннотация: Рассматривается задача анализа монотонного тренда. Строится оценка максимального правдоподобия параметров распределения, когда условие монотонности формулируется для значений некоторой функции от них. Решение соответствующей задачи получается в виде алгоритма, обобщающего PAV-процедуру (Pool-Adjacent-Violators). В качестве примера рассматривается задача оценивания монотонного тренда отношения математического ожидания к стандарту для последовательности нормально распределенных величин. Получающаяся оценка основывается на подсчете числа положительных/отрицательных наблюденных значений. Показано, что тестирование тренда в этом случае эквивалентно анализу монотонных изменений вероятности успеха в неоднородной схеме Бернулли. Тем самым вскрывается связь параметрического и непараметрического подходов в анализе нестационарных случайных последовательностей. Примером реальной ситуации, когда возможно применение рассматриваемого подхода, может служить анализ случайной последовательности в преобразованном виде: набор наблюдений делится на группы, для каждой из которых подсчитывается некоторая статистика, результат такого фрагментирования рассматривается как последовательность величин с определенным распределением.

Ключевые слова: монотонный тренд; оценка максимального правдоподобия; PAV-процедура; непараметрическое тестирование тренда

Структурный подход к связыванию записей в технологии поддержки конкретно-исторических исследований

  • И. М. Адамович  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, Adam@amsd.com
  • О. И. Волков  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, Volkov@amsd.com

Аннотация: Статья посвящена дальнейшему развитию распределенной технологии поддержки конкретно-исторических исследований (ПКИИ), основанной на принципах краудсорсинга и ориентированной на широкий круг не относящихся к профессиональным историкам и биографам пользователей. Развитие осуществляется за счет включения в технологию и их модификации средств автоматизации связывания записей в историческом регистре метода восстановления истории семей, широко используемого в исторической демографии. Модификация заключается в создании надстройки над алгоритмами метода восстановления истории семей, обеспечивающей автоматическое связывание с опорой на сравнение структур графов родственных связей в семье. Приводится описание алгоритма функционирования этой надстройки. Обоснование подхода строится на классификации номинативных исторических документов и на анализе мирового опыта их автоматической обработки в рамках генеалогических и историко-демографических исследований.

Ключевые слова: конкретно-историческое исследование; распределенная технология; связывание записей; номинативный документ; источники семейной структуры

Методология s-моделирования: развитие и применение

  • В. Д. Ильин  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, vdilyin@yandex.ru

Аннотация: Методология символьного моделирования произвольных объектов в человеко-машинной среде (методология s-моделирования) включает теорию и расширяющуюся совокупность методов ее применения. В s-моделировании используются все виды символов (аудио, визуальных и др.), реализуемые в человеко-машинной среде. S-модели изучаются как сущности, имеющие три взаимосвязанных представления: символьное, кодовое и сигнальное. Конструирование s-моделей осуществляется в соответствии с правилами, соответствующими базовым задачам, определенным в теории s-моделирования. Методология s-моделирования рассматривается как методологическая платформа для научно обоснованной разработки информационных технологий и человеко-машинной среды цифровизации различных видов деятельности.

Ключевые слова: символьное моделирование; s-моделирование; информационные технологии; цифровизация

Архитектура базы данных иерархии логико-семантических отношений

  • А. А. Дурново  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, duralex49@mail.ru
  • О. Ю. Инькова  Федеральный исследовательский центр "Информатика и управление" Российской академии наук; Женевский университет, olyainkova@yandex.ru
  • Н. А. Попкова  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, natasha__popkova@mail.ru

Аннотация: Описана архитектура нового лингвистического ресурса, Над- корпусной базы данных иерархий логико-семантических отношений (НБДИ ЛСО), обеспечивающих связность текста. Аннотации в базе данных имеют форму деревьев, т. е. ориентированных связных ациклических графов, где узлы (вершины) содержат данные, а ребра отображают отношение подчиненности между узлами. Каждый узел дерева соответствует либо контексту, либо коннектору. В тексте помечаются имеющиеся в нем коннекторы. Авторы описывают связь таблиц надкорпусной базы данных с деревьями и их свойствами. Показаны отличия нового лингвистического ресурса от существующих, в частности от графов риторических отношений, созданных в рамках теории риторической структуры: возможность хранить полученную информацию, видоизменять аннотируемые контексты и работать с пустыми контекстами; отражать предыдущие состояния дерева отношений.

Ключевые слова: надкорпусная база данных; аннотирование корпусов текстов; граф; дискурсивные отношения; коннектор

Оценка эффективности капитальных и операционных затрат при планировании жизненного цикла информационных систем специального назначения

  • А. П. Сучков  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, ASuchkov@ipiran.ru

Аннотация: Информационные системы специального назначения, т. е. системы в области обеспечения обороноспособности, правопорядка и безопасности, не предназначены для получения доходов в денежной форме. Поэтому оценка эффективности капитальных и операционных затрат с использованием значений прибыли и валового дохода в этом случае невозможна. Тем не менее перед государственным и функциональным заказчиками, а также перед эксплуатирующей организацией стоит задача объективной оценки эффективности затрат в той или иной форме. В связи с этим для оценки эффективности капитальных и операционных затрат применительно к таким видам систем необходимо определить подходы к этой оценке на основе учета потребительских свойств информационной системы на всех стадиях ее жизненного цикла (ЖЦ). Предложены методы расчета эффективности с учетом степени реали-зации системных требований и процессов достижения целей информационной системы.

Ключевые слова: информационная система; жизненный цикл; капитальные затраты; операционные затраты; показатель эффективности

Доработка графического интерфейса платформы OpenFOAM в части расширения перечня утилит для работы с расчетными сетками

  • Д. И. Читалов  Южно-Уральский федеральный научный центр минералогии и геоэкологии Уральского отде-ления Российской академии наук, cdi9@yandex.ru

Аннотация: Настоящее исследование посвящено доработке графической оболочки платформы OpenFOAM для предоставления доступа пользователя к утилите boxTurb, обеспечивающей модификацию расчетной области путем генерации блока турбулентности для заданного энергетического спектра. Работа с утилитой осуществляется на этапе определения исходных параметров численного эксперимента (на этапе препроцессинга), выполняемого для задач механики сплошных сред (МСС), моделируемых на базе платформы OpenFOAM. В рамках доработки графической оболочки подготовлен программный модуль для работы с утилитой boxTurb. Представлен набор инструментов, необходимых для подготовки исходного кода модуля, приведена диаграмма, описывающая механизм его работы. На основе представленного модуля расширен исходный код базовой версии графической оболочки платформы OpenFOAM. Продукт протестирован на примере одной из учебных задач МСС, входящих в дистрибутив платформы OpenFOAM. Приведено описание практической ценности и новизны исследования.

Ключевые слова: численное моделирование; механика сплошных сред; графический интерфейс пользователя; OpenFOAM; язык программирования Python3.5; открытое программное обеспечение; утилита boxTurb; библиотека PyQt5; СУБД SQLite

Функции экспорта в лексикографических базах данных

  • В. В. Вакуленко  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, vvak@pm.me
  • А. А. Дурново  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, duralex49@mail.ru
  • И. М. Зацман  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, izatsman@yandex.ru

Аннотация: Рассматриваются задачи, функции и основные этапы экспорта в надкорпусных базах данных (НБД) и в базе данных фразеологического словаря (БД ФС), содержащей словарные статьи немецких идиом и их переводов на русский язык. В НБД, содержащей параллельные тексты оригиналов и переводов книг, пользователь в результате экспорта получает каталог интересующих его аннотированных переводных соответствий исследуемых языковых единиц в оригинале и переводе, в БД ФС - массив словарных статей, отобранных по критерию, заданному пользователем. Цель статьи состоит в описании принципов унификации экспорта при формировании массивов словарных статей и создании каталогов аннотированных переводных соответствий.

Ключевые слова: функции экспорта; надкорпусные базы данных; каталог; база данных фразеологического словаря; аннотированные переводные соответствия

Поиск аномалий в больших данных

  • А. А. Грушо  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, grusho@yandex.ru
  • Н. А. Грушо  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, info@itake.ru
  • М. И. Забежайло  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, m.zabezhailo@yandex.ru
  • Д. В. Смирнов  ПАО Сбербанк России, dvlsmirnov@sberbank.ru
  • Е. Е. Тимонина  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, eltimon@yandex.ru
  • С. Я. Шоргин  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, sshorgin@ipiran.ru

Аннотация: Проблема достаточности информации для идентификации объекта поиска в больших данных состоит в том, что метод поиска может в условиях шума пропустить искомый объект или, наоборот, указать на объекты, которые случайно обладают признаками настоящего искомого объекта. В работе рассматривается простой подход к оценке разрешимости проблемы поиска требуемой информации в больших данных в слабых предположениях об информативности признаков идентификации объектов поиска. В простейшем случае большие данные состоят из множества объектов, каждый из которых описывается множеством параметров. Область определения каждого параметра- это свое информационное пространство. Значения параметров помогают идентифицировать искомый объект поиска и фильтровать ложные объекты.
Если параметров мало, то однозначное выявление искомого объекта возможно в более сильных ограничениях на объем больших данных. Поскольку заранее не известна возможность однозначного выявления искомого объекта, то необходимо хотя бы приблизительно оценивать ограничения на объем больших данных, при которых возможно однозначное выявление искомой информации. Для таких оценок предложено использовать предельные теоремы теории вероятностей в схеме серий.

Ключевые слова: информационная безопасность; поиск аномалий; алгоритмы фильтрации "ложных тревог"