Институт проблем информатики Российской Академии наук
Институт проблем информатики Российской Академии наук
Российская Академия наук

Институт проблем информатики Российской Академии наук




«Системы и средства информатики»
Том 29, Выпуск 3, 2019г.

Оглавление | Об авторах

Аннотации и ключевые слова.

Выбор размерностей для смеси вероятностных анализаторов главных компонент

  • М. П. Кривенко  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, mkrivenko@ipiran.ru

Аннотация: Рассматриваются вопросы выбора структурных параметров, характеризующих модель смеси вероятностных анализаторов главных компонент, а именно: числа элементов смеси и размерностей этих элементов. Среди набора используемых на практике подходов в случае задачи обучаемой классификации данных фактически доступными остаются лишь методы управления выборкой. Для реализации выбора размерностей предлагается использовать комбинацию известных методов выбора размерностей принятой модели. Смесь вероятностных анализаторов главных компонент позволяет моделировать объемные данные с помощью относительно небольшого числа свободных параметров. Число свободных параметров можно контролировать с помощью выбора латентной размерности данных.

Ключевые слова: вероятностный анализ главных компонент (PPCA); смеси PPCA; критерий выбора модели; бутстреп; перепроверка

Условно-оптимальное линейное оценивание нормальных процессов в вольтерровских стохастических системах

  • И. Н. Синицын  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, sinitsin@dol.ru
  • В. И. Синицын  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, vsinitsin@ipiran.ru

Аннотация: На основе теории условно-оптимального оценивания (фильтрации и экстраполяции) Пугачёва и предыдущих исследований авторов разработаны два приближенных условно-оптимальных метода для фильтрации и экстраполяции нормальных процессов в вольтерровских стохастических системах (ВСтС), приводимых к СтС с аддитивными и параметрическими шумами. Сформулированы подходы к синтезу фильтров Пугачёва для ВСтС с аддитивными и параметрическими шумами путем эквивалентной замены ВСтС с аддитивными шумами. Подробно рассмотрены одномерные тестовые примеры. Результаты допускают непосредственное обобщение на случаи автокоррелированных шумов и нелинейных функций межвидового взаимо-действия, эредитарных ВСтС, а также дискретных и непрерывно-дискретных ВСтС.

Ключевые слова: вольтерровская СтС (ВСтС); метод аналитического моделирования (МАМ); метод канонических разложений (МКР); метод нормальной аппроксимации (МНА); метод статистический линеаризации (МСЛ); стохастическая система (СтС); стохастический процесс (СтП); условно-оптимальные фильтры и экстраполяторы Пугачёва; фильтры и экстраполяторы Калмана

Индекс преимущества в Байесовских моделях надежности и баланса с бета-полиномиальными априорными плотностями

  • А. А. Кудрявцев  Московский государственный университет им. М. В. Ломоносова, факультет вычислительной математики и кибернетики, nubigena@mail.ru
  • С. И. Палионная  Московский государственный университет им. М. В. Ломоносова, факультет вычислительной математики и кибернетики, sofiapalionnaya@gmail.com
  • О. В. Шестаков  Московский государственный университет им. М. В. Ломоносова, факультет вычислительной математики и кибернетики; Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, oshestakov@cs.msu.ru

Аннотация: Работа посвящена исследованию вероятностных характеристик индекса преимущества в байесовских моделях баланса в случае, когда негативные и позитивные факторы, влияющие на функционирование системы, имеют априорные бета-распределение и распределение с плотностью полиномиального вида, например равномерное или параболическое. Результаты работы могут применяться для исследования предельной надежности сложных модифицируемых информационно-коммуникационных систем и других индексов преимущества, например коэффициента готовности и вероятности пребывания в работоспособном состоянии в теории надежности, вероятности того, что вызов не будет потерян, в теории массового обслуживания и пр. Приводимый метод может использоваться для аналогичных постановок задач при исследовании распределений с кусочно-полиномиальными априорными плотностями, например распределения Симпсона, Ирвина-Холла, Бэйтса и др.

Ключевые слова: байесовский метод; смешанные распределения; модели баланса; индекс преимущества; повышение надежности; бета-распределение

Аппроксимация коэффициента усиления направленности антенны для анализа «направленной глухоты» в трехмерном пространстве

  • О. В. Чухно  Российский университет дружбы народов, olgachukhno95@gmail.com
  • Н. В. Чухно  Российский университет дружбы народов, nvchukhno@gmail.com
  • Ю. В. Гайдамака  Российский университет дружбы народов; Федеральный исследовательский центр "Информатика и управление" Российской академии наук, gaydamaka-yuv@rudn.ru
  • С. Я. Шоргин  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, sshorgin@ipiran.ru

Аннотация: Рассматривается проблема "направленной глухоты" - ситуации, возникающей, когда устройство не может обнаружить занятый радиоканал из-за высоконаправленной линии связи между другими взаимодействующими в это время устройствами. Ситуация "глухоты" может возникнуть между устройствами c высоконаправленными антеннами, например работающими в миллиметровом диапазоне длин волн, на этапе доступа на основе конкуренции, в частности в соответствии с протоколами IEEE 802.11ad/ay. Получено аналитическое выражение для вероятности возникновения события "глухота" для нескольких вариантов расположения устройств в трехмерном пространстве (3D) и для предложенной линейной аппроксимации коэффициента усиления направленности антенны. Исследуется предложенная формула для нижней границы вероятности события "глухота" для трех реалистичных диаграмм направленности антенны (ДНА) и четырех вариантов фазированных антенных решеток.

Ключевые слова: миллиметровый диапазон длин волн; направленная глухота; 3D; направленный доступ

Метод кластеризации новостных сообщений средств массовой информации на основе их концептуального анализа

  • В. Н. Захаров  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, vzakharov@ipiran.ru
  • Р. Р. Мусабаев  Институт информационных и вычислительных технологий, Алматы, Казахстан, rmusab@gmail. com
  • А. М. Красовицкий  Институт информационных и вычислительных технологий, Алматы, Казахстан, akrassovitskiy@gmail.com
  • Я. Д. Козловская  Московский авиационный институт (национальный исследовательский университет), yana04029877@mail.ru
  • Ал-др А. Хорошилов  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, khoroshilov@mail.ru
  • Ал-ей А. Хорошилов  27 ЦНИИ Министерства обороны России, alex_khor@mail.ru

Аннотация: Изложено решение задачи кластеризации сообщений средств массовой информации (СМИ) на основе разработанной авторами методики автоматического вычисления меры смысловой значимости наименований понятий документов, использующей их статистические, синтаксические и семантические признаки, и технологий автоматического составления декларативных средств для кластеризации документов, базирующихся на методах их семантико-синтаксического и концептуального анализа. На основе предложенной методики вычисления меры смысловой значимости наименований понятий и созданных в процессе проведения настоящего исследования программных и декларативных средств был поставлен эксперимент по обработке представительного массива сообщений СМИ. Анализ полученных результатов показал, что при автоматическом установлении смысловой значимости текстовых наименований понятий использование семантических коррелирующих коэффициентов понятий повышает точность установления смысловой схожести между документами.

Ключевые слова: кластеризация текстов; семантико-синтаксический анализ текстов; концептуальный анализ текстов; декларативные средства; статистическая мера значимых слов документа; семантический корреляционный коэффициент; смысловая близость текстов

Индекс контекстного научного цитирования

  • И. В. Галина  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, im_gl@mail.ru
  • М. М. Шарнин  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, mc@keywen.com

Аннотация: Рассматриваются авторский показатель качества научной статьи - индекс контекстного научного цитирования (ИКНЦ) и связь ИКНЦ и индекса научного цитирования (ИНЦ) с другим авторским показателем - мерой подобия (мерой семантического сходства) двух произвольных текстов. Приведены результаты экспериментов, в частности изучена корреляция между ИКНЦ и ИНЦ, зависящая от значения порога семантического подобия.
На основе моделирования значений независимых переменных и их коэффициентов регрессии предложена прогностическая математическая вероятностная модель зависимости числа прямых цитирований от числа неявных ссылок и их параметров.

Ключевые слова: автоматизированные системы; индекс контекстного научного цитирования; мера семантического подобия; явные и неявные ссылки

Надкорпусные базы данных в лингвистических проектах

  • А. Ю. Егорова  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, ann.shurova@gmail.com
  • И. М. Зацман  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, izatsman@yandex.ru
  • О. С. Мамонова  Факультет иностранных языков и регионоведения Московского государственного университета им. М. В. Ломоносова, mamonovaoks@mail.ru

Аннотация: Рассматривается задача обеспечения лингвистических исследований средствами надкорпусных баз данных (НБД), содержащих выровненные параллельные тексты (каждый из которых включает оригинальный текст и его перевод), а также двуязычные аннотации исследуемых языковых единиц (ЯЕ) и их переводов, сформированные на основе параллельных текстов. Каждая аннотация, формируемая лингвистом, фиксирует некоторую модель перевода ЯЕ. Опыт выполнения в ФИЦ ИУ РАН ряда лингвистических проектов показал, что далеко не все модели перевода, извлекаемые лингвистами из параллельных текстов в процессе лингвистического аннотирования с помощью НБД, описаны в двуязычных словарях и справочниках. Отличительная черта НБД состоит в том, что они позволяют получать новое знание о переводных соответствиях. Оно извлекается лингвистами при сопоставлении и аннотировании предложений оригинального текста и их переводов. Описание функций НБД, которые обеспечивают получение лингвистами нового знания в процессе аннотирования, является основной целью статьи.

Ключевые слова: надкорпусная база данных; лингвистическое аннотирование; языковая единица; корпусная лингвистика; модели перевода

Ошибки в машинном переводе: проблемы классификации

  • А. А. Гончаров  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, a.gonch48@gmail.com
  • Н. В. Бунтман  Московский государственный университет им. М. В. Ломоносова, nabunt@hotmail.com
  • В. А. Нуриев  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, nurieff.v@gmail.com

Аннотация: Рассматриваются проблемы классификации ошибок в машинном переводе. В первой части предлагается обзор разных подходов к оценке качества машинного перевода и классификации ошибок, наблюдаемых при работе автоматизированных систем перевода. Вторая часть посвящена описанию оригинальной классификации ошибок машинного перевода, которая была создана таргетированно - для перевода коннекторов в языковой паре русский-французский. На этой языковой паре подобных исследований еще не проводилось. В предлагаемой классификации выделяются две основные группы ошибок - грамматические/лексические ошибки во фрагменте текста с коннектором и ошибки непосредственно в переводе коннектора. В работе использовался параллельный корпус, состоящий из русскоязычных текстов и их референтных переводов (около 4 млн словоупотреблений). Из этих русскоязычных текстов отбирались фрагменты, содержащие коннекторы, которые затем переводились на французский в двух разных системах машинного перевода.

Ключевые слова: классификация; машинный перевод; качество машинного перевода; ошибки в машинном переводе

Характеризация последовательностных самосинхронных элементов

  • Ю. А. Степченков  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, YStepchenkov@ipiran.ru
  • Ю. Г. Дьяченко  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, diaura@mail.ru
  • Н. В. Морозов  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, NMorozov@ipiran.ru
  • Д. Ю. Степченков  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, stepchenkov@mail.ru
  • Д. Ю. Дьяченко  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, diaden87@gmail.com

Аннотация: Специфика функционирования самосинхронных (СС) схем предъявляет особые требования к процедуре их характеризации. Процедура должна учитывать дисциплину формирования информационных и фазовых сигналов на основе задаваемых пользователем атрибутов входов и выходов характеризуемого элемента. Предложена методика уточнения процесса характеризации для последовательностных CC-элементов, основанная на использовании векторов определения статических значений или направлений переключения входов и выходов. Алгоритмизация и реализация предложенного подхода в новой версии системы автоматизированной характеризации интегральных библиотек (САХИБ) повысили ее эффективность и обеспечили достоверную характеризацию всех типов последовательностных элементов из библиотеки СС-элементов для 65-нанометровой КМОП (комплеменар- ный металл-оксид-полупроводник) технологии. Автоматическое дополнение в процессе характеризации моделей последовательностных элементов конструкциями анализа порядка изменения сигналов на их входах и предупреждения о некорректной последовательности входов облегчает и ускоряет проектирование CC цифровых схем.

Ключевые слова: самосинхронная схема; временные параметры; характеризация; моделирование; триггер; начальное состояние

Метод выбора варианта построения информационно-телекоммуникационной системы

  • А. А. Зацаринный  Федеральный исследовательский центр "Информатика и управление" Российской академии наук, AZatsarinny@ipiran.ru
  • Ю. С. Ионенков  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, UIonenkov@ipiran.ru

Аннотация: Статья посвящена описанию метода выбора варианта построения информационно-телекоммуникационной системы (ИТКС). Рассмотрен общий методологический подход к выбору системотехнических решений построения ИТКС, учитывающий их особенности, принципы и условия построения. Предложен метод выбора варианта построения ИТКС, включающий две взаимоувязанные методики: методику оценки эффективности ИТКС и методику выбора варианта построения ИТКС. Дана общая характеристика методики оценки эффективности ИТКС, представленной в предыдущих публикациях. Разработана методика выбора варианта построения ИТКС с учетом вклада в эффективность соответствующей организационной системы, технической реализуемости и рисков разработки и применения. Предложен перечень частных показателей эффективности для каждой из трех групп обобщенных показателей эффективности (вклад в эффективность организационной системы, техническая реализуемость и риски).

Ключевые слова: информационно-телекоммуникационная система; эффективность; показатель; критерий; технология

О проблеме интеграции информационных ресурсов

  • С. К. Дулин  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук; Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте (АО НИИАС), skdulin@mail.ru
  • И. Н. Розенберг  Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте (АО НИИАС), I.Rozenberg@vniias.ru
  • В. И. Уманский  Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте (АО НИИАС), umanvi@yandex.ru

Аннотация: Анализируются процессы, характерные для интеграции информации, знаний аналитиков и их совместных действий в информационной среде.
Под интеграцией знаний здесь понимается процедура синтеза существующих знаний с целью получения новых. Выделены и рассмотрены три этапа аналитической деятельности и их особенности. Предложено проводить интеграцию информационных ресурсов на основе динамической реструктуризации базы знаний для поддержания ее структурной согласованности и представления ее в виде структурированной совокупности информационных ресурсов в соот-ветствии с требованиями интероперабельности. Для решения подобных задач авторами используется методика, основанная на индуктивно-комбинаторном аппарате сравнения структур связей произвольного множества и одного из типов согласованных множеств. Эта методика выбрана авторами в качестве теоретической базы реализации рассматриваемых задач.

Ключевые слова: информационные ресурсы; реструктуризация базы знаний; интероперабельность; интеграция информации

Моделирование конфликтов агентов в гибридных интеллектуальных многоагентных системах

  • С. В. Листопад  Калининградский филиал Федерального исследовательского центра "Информатика и управление" Российской академии наук, ser-list-post@yandex.ru
  • И. А. Кириков  Калининградский филиал Федерального исследовательского центра "Информатика и управление" Российской академии наук, baltbipiran@mail.ru

Аннотация: Управление конфликтами - неотъемлемая часть процесса решения проблем коллектива экспертов за "круглым столом", обеспечивающая поощрение положительно влияющих на ход решения проблемы конфликтов и предотвращение или разрешение всех остальных. Существующие модели гибридных интеллектуальных многоагентных систем (ГиИМАС) обладают существенным недостатком - конфликты агентов в них не моделируются, а итоговые решения принимаются единственным агентом на основе рекомендаций других агентов. Моделирование конфликтов в ГиИМАС позволит управлять ходом "обсуждения", активируя различные типы коллективного мышления в зависимости от характера и интенсивности конфликта, что обеспечит их релевантность малым коллективам экспертов, успешно решающим проблемы, характеризующиеся высокой комбинаторной сложностью, неоднородностью, недоопределенностью и другими НЕ-факторами. С этой целью в работе предлагаются модели проблемно- и процессно-ориентированного конфликта в ГиИМАС.

Ключевые слова: конфликт; гибридная интеллектуальная многоагентная система; коллектив экспертов; круглый стол

Алгоритм нечеткого сравнения при обработке персональных данных

  • О. В. Бобылева  Хакасский государственный университет им. Н. Ф. Катанова, nimdar@bk.ru
  • И. С. Бекешева  Хакасский государственный университет им. Н. Ф. Катанова, irrisskay@mail.ru
  • В. А. Бобылев  Территориальный фонд обязательного медицинского страхования Республики Хакасия, vadimbobylev@yandex.ru
  • В. В. Чаркова  Хакасскнй государственный университет им. Н. Ф. Катанова, charkova_97@mail.ru

Аннотация: Обоснована необходимость разработки нового метода нечеткого сравнения, ориентированного на сравнение слов в базах данных, содержащих персональные данные. На конкретных примерах из области медицинского страхования указаны плюсы применения данного алгоритма. Приведены результаты работы разработанного и реализованного алгоритма.

Ключевые слова: алгоритм; нечеткий поиск; нечеткое сравнение; матриц

Процесс коррекции ошибок семантической сети как нелинейная динамическая система

  • И. М. Адамович  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, Adam@amsd.com
  • О. И. Волков  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, Volkov@amsd.com

Аннотация: Статья продолжает серию работ, посвященных моделированию ошибок независимых пользователей при формировании семантической сети, лежащей в основе распределенной технологии поддержки конкретно-исторических исследований. Данная статья посвящена описанию и обоснованию подхода к моделированию организационных мер поиска и исправления ошибок подсети экземпляров семантической сети технологии. Описана специфика данного вида ошибок и обоснована необходимость их изучения. Предложенный подход заключается в анализе процессов изменения числа ошибок семантической сети и усилий пользователей, противостоящих их росту, как нелинейной динамической системы. В рамках данных усилий выделяется и описывается отдельный подкласс - волонтерство, характеризующийся добровольными и целенаправленными акциями пользователей по коррекции ошибок. С помощью данного подхода была количественно оценена эффективность действий волонтеров, и на основании этой оценки были сформулированы рекомендации для сообщества пользователей технологии.

Ключевые слова: семантическая сеть; модель; ошибки пользователей; динамическая система; исправление ошибок

Формирование ситуационно зависимых систем требований к решениям задач планирования расходов

  • А. В. Ильин  Государственный научно-исследовательский институт авиационных систем, ilyin@res-plan.com
  • В. Д. Ильин  Вычислительный центр им. А. А. Дородницына Федерального исследовательского центра "Информатика и управление" Российской академии наук, vdilyin@yandex.ru

Аннотация: Предложен подход к экспертному формированию ситуационно зависимых систем требований к решениям задач планирования расходов. Приведена постановка и методы решения линейной задачи ситуационного планирования расходов. В зависимости от набора требований задача решается либо методом приоритетного интервального распределения, либо методом целевого перемещения решения. Каждый из методов позволяет найти план расходов, всегда удовлетворяющий обязательным требованиям и максимально удовлетворяющий ориентирующим требованиям. На каждом шаге поиска плана в режиме вычислительного эксперимента постановка задачи определяется системой обязательных и ориентирующих требований, которая формируется экспертом-планировщиком на основе анализа портретов ситуаций. Предусмотрена возможность задать несколько показателей качества решения. Представление данных и результата планирования в виде числовых отрезков позволяет учесть точность прогнозирования величины распределяемого ресурса и ожидаемых расходов. Формируемые с помощью цифровых двойников портреты ситуаций (целевой, стартовой и достигнутой) представлены формализованным описанием ключевых параметров, характеризующих состояние источников расходуемого ресурса, его потребителей и условия планирования. Приведена характеристика действующего интернет-сервиса планирования расходов.

Ключевые слова: ситуационно зависимые системы требований; ситуационное планирование расходов; метод приоритетного интервального распределения; метод целевого перемещения решения; портреты ситуаций; интернет-сервис планирования расходов

Способ вкрапления данных на основе одной схемы разделения секрета

  • Ю. В. Косолапое  Институт математики, механики и компьютерных наук им. И. И. Воровича, Южный федеральный университет, Ростов-на-Дону, itaim@mail.ru

Аннотация: Важными характеристиками стегосистем являются относительная длина а вкладываемого сообщения и относительная эффективность вложения е. Дополнительными существенными характеристиками таких систем представляются степень свободы при выборе модифицируемых битов кон-тейнера и возможность противостоять утрате части блоков стегоконтейнера. Настоящая работа посвящена разработке стегосистемы, которая, с одной стороны, позволяет восстанавливать частично утраченные данные, а с другой стороны, дает возможность выбирать позиции модифицируемых битов. На базе этой системы строятся и исследуются стегоконструкции, для которых вычисляются характеристики а и е, а также оценивается степень свободы при выборе модифицируемых битов и максимальное число стираний блоков, не приводящих к искажениям вкрапленных данных.

Ключевые слова: сокрытие информации; схема разделения секрета

Поиск путей динамической реконфигурации распределенной информационно-вычислительной системы в случае захвата хоста противником

  • Н. А. Грушо  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, info@itake.ru

Аннотация: Для обеспечения информационной безопасности информационных технологий (ИТ) в распределенных информационно-вычислительных системах (РИВС) ранее был предложен механизм метаданных, реализующий разрешительную систему установления соединений в сети. В случае захвата хоста противником существует стратегия организации атак, которые не выявляются на уровне традиционных метаданных. Ряд ошибок в данных, которые могут быть сгенерированы противником в ходе реализации ИТ, требует построение цепочек причинно-следственных связей, предшествующих ошибке, с целью выявления причины ошибки, при этом метаданные реализуют упрощенную модель причинно-следственных связей при решении задач в ходе выполнения ИТ. Этой моделью можно воспользоваться для поиска указанных ошибок. В работе построена синергетическая связь между решением указанной проблемы информационной безопасности и работой опытного системного администратора (СА) по определению причин неявных ошибок. Эта связь позволяет использовать опыт СА для упрощения поиска захваченного хоста и некоторых стратегий противника по внедрению ошибок в реализацию ИТ. Также эта связь позволяет минимизировать требования по реконфигурации сетей для обхода захваченного хоста.

Ключевые слова: информационная безопасность; метаданные; причинноследственные связи; системное администрирование; неявные сбои и ошибки