Институт проблем информатики Российской Академии наук
Институт проблем информатики Российской Академии наук
Российская Академия наук

Институт проблем информатики Российской Академии наук




«Информатика и ее применения» (Том 8, Выпуск 4, 2014)

Оглавление | Библиография | Об авторах

Аннотации и ключевые слова.

СОВМЕСТНОЕ СТАЦИОНАРНОЕ РАСПРЕДЕЛЕНИЕ ЧИСЛА ЗАЯВОК В НАКОПИТЕЛЕ И В БУНКЕРЕ ПЕРЕУПОРЯДОЧЕНИЯ В МНОГОКАНАЛЬНОЙ СИСТЕМЕ ОБСЛУЖИВАНИЯ С ПЕРЕУПОРЯДОЧЕНИЕМ ЗАЯВОК .

  • А. В.Печинкин  Институт проблем информатики Российской академии наук
  • Р. В. Разумчик  Институт проблем информатики Российской академии наук; Российский университет дружбы народов, rrazumchik@ieee.org

Аннотация: Рассматривается функционирующая в непрерывном времени многоканальная система обслуживания с накопителем бесконечной емкости и переупорядочением заявок. В систему поступает пуассоновский поток заявок, время обслуживания каждым прибором распределено по экспоненциальному закону с одним и тем же параметром. При поступлении в систему всем заявкам присваивается порядковый номер. На выходе из системы сохраняется порядок между заявками, установленный при входе в нее. Заявки, завершившие обслуживание и нарушившие установленный порядок, накапливаются на выходе системы в бункере переупорядочения (БП), который также имеет неограниченную емкость. Найдено совместное стационарное распределение числа заявок в накопителе и суммарного числа заявок в БП в терминах вычислительных алгоритмов и производящих функций (ПФ). Приведены примеры расчетов по полученным соотношениям.

Ключевые слова: многолинейная система массового обслуживания; переупорядочение; стационарное распределение числа заявок

МОДИФИЦИРОВАННЫЙ СЕТОЧНЫЙ МЕТОД РАЗДЕЛЕНИЯ ДИСПЕРСИОННО-СДВИГОВЫХ СМЕСЕЙ НОРМАЛЬНЫХ ЗАКОНОВ .

  • В. Ю. Королев  Факультет вычислительной математики и кибернетики Московского государственного университета им. М. В. Ломоносова; Институт проблем информатики Российской академии наук; victoryukorolev@yandex.ru
  • А. Ю. Корчагин  Факультет вычислительной математики и кибернетики Московского государственного университета им. М. В. Ломоносова; sasha.korchagin@gmail.com

Аннотация: Описывается модифицированный двухэтапный сеточный метод разделения дисперсионносдвиговых смесей нормальных законов, представляющий собой альтернативу чистому ЕМ (expectation- maximization) алгоритму На первом этапе этого алгоритма строится дискретная аппроксимация для смешивающего распределения, на втором этапе подбирается абсолютно непрерывное распределение из заранее заданного семейства, например, обобщенных обратных гауссовских законов, ближайшее к дискретному распределению, полученному на первом этапе. Обсуждаются вопросы сходимости этого двухэтапного алгоритма. Доказана монотонность сеточного итерационного метода, используемого на первом этапе. Подробно обсуждается вопрос оптимального выбора параметров метода, прежде всего сетки, накидываемой на носитель смешивающего распределения. С этой целью предложены статистические оценки квантилей смешивающего распределения. Эффективность метода иллюстрируется примерами конкретных вычислений оценок параметров обобщенных гиперболических распределений.

Ключевые слова: смесь распределений вероятностей; дисперсионно-сдвиговая смесь нормальных законов; обобщенное гиперболическое распределение; ЕМ-алгоритм; сеточный метод разделения смесей

О ФОРМАЛИЗАЦИИ ПОНЯТИЯ ТОКСИЧНОСТИ ПОТОКА ЗАЯВОК НА ФИНАНСОВЫХ РЫНКАХ .

  • А. В. Черток  Факультет вычислительной математики и кибернетики Московского государственного университета им. М.В. Ломоносова; Euphoria Group LLC; a.v.chertok@gmail.com

Аннотация: Рассматривается микроструктурная модель потоков заявок на финансовых рынках. В качестве интегрального индикатора текущего состояния книги заявок используется дисбаланс потока заявок. Для анализа свойств текущего состояния книги заявок используется модель дисбаланса потока заявок, имеющая вид двустороннего процесса риска, известного в актуарной математике как процесс риска со случайными премиями. Исследуется понятие токсичности потока заявок на финансовых рынках. Понятие токсичности потока заявок на финансовых рынках формализуется с помощью вероятностей пересечения процессом дисбаланса потоков заявок фиксированных уровней. Вводятся понятия мгновенного профиля токсичности и байесовского и квантильного показателей токсичности. Эти показатели рассчитываются для двух модельных типов потоков заявок, в первом из которых заявки имеют единичный объем, во втором - объем заявок является случайным и имеющим показательное распределение.

Ключевые слова: финансовые рынки; книга заявок; поток заявок; дисбаланс потока заявок; неблагоприятный отбор; токсичность; пуассоновский процесс; обобщенный пуассоновский процесс; двусторонний процесс риска; процесс риска со случайными премиями; вероятность разорения

АСИМПТОТИЧЕСКИЕ СВОЙСТВА ОЦЕНКИ РИСКА В ЗАДАЧЕ ВОССТАНОВЛЕНИЯ ИЗОБРАЖЕНИЯ С КОРРЕЛИРОВАННЫМ ШУМОМ ПРИ ОБРАЩЕНИИ ПРЕОБРАЗОВАНИЯ РАДОНА.

  • А. А. Ерошенко  Московский государственный университет им. М.В. Ломоносова, факультет вычислительной математики и кибернетики, кафедра математической статистики, aeroshik@gmail.com
  • О. В. Шестаков  Московский государственный университет им. М. В. Ломоносова, факультет вычислительной математики и кибернетики, кафедра математической статистики; Институт проблем информатики Российской академии наук, oshestakov@cs.msu.su

Аннотация: В последние годы вейвлет-методы, основанные на разложении проекций по специальному базису и последующей процедуре пороговой обработки, широко используются при решении задач реконструкции томографических изображений. Их привлекательность заключается, во-первых, в быстроте алгоритмов, а во-вторых, в возможности реконструкции локальных участков изображения по неполным проекционным данным, что имеет ключевое значение, например, для медицинских приложений, где пациента нежелательно подвергать лишней дозе облучения. Анализ погрешностей этих методов преставляет собой важную практическую задачу, поскольку позволяет оценить качество как самих методов, так и используемого оборудования. В работе рассматривается задача оценки функции при обращении оператора Радона в модели с коррелированным шумом. Исследуются асимптотические свойства оценки риска при пороговой обработке коэффициентов вейвлет-вейглет-разложения функции изображения. Приводятся условия, при которых имеет место асимптотическая нормальность несмещенной оценки риска.

Ключевые слова: вейвлеты; линейный однородный оператор; преобразование Радона; пороговая обра ботка; несмещенная оценка риска; коррелированный шум; асимптотическая нормальность

АНАЛИЗ МЕТОК В СКРЫТЫХ КАНАЛАХ .

  • А. А. Грушо  Институт проблем информатики Российской академии наук; факультет вычислительной математики и кибернетики Московского государственного университета им. М. В. Ломоносова, grusho@yandex.ru
  • Н. А. Грушо  Институт проблем информатики Российской академии наук, info@itake.ru
  • Е. Е. Тимонина  Институт проблем информатики Российской академии наук, eltimon@yandex.ru

Аннотация: Рассматривается класс скрытых каналов, построенных на основе меток. Предполагается, что выявление скрытого канала ведется контролером исключительно статистическими методами. Это значит, что редко встречающиеся и часто встречающиеся лингвистические конструкции для контролера неразличимы. Для него важно, чтобы передаваемая по каналу последовательность символов не содержала запретов, не соответствующих вероятностной модели легальных сообщений. Основная проблема при обеспечении невидимости таких каналов состоит в том, что при встраивании меток могут возникать запреты вероятностной меры, описывающей легальную передачу. В работе предложен метод построения меток, которые не могут выявляться контролером. Благодаря такому построению меток скрытый канал невидим.

Ключевые слова: скрытые каналы; информационная безопасность; метки, порождающие скрытый канал; невидимость меток; математические модели скрытых каналов

ВКЛЮЧЕНИЕ НОВЫХ ЗАПРЕТОВ В СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ .

  • А. А. Грушо  Институт проблем информатики Российской академии наук; факультет вычислительной математики и кибернетики Московского государственного университета им. М. В. Ломоносова, grusho@yandex.ru
  • Н. А. Грушо  Институт проблем информатики Российской академии наук, info@itake.ru
  • Е. Е. Тимонина  Институт проблем информатики Российской академии наук, eltimon@yandex.ru

Аннотация: Рассматривается задача порождения одних вероятностных мер на пространстве бесконечных последовательностей над конечными алфавитами с а-алгеброй, порожденной цилиндрическими множествами, из других вероятностных мер на этом пространстве. При этом новая вероятностная мера устроена так, чтобы определенным образом сокращать множество допустимых траекторий случайных последовательностей. Недопустимость траекторий определяется в терминах спецификаций наименьших запретов.

Ключевые слова: случайные последовательности; запреты вероятностных мер; порождение вероятностных мер; статистические задачи на случайных последовательностях

ОБ ОПТИМАЛЬНОЙ ДОСТАВКЕ ГРУЗОВ ТРАНСПОРТНЫМ СРЕДСТВОМ С УЧЕТОМ ЗАВИСИМОСТИ СТОИМОСТИ ПЕРЕВОЗОК ОТ ЗАГРУЗКИ ТРАНСПОРТНЫХ СРЕДСТВ ПО НЕСКОЛЬКИМ ЦИКЛИЧЕСКИМ МАРШРУТАМ.

  • Е. М. Бронштейн  Уфимский государственный авиационный технический университет, bro-eflm@yandex.ru
  • П. А. Зелёв  Уфимский государственный авиационный технический университет, pz1988@yandex.ru

Аннотация: Рассматривается задача построения маршрута доставки грузов потребителям от одного производителя (базы, склада) транспортным средством (ТС) с минимальными затратами на перевозки. При этом учитывается зависимость стоимости транспортировки от загрузки ТС и качества дороги. Предполагается, что ТС может возвращаться на базу для дозагрузки. Построена соответствующая математическая модель. Для случая линейной зависимости стоимости проезда от загрузки получена линейная целочисленная модель. Для решения поставленной задачи наряду с точным алгоритмом предложена модификация известного эвристического алгоритма Кларка-Райта. Проведен вычислительный эксперимент.

Ключевые слова: эвристический алгоритм; построение маршрута; транспортировка; задача маршрутиза- ции

МЕТОД ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ РЕШЕНИЯ ЗАДАЧ ВЕРОЯТНОСТНОЙ ВЕРИФИКАЦИИ ВЫЧИСЛИТЕЛЬНЫХ И ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМ .

  • А. М. Миронов Институт проблем информатики Российской академии наук, amironov66@gmail.com
  • С. Л. Френкель  Институт проблем информатики Российской академии наук; Московский государственный технический университет радиотехники, электроники и автоматики (МГТУ МИРЭА), fsergei@mail.ru

Аннотация: Рассматривается проблема снижения трудоемкости вероятностной верификации при проектировании вычислительных систем. Поставленная цель достигается редукцией вероятностных систем переходов (ВСП), моделирующих проектируемые системы. Верификация ВСП заключается в вычислении истинностных значений формул вероятностной темпоральной логики (PCTL, Probabilistic Computational Tree Logic) в начальных состояниях ВСП. Редукция ВСП выполняется по алгоритму удаления эквивалентных состояний, в результате работы которого получается такая ВСП, у которой все свойства, выражаемые формулами логики PCTL, совпадают со свойствами исходной ВСП.

Ключевые слова: верификация; вероятностные системы переходов; вероятностная темпоральная логика; редукция вероятностных моделей

ФАЛЬШТЕКСТЫ: КЛАССИФИКАЦИЯ И МЕТОДЫ ОПОЗНАНИЯ ТЕКСТОВЫХ ИМИТАЦИЙ И ДОКУМЕНТОВ С ПОДМЕНОЙ АВТОРСТВА .

  • М. Ю. Михеев  Научно-исследовательский вычислительный центр Московского государственного университета им. М. В. Ломоносова; Институт проблем информатики Российской академии наук, m-miheev@rambler.ru
  • Н. В. Сомин  Институт проблем информатики Российской академии наук, somin@post.ru
  • И. В. Галина  Институт проблем информатики Российской академии наук, im_gl@mail.ru
  • О. В. Золотарев  4Российский новый университет, ol-zolot@yandex.ru
  • Е. Б. Козеренко  Институт проблем информатики Российской академии наук, kozerenko@mail.ru
  • Ю. И. Морозова  Институт проблем информатики Российской академии наук, miss-yulia-morozova@yandex.ru
  • М. М. Шарнин  Институт проблем информатики Российской академии наук, mc@keywen.com

Аннотация: Современное текстовое пространство, включая Интернет, огромно и постоянно пополняется новыми текстами. Все текстовые документы можно разбить на две большие группы: "добросовестные тексты" и то, что можно назвать "фальштекстами". К настоящему времени индустрия фальштекстов приобрела столь массовое распространение, что возникает настоятельная потребность изучения этого явления и разработки действенных методов обнаружения подобных текстовых документов. Цель настоящей статьи состоит в том, чтобы дать адекватное описание понятия фальштекста как информационного и лингвистического феномена и предложить некоторые подходы к опознанию таких текстов.

Ключевые слова: порождение текста; обработка естественного языка; статистический анализ языковых объектов; плагиат; типология фальштекстов

ВИЗУАЛИЗАЦИЯ РЕЗУЛЬТАТОВ ДЛЯ МЕТОДА СКОЛЬЗЯЩЕГО РАЗДЕЛЕНИЯ СМЕСЕЙ .

  • А. К. Горшенин  Институт проблем информатики Российской академии наук; Московский государственный технический университет радиотехники, электроники и автоматики; agorshenin@ipiran.ru

Аннотация: Метод скользящего разделения смесей (СРС-метод) представляет собой мощный инструмент анализа стохастических процессов различной природы. Именно на основании экспертной оценки результатов, полученных в ходе работы итерационных процедур СРС-метода, был получен ряд важных результатов в физике турбулентной плазмы, произведено уточнение математических моделей функционирования финансовых рынков. Зачастую каждая группа исследователей готовит результаты в удобном для себя формате, что затрудняет экспертам сравнение и интерпретацию результатов, особенно если речь идет о тестировании одной модели на принципиально разнородных выборках из отличных между собой предметных областей. В настоящей работе представлено удобное для исследователя-эксперта средство визуального отображения оценок параметров моделей, не зависящее от используемых для расчетов методов.

Ключевые слова: метод скользящего разделение смесей; пользовательский интерфейс; смеси нормальных распределений; вероятностные модели; интеллектуальный анализ данных

ОБ ЭРГОНОМИЧЕСКИХ ЗАВИСИМОСТЯХ МЕЖДУ ПАРАМЕТРАМИ СИТУАЦИОННОГО ЗАЛА С ИСПОЛЬЗОВАНИЕМ ИЗОГНУТОГО КОЛЛЕКТИВНОГО ЭКРАНА.

  • А. А. Зацаринный  Институт проблем информатики Российской академии наук, azatsarumy@ipiran.ru
  • К. Г. Чупраков  Институт проблем информатики Российской академии наук, chkos@rambler.ru

Аннотация: Рассмотрен подход к определению зависимостей между параметрами ситуационного зала: размерами помещения, числом наблюдателей, информационной емкостью контента (количеством знаков) и шириной экрана. Эти зависимости позволяют рассчитать неизвестный параметр ситуационного зала при известных других с выполнением требований государственных и международных стандартов по эргономике рабочих мест. Предложенные формулы применимы и для изогнутых экранов, определяемых в рамках статьи углом кривизны в (для плоского экрана в = 0). Данный параметр может быть интерпретирован как угол наклона между дисплеями в полиэкране. Наличие этого параметра позволяет оценить эффективность использования изогнутых экранов в составе систем отображения информации коллективного использования. Предложен общий подход к определению количества рабочих мест для коллективного экрана, который может быть применен для их различных взаимных расположений.

Ключевые слова: изогнутый экран коллективного пользования; ситуационный зал; диспетчерский пункт; эргономические зависимости; область комфортного наблюдения; угол кривизны экрана; видеостена; полиэкран; эффективность; оправданность цены

МЕТОДЫ РАЗРЕШЕНИЯ СУЩНОСТЕЙ И СЛИЯНИЯ ДАННЫХ В ETL-ПРОЦЕССЕ И ИХ РЕАЛИЗАЦИЯ В СРЕДЕ HADOOP .

  • А. Е. Вовченко  Институт проблем информатики Российской академии наук, alexey.vovchenko@gmail.com
  • Л. А. Калиниченко  Институт проблем информатики Российской академии наук; Московский государственный университет им. М. В. Ломоносова, факультет вычислительной математики и кибернетики, leonidk@synth.ipi.ac.ru
  • Д. Ю. Ковалев  Институт проблем информатики Российской академии наук, dm.kovalev@gmail.com

Аннотация: При интеграции данных из совокупности исходных коллекций важной задачей является извлечение сущностей, их трансформация и загрузка в интегрированное хранилище. Такие действия являются частью ETL-процесса (extract-transform-loading). Под сущностью здесь понимается некоторое цифровое представление объекта реального мира (например, информация о персонах). При извлечении сущностей возникает проблема их разрешения: из различных ресурсов можно извлечь различную информацию об одном и том же объекте реального мира. Проблема разрешения сущностей ориентирована на решение таких задач, как идентификация сущностей, выявление дубликатов, удаление дубликатов, установление связей между сущностями, сопоставление сущностей с некоторым шаблонным образцом и др. После разрешения сущностей следует этап их слияния - формирование интегрированных сущностей (содержащих информацию из всех связанных сущностей). Слияние сущностей является заключительным этапом интеграции данных. В работе дан обзор методов разрешения и слияния сущностей. Рассматриваются вопросы адаптации таких методов для применения в ETL-процессе при интеграции больших данных в Hadoop. Также рассматриваются способы программирования методов разрешения и слияния сущностей как частей ETL-процесса. В качестве языка программирования используется HIL (High-Level Integration Language) - декларативный язык, ориентированный на разрешение и интеграцию сущностей в Hadoop-инфраструктуре.

Ключевые слова: интеграция данных; ETL; разрешение сущностей; слияние сущностей; большие данные; Hadoop; Jaql; HIL

CONCEPTUAL MODELING OF MULTIDIALECT WORKFLOWS .

  • L. Kalinichenko  Institute of Informatics Problems, Russian Academy of Sciences, 44-2 Vavilov Str., Moscow 119333, Russian Federation, Faculty of Computational Mathematics and Cybernetics, M.V. Lomonosov Moscow State University, 1-52 Leninskiye Gory, GSP-1, Moscow 119991, Russian Federation
  • S. Stupnikov  Institute of Informatics Problems, Russian Academy of Sciences, 44-2 Vavilov Str., Moscow 119333, Russian Federation
  • A. Vovchenko  Institute of Informatics Problems, Russian Academy of Sciences, 44-2 Vavilov Str., Moscow 119333, Russian Federation
  • D. Kovalev   Institute of Informatics Problems, Russian Academy of Sciences, 44-2 Vavilov Str., Moscow 119333, Russian Federation

КОНЦЕПТУАЛЬНОЕ МОДЕЛИРОВАНИЕ МУЛЬТИДИАЛЕКТНЫХ ПОТОКОВ РАБОТ.

  • Л. А. Калиниченко  Институт проблем информатики Российской академии наук, Московский государственный университет им. М. В. Ломоносова, факультет вычислительной матема- тики и кибернетики
  • С. Ступников  Институт проблем информатики Российской академии наук
  • А. Вовченко  Институт проблем информатики Российской академии наук
  • Д. Ковалев  Институт проблем информатики Российской академии наук

Аннотация: Рассматриваются методы концептуального представления алгоритмов анализа данных, средств интеграции данных, а также процессов, направленных на спецификацию семантики данных и поведения в единой парадигме. Расширяется новый подход к применению комбинации семантически различных платформонезависимых языков на правилах (диалектов) для создания интероперабельных концептуальных спецификаций над различными системами на правилах. Подход опирается на методику трансформации программ на правилах, рекомендованную стандартом W3C Rule Interchange Format (RIF).
Подход, предлагаемый в стандарте RIF, сочетается со технологией семантической интеграции неодно- родных баз данных в предметных посредниках. Статья расширяет предыдущие исследования авторов в направлении моделирования потоков работ для определения композиций алгоритмических модулей в процессной структуре. Рассмотрены возможности спецификации задач в мультидиалектных потоках работ с применением семантически различных языков, наиболее подходящих для конкретных задач. Приведен практический пример потока работ, задачи которого специфицированы с использованием нескольких языков на правилах (RIF-CASPD, RIF-BLD, RIF-PRD). Для определения концептуальной схемы использован язык OWL 2, для оркестровки потока работ использован язык RIF-PRD. Инфраструктура реализации примера включает систему на продукционных правилах (IBM ILOG), систему на логических правилах (DLV) и предметный посредник.

Ключевые слова: концептуальные спецификации; потоки работ; RIF; языки продукционных правил; интеграция баз данных; посредники; PRD; мультидиалектная инфраструктура

AUTOMATION BEYOND WEB 2.0 .

  • A. Sorokin  IBM EE/A, 10 PresnenskayaNab., Moscow 123317, Russian Federation

АВТОМАТИЗАЦИЯ ЗА ПРЕДЕЛАМИ WEB 2.0 .

  • А. Сорокин  IBM EE/A, Пресненская наб. 10, Москва 123317, Россия

Аннотация: Рассматривается новый подход к анализу эволюции информационных систем, основанный на разработанном автором стеке активностей. С помощью введенного подхода исследуются перспективные тенденции построения на платформе Вэб информационных систем, которые начинаются с автоматизации отдельных бизнес-процессов и затем, в результате дальнейшей экспансии информационных технологий (ИТ), охватывают области профессиональной деятельности. В результате классический подход к проектированию информационных систем, базирующийся на устранении посредством автоматизации узких мест бизнес-процессов, перестает работать. Текущие тенденции в развитии ИТ, связанные с новыми возможностями "ортогональной" интеграции систем, делают вероятным появление нового типа больших информационных систем и нового типа их Вэб-архитектуры, условно названного в данной работе "спиралью паутины". По сравнению с "радиальной" интеграцией Вэб в рамках одной профессиональной области такой тип архитектуры является более эффективным.

Ключевые слова: автоматизация; реинжиниринг бизнес-процессов; совместная разработка программных продуктов; экономика масштабирования; интернет-топология; социотехнические системы; системы систем; виртуальные предприятия; Вэб 2.0