6. Методы обработки информации подсистемой моделирования

Методы обработки количественных данных. Количественные  данные, определяющие размеры, время жизни и структуру всех динамических объектов,  могут быть установлены только в результате натурных  наблюдений, которые  осуществляются путем организации системы измерений и контроля за состоянием физических сред - мониторинга. Данные, получаемые в процессе наблюдений, обрабатываются с использованием аппарата многомерного статистического анализа (факторный анализ,  метод  главных  компонент, классификация  и снижение размерности данных) и информационного анализа (энтропийный анализ,  устойчивое оценивание и прогнозирование).  Технологическая цепочка проведения анализа в этом случае выглядит так:  классификация  данных,  накопление  обучающей  выборки, построение  формальной функциональной (математической) модели.  Первые два звена этой цепочки предназначены для подготовки информации,  необходимой для построения модели.  При этом исходная информация не систематизирована и обладает определенной избыточностью, поэтому алгоритмическое  обеспечение анализа должно включать в себя средства сжатия исходной информации и выделения исходных признаков.

К одной из важных групп методов обработки данных относятся методы классификации многомерных наблюдений, цель которых состоит в формировании однородных по своим признакам  групп  наблюдений,  максимально различающихся  по внешним характеристикам (методы робастной статистики и бутстреп-методы).  Общее назначение данных методов заключается в преодолении смещенности  оценок вероятностных  характеристик исследуемых выборок данных,  что позволяет получать устойчивые оценки порогов классификации.

Другую важную группу методов анализа составляют алгоритмы  прогнозирования.  Как правило,  это методы краткосрочного и среднесрочного прогнозов (методы экспоненциального сглаживания, синхронный корреляционный анализ (СКА)).  СКА позволяет учитывать вклад в величину статистических взаимосвязей всех видов корреляционных показателей: взаимных, частных и множественных коэффициентов корреляции.  Это позволяет снять неопределенности,  связанные с множественностью статистических связей: когда  значения  одной совокупности данных коррелируются со значениями другой, но это является отражением факта, что они обе коррелированы со значениями третьей совокупности.

Рассмотренные задачи и методы анализа наблюдаемых данных позволяют сформировать структуру информационного обеспечения подсистемы моделирования для построения функциональных моделей систем, функционирование которых производится в среде количественных переменных, т.е. переменных,  измеряемых  в количественных шкалах (абсолютной,  разностной, отношений, порядковой и интервальной).

Основные звенья  такой структуры:  1) программно-аппаратные комплексы,  обеспечивающие автоматизированный сбор, хранение и оперативную обработку информации и оптимальное управление ее сбором; 2) банки наблюдаемых данных,  обеспечивающие хранение и коллективное использование больших массивов разнородной информации;  3) программное обеспечение в виде пакетов прикладных программ, позволяющих реализовать статистический и структурный анализы данных и осуществлять структурную и параметрическую идентификацию.

Методы обработки семантических данных. Перечисленные выше методы, хорошо себя зарекомендовавшие в описании подсистем,  функционирующих в среде  количественных переменных, в силу ряда недостатков не могут быть использованы для описания подсистем,  функционирующих в среде  качественных (семантических) переменных, т.е. переменных, измеряемых в качественных шкалах. Например, к таким шкалам могут быть отнесены шкалы баллов, наименований, нечетких величин, лингвистических переменных, значения которых имеют семантическую форму (например: «очень малая величина», «малая величина», «средняя величина», «большая величина»,  «очень большая величина»). Это связано с тем, что информация в таких системах (подсистемах), как организационные,  финансово-экономические,  социальные,  юридические,  медицинские и др.  может иметь не только количественное представление, но и представление в виде семантических оценок значений переменных, которые описываются с помощью термов лингвистических переменных, высказываний.

Согласование указанной  разнородной  информации является одной из основных задач системного анализа таких систем (подсистем).  Для этого может  быть использовано универсальное представление информации в виде значений лингвистических переменных  либо предикатное  представление. Другой способ заключается в построении многоуровневых моделей, причем тип модели каждого уровня определяется типом переменных, в среде которых производится отображение входов системы  (подсистемы)  в ее выходы.

Лингвистические переменные не только представляют  собой  аппарат для  оперирования  неопределенностями,  но и дают возможность описания совокупности качественно разнородных состояний системы.  Имеющиеся количественные оценки "размываются",  и им в соответствие ставятся некоторые нечеткие подмножества,  при этом  существующие  неопределенности фильтруются: статистическая неопределенность рассматривается как частный случай нечеткости,  а функции  распределения  вероятностей  -  как функции принадлежности. Информация, полученная от экспертов, представляется в лингвистической форме,  имена лингвистических переменных унифицируются  для всех видов информации.  В результате каждой лингвистической переменной,  данной экспертом,  можно поставить в  соответствие определенное нечеткое подмножество.  На основе такого подхода могут быть построены нечеткие модели.

В предикатном представлении все виды информации  рассматриваются как такие, которые делают истинным определенный набор предикатов. Согласованная информация,  то есть приведенная к  унифицированному  виду, может быть использована для решения задач моделирования, прогнозирования или управления организационными  (технологическими)  подсистемами. При  этом  могут  быть  использованы логические методы,  основанные на обычном исчислении предикатов, нечетком исчислении высказываний и предикатов,  логических основаниях протекания физических процессов,  причинно-следственной логики.  На основе такого  подхода  могут быть построены логические модели.

Для подсистем ИС, в основе которых лежат физико-химические законы или  такие  процессы,  которые могут быть сведены к таким законам формально, могут быть использованы методы, основанные на логике процессов и причинно-следственных связей.  Основным способом представления знаний в этом случае является система так называемых  качественных дифференциальных уравнений (конфлюэнций). Конфлюэнция - это отношение, связывающее между собой представленные в семантическом виде такие  параметры системы,  которые непосредственно влияют один на другой,  т.е. признаки непосредственных причин и следствий.  Моделирование поведения системы  при  этом  выполняется путем возбуждения всех причинно-следственных цепочек. Это реализуется путем логического вывода в формальных арифметиках качественных переменных с помощью некоторых непротиворечивых правил вывода.