Методы обработки количественных данных. Количественные данные, определяющие размеры, время жизни и структуру всех динамических объектов, могут быть установлены только в результате натурных наблюдений, которые осуществляются путем организации системы измерений и контроля за состоянием физических сред - мониторинга. Данные, получаемые в процессе наблюдений, обрабатываются с использованием аппарата многомерного статистического анализа (факторный анализ, метод главных компонент, классификация и снижение размерности данных) и информационного анализа (энтропийный анализ, устойчивое оценивание и прогнозирование). Технологическая цепочка проведения анализа в этом случае выглядит так: классификация данных, накопление обучающей выборки, построение формальной функциональной (математической) модели. Первые два звена этой цепочки предназначены для подготовки информации, необходимой для построения модели. При этом исходная информация не систематизирована и обладает определенной избыточностью, поэтому алгоритмическое обеспечение анализа должно включать в себя средства сжатия исходной информации и выделения исходных признаков.
К одной из важных групп методов обработки данных относятся методы классификации многомерных наблюдений, цель которых состоит в формировании однородных по своим признакам групп наблюдений, максимально различающихся по внешним характеристикам (методы робастной статистики и бутстреп-методы). Общее назначение данных методов заключается в преодолении смещенности оценок вероятностных характеристик исследуемых выборок данных, что позволяет получать устойчивые оценки порогов классификации.
Другую важную группу методов анализа составляют алгоритмы прогнозирования. Как правило, это методы краткосрочного и среднесрочного прогнозов (методы экспоненциального сглаживания, синхронный корреляционный анализ (СКА)). СКА позволяет учитывать вклад в величину статистических взаимосвязей всех видов корреляционных показателей: взаимных, частных и множественных коэффициентов корреляции. Это позволяет снять неопределенности, связанные с множественностью статистических связей: когда значения одной совокупности данных коррелируются со значениями другой, но это является отражением факта, что они обе коррелированы со значениями третьей совокупности.
Рассмотренные задачи и методы анализа наблюдаемых данных позволяют сформировать структуру информационного обеспечения подсистемы моделирования для построения функциональных моделей систем, функционирование которых производится в среде количественных переменных, т.е. переменных, измеряемых в количественных шкалах (абсолютной, разностной, отношений, порядковой и интервальной).
Основные звенья такой структуры: 1) программно-аппаратные комплексы, обеспечивающие автоматизированный сбор, хранение и оперативную обработку информации и оптимальное управление ее сбором; 2) банки наблюдаемых данных, обеспечивающие хранение и коллективное использование больших массивов разнородной информации; 3) программное обеспечение в виде пакетов прикладных программ, позволяющих реализовать статистический и структурный анализы данных и осуществлять структурную и параметрическую идентификацию.
Методы обработки семантических данных. Перечисленные выше методы, хорошо себя зарекомендовавшие в описании подсистем, функционирующих в среде количественных переменных, в силу ряда недостатков не могут быть использованы для описания подсистем, функционирующих в среде качественных (семантических) переменных, т.е. переменных, измеряемых в качественных шкалах. Например, к таким шкалам могут быть отнесены шкалы баллов, наименований, нечетких величин, лингвистических переменных, значения которых имеют семантическую форму (например: «очень малая величина», «малая величина», «средняя величина», «большая величина», «очень большая величина»). Это связано с тем, что информация в таких системах (подсистемах), как организационные, финансово-экономические, социальные, юридические, медицинские и др. может иметь не только количественное представление, но и представление в виде семантических оценок значений переменных, которые описываются с помощью термов лингвистических переменных, высказываний.
Согласование указанной разнородной информации является одной из основных задач системного анализа таких систем (подсистем). Для этого может быть использовано универсальное представление информации в виде значений лингвистических переменных либо предикатное представление. Другой способ заключается в построении многоуровневых моделей, причем тип модели каждого уровня определяется типом переменных, в среде которых производится отображение входов системы (подсистемы) в ее выходы.
Лингвистические переменные не только представляют собой аппарат для оперирования неопределенностями, но и дают возможность описания совокупности качественно разнородных состояний системы. Имеющиеся количественные оценки "размываются", и им в соответствие ставятся некоторые нечеткие подмножества, при этом существующие неопределенности фильтруются: статистическая неопределенность рассматривается как частный случай нечеткости, а функции распределения вероятностей - как функции принадлежности. Информация, полученная от экспертов, представляется в лингвистической форме, имена лингвистических переменных унифицируются для всех видов информации. В результате каждой лингвистической переменной, данной экспертом, можно поставить в соответствие определенное нечеткое подмножество. На основе такого подхода могут быть построены нечеткие модели.
В предикатном представлении все виды информации рассматриваются как такие, которые делают истинным определенный набор предикатов. Согласованная информация, то есть приведенная к унифицированному виду, может быть использована для решения задач моделирования, прогнозирования или управления организационными (технологическими) подсистемами. При этом могут быть использованы логические методы, основанные на обычном исчислении предикатов, нечетком исчислении высказываний и предикатов, логических основаниях протекания физических процессов, причинно-следственной логики. На основе такого подхода могут быть построены логические модели.
Для подсистем ИС, в основе которых лежат физико-химические законы или такие процессы, которые могут быть сведены к таким законам формально, могут быть использованы методы, основанные на логике процессов и причинно-следственных связей. Основным способом представления знаний в этом случае является система так называемых качественных дифференциальных уравнений (конфлюэнций). Конфлюэнция - это отношение, связывающее между собой представленные в семантическом виде такие параметры системы, которые непосредственно влияют один на другой, т.е. признаки непосредственных причин и следствий. Моделирование поведения системы при этом выполняется путем возбуждения всех причинно-следственных цепочек. Это реализуется путем логического вывода в формальных арифметиках качественных переменных с помощью некоторых непротиворечивых правил вывода.