В общем случае – формализация задачи – это построение моделей исследуемой системы, формализация цели, т.е. выбор набора критериев и их весовых коэффициентов, адекватно отражающих цель, преследуемую ЛПР при принятии решений. В этом разделе рассмотрим основные особенности приближенной формализации, при которой выполняется условие согласования ошибок (12), и сформулируем основные задачи.
Кроме того, обсудим проблему выбора критериев приближенной формализации исследуемой системы, используя при этом понятие информационного критерия.
Как следует из соотношения (13) и постановки проблемы 1 модели ИС должны: 1) описывать поведение исследуемой системы с ограниченной ошибкой; 2) обеспечивать соответствие размеров области ошибок допустимым значениям критерия качества функционирования системы; 3) быть способны отображать поведение ИС в среде разнотипной информации с допустимой точностью; 4) быть хорошо обусловлены. Кроме того, при изменении критерия качества во времени необходимо, чтобы его значение у исследуемой системы было не больше, чем аналогичный показатель у модели в любой момент времени заданного интервала.
Если существует некоторое множество
моделей, отвечающим этим требованиям, и
существует эффективный
алгоритм TZ(x,М)
решения данного класса задач Z,
такой, что качество решения, характеризуемое заданной системой
критериев {q1(y,u),…,
q2(y,u)},
будет не хуже допустимых
значений
,
то задача приближенной формализации ИС заключается в
отыскании некоторой процедурой TF(I,EM)
модели М,
принадлежащей множеству
.
Математически эта задача может быть сформулирована следующим образом:
(17)
Здесь
h
- допустимое расстояние u*
от оптимального решения
uo
в заданной метрике решений.
Задачу приближенной формализации цели можно сформулировать следующим образом.
Существуют: 1) множество критериев (целевых функций) {q1(y,u), ... , qs(y,u)}, взаимосвязь между которыми априорно не ясна; 2) множество U всех допустимых решений (с учетом ограничений). Требуется указать цель решения - точку Q(y,uо), которая наилучшим образом соответствует решаемой задаче:
.
(18)
Задача приближенной формализации выбора эффективных алгоритмов решения сформулирована следующим образом.
В базе знаний
СППР содержится множество алгоритмов решения
данного
класса задач, каждый из которых обладает вектором
частных показателей эффективности алгоритма
- точность достижения цели, скорость убывания
(увеличения) значений критерия и т.п.
Критерий выбора алгоритма из числа допустимых для решения задачи z
может быть определен или как один частных показателей
эффективности ti,
или как обобщенный показатель G= Swi
×ti
, i=1,...,p.
.
(19)
Основными проблемами, возникающими при приближенной формализации систем, целей и выбора алгоритмов, являются:
- выбор оптимального представления данных и критериев, отражающих поведение исследуемой системы в среде разнотипных переменных;
- выбор оптимальной формы представления моделей;
- извлечение эвристических правил из наблюдений для использования их в приближенной модели и непосредственной поддержки решений.
В приближенной модели в качестве входных и
выходных воздействий рассматриваются векторы подмножеств
Am(k)
= [a1(k),...,am(k)],
Bn(k)
= [b1(k),...,bn(k)]
,
компоненты которых
ai(k)
и bj(k)
представляют собой подмножества значений
i-го
входного и j-выходного
воздействий. Причем каждое из подмножеств
характеризуется своей функцией принадлежности. Вектор
Am(k)
можно разбить на два вектора
Am(k)
= [Cp(k),Dq(k)]
,
где Cp(k)
=
[c1(k),...,cp(k)]
,
- вектор управляемых входных
подмножеств, определенных на множествах значений
X1,…,Xp;
d(k)
= [d1(k),...,
dq(k)]
,
- вектор неуправляемых входных подмножеств, определенных на множествах
значений Xp+1(k),…,Xn(k);
где k
– дискретное время.
Приближенная модель в зависимости от требуемой точности отображения поведения системы может быть построена либо типа "вход-выход" (15) или:
,
(20)
либо в виде более точной модели типа "вход-состояние-выход" (16) или:
(21)
Здесь
s(k)
= [s1(k),...,
sh(k)]
Í
(
)-
вектор подмножеств состояния ИС, определенных на
множествах значений G1,…,Gh.
Компонента bi
вектора В(t)Í
содержит подмножество значений
.
Аналогично выглядят такие соотношения и для других подмножеств
Cp,
Dq,
Sh.
Процедуру поиска приближенной модели М будем оценивать следующими характеристиками:
1) состоятельность получаемых моделей, под которой будем понимать выполнение условия:
,
(22)
где -
остаточные (апостериорные) неопределенности, после получения информации о
системе с помощью модели, соответственно, точной и приближенной.
He
- априори заданное малое значение остаточной энтропии;
b
-достаточно малое положительное число;
2) эффективность, под которой понимается выполнение условия:
(23)
где -
остаточная энтропия приближенной модели;
-
остаточная энтропия любой другой модели, полученной при тех же условиях;
3) несмещенность получаемой с помощью приближенной модели оценки b(Х), под которой понимается выполнение условия:
y(X) = centr(b(X)), b(X)ÎB,
где centr(b(X)) - чебышевский центр подмножества b(X) ÎB;
4) сложность получаемых моделей, которую будем оценивать одним из показателей
(24)
где nx, Nx – соответственно, число учитываемых моделью факторов и общее число возможных факторов; nS, NS – соответственно, число элементарных структурных элементов, включенных в модель, и общее число исходных структурных элементов, определенное из априорной информации.
Тогда оптимальная сложность определяется условием
;
(25)
4) устойчивость, под
которой будем понимать стабильность оценок,
получаемых на
различных выборках
WN-p
ÎWN.
Выборки
WN-p
образованы из выборки
WN
путем смены р строк
W
случайным образом. При этом
WN-p
ÈWp=
WN, WN-pÇWp=
Æ.
Тогда устойчивость получаемых моделей можно характеризовать статистикой
st(d),
определяемой выражением
,
(26)
где nр – число подвыборок WN-p; na(d) – число подвыборок WN-p Î WN, для которых выполняется условие
.
(27)
Исходя из вышесказанного, сформулируем основные требования, предъявляемые к процедуре поиска приближенной модели, выполняемой путем обработки данных "вход-выход" наблюдений за поведением исследуемой системы, полученных без активного эксперимента. К таким требованиям следует отнести: 1) получаемые модели М должны быть: состоятельными, эффективными и несмещенными; 2) получаемые модели М должны обладать минимальной сложностью; 3) процедура поиска модели М должна обеспечивать достаточную устойчивость к отличиям в выборках данных.
Процедуру, удовлетворяющую этим требованиям, назовем эффек