9. Задача приближенной формализации

В общем случае – формализация задачи – это построение моделей исследуемой системы, формализация цели, т.е. выбор набора критериев и их весовых коэффициентов, адекватно отражающих цель, преследуемую ЛПР при принятии решений. В этом разделе рассмотрим основные особенности приближенной формализации, при которой выполняется условие согласования ошибок (12), и сформулируем основные задачи.

Кроме того, обсудим проблему выбора критериев приближенной формализации исследуемой системы, используя при этом понятие информационного критерия. 

Как следует из соотношения (13) и постановки проблемы 1 модели ИС должны: 1) описывать поведение исследуемой системы с ограниченной ошибкой; 2) обеспечивать соответствие размеров области ошибок допустимым значениям критерия качества функционирования системы; 3) быть способны отображать поведение ИС в среде разнотипной информации с допустимой точностью; 4) быть хорошо обусловлены. Кроме того, при изменении критерия качества во времени необходимо, чтобы его значение у исследуемой системы было не больше, чем аналогичный показатель у модели в любой момент времени заданного интервала.

Если существует некоторое множество  моделей, отвечающим этим требованиям,  и  существует  эффективный  алгоритм TZ(x,М) решения данного класса задач Z,  такой, что качество решения, характеризуемое заданной системой  критериев {q1(y,u),…, q2(y,u)}, будет  не  хуже допустимых значений , то задача  приближенной формализации ИС заключается в отыскании некоторой процедурой TF(I,EM) модели М, принадлежащей множеству .

Математически эта задача может быть сформулирована следующим образом:

               (17)

Здесь h - допустимое расстояние u* от оптимального решения uo в заданной метрике решений.

Задачу приближенной формализации цели можно сформулировать следующим образом.

Существуют: 1)    множество    критериев    (целевых     функций) {q1(y,u), ... , qs(y,u)},  взаимосвязь  между  которыми априорно не ясна;  2) множество U всех допустимых решений (с учетом  ограничений). Требуется указать цель решения - точку Q(y,uо), которая наилучшим образом соответствует решаемой задаче:

.        (18)

Задача приближенной  формализации  выбора  эффективных алгоритмов решения сформулирована следующим образом.

В базе  знаний  СППР  содержится множество алгоритмов решения  данного класса задач,  каждый из которых обладает вектором  частных показателей эффективности алгоритма  - точность достижения цели,  скорость убывания (увеличения) значений критерия  и т.п.  Критерий выбора алгоритма из числа допустимых для решения задачи z может быть определен или как один частных показателей  эффективности ti, или как обобщенный показатель G= Swi ×ti  , i=1,...,p.

.      (19)

Основными проблемами, возникающими при приближенной  формализации систем, целей и выбора алгоритмов, являются:

     - выбор оптимального представления данных и критериев, отражающих поведение исследуемой системы в среде разнотипных переменных;

     - выбор оптимальной формы представления моделей;

     - извлечение эвристических правил из наблюдений для использования их в приближенной модели и непосредственной поддержки решений.

В приближенной модели в качестве входных и выходных воздействий рассматриваются векторы подмножеств Am(k) = [a1(k),...,am(k)],  Bn(k)  = [b1(k),...,bn(k)],  компоненты которых ai(k) и bj(k) представляют собой подмножества значений i-го входного и j-выходного воздействий.  Причем каждое из подмножеств характеризуется своей функцией принадлежности. Вектор Am(k) можно разбить на два вектора Am(k) = [Cp(k),Dq(k)], где Cp(k) = [c1(k),...,cp(k)], - вектор управляемых входных подмножеств, определенных на множествах значений X1,…,Xp; d(k) = [d1(k),..., dq(k)], - вектор неуправляемых входных подмножеств, определенных на множествах значений Xp+1(k),…,Xn(k); где k – дискретное время.

Приближенная модель в зависимости от требуемой точности отображения поведения системы может быть построена либо типа "вход-выход" (15) или:

,                              (20)

либо в виде более точной модели типа "вход-состояние-выход" (16) или:

                               (21)

Здесь s(k) = [s1(k),..., sh(k)] Í ()- вектор подмножеств  состояния ИС, определенных на множествах значений G1,…,Gh. Компонента bi вектора В(t)Í содержит подмножество значений . Аналогично выглядят такие соотношения и для других подмножеств Cp, Dq, Sh.

Процедуру поиска приближенной модели М будем оценивать  следующими  характеристиками:

1) состоятельность получаемых моделей, под которой будем понимать выполнение условия:

,                             (22)

где - остаточные (апостериорные) неопределенности, после получения информации о системе с помощью модели, соответственно, точной и приближенной. He - априори заданное малое значение остаточной энтропии; b остаточно малое положительное число;

2) эффективность,  под  которой  понимается  выполнение  условия:

                                             (23)

где - остаточная энтропия приближенной модели;   - остаточная энтропия любой другой модели, полученной при тех же условиях;

3) несмещенность получаемой с помощью приближенной модели оценки b(Х), под которой понимается  выполнение условия:

y(X) = centr(b(X)),  b(X)ÎB,

где centr(b(X)) - чебышевский центр подмножества b(X) ÎB;

4) сложность получаемых моделей, которую будем оценивать одним из показателей

                            (24)

где nx, Nx – соответственно, число учитываемых моделью факторов и общее число возможных факторов;  nS,  NS – соответственно, число элементарных структурных элементов,  включенных  в  модель,  и общее число исходных структурных элементов, определенное из априорной информации.

Тогда оптимальная сложность определяется условием

;                  (25)

4) устойчивость,  под которой будем понимать стабильность оценок, получаемых   на   различных   выборках   WN-p ÎWN.  Выборки WN-p образованы из выборки WN путем смены р строк W случайным образом. При этом WN-p ÈWp= WN, WN-pÇWp= Æ. Тогда устойчивость получаемых моделей можно характеризовать статистикой st(d), определяемой выражением

,                                         (26)

где nр – число  подвыборок WN-p; na(d) – число подвыборок WN-p Î WN, для которых выполняется условие

.      (27)

Исходя из вышесказанного, сформулируем основные требования, предъявляемые к процедуре поиска приближенной модели,  выполняемой путем обработки данных "вход-выход" наблюдений за поведением исследуемой системы,  полученных без активного эксперимента. К таким требованиям следует отнести: 1) получаемые модели М должны быть:  состоятельными,  эффективными и несмещенными; 2) получаемые модели М должны обладать минимальной сложностью;  3) процедура поиска модели М должна обеспечивать  достаточную устойчивость к отличиям в выборках данных.

Процедуру, удовлетворяющую этим требованиям, назовем эффек