Об алгоритмах самоорганизации в задаче синтеза информационных технологий обработки сигналов
На самом же деле это не так! Дело в том, что момент начала кристаллизации, определяется множеством внешних факторов (начальной температурой расплава, условиями теплообмена и т.п.). А это значит, что для различных наблюдений в выборке, температуре ликвидуса TL будут соответствовать различные номера дискретных значений . Поэтому совершенно очевидно, что без привлечения дополнительной информации при сколь угодно большом объеме W выборки невозможно восстановить истинную зависимость (4) в классе структур (5), поскольку для различных наблюдений аргумент истинной зависимости (4) – температура TL – будет соответствовать различным аргументам моделей (5).
К тому же при больших значениях возникают непреодолимые вычислительные проблемы в использовании известных алгоритмов МГУА, но это уже другие проблемы.
Отсюда следует, что важным этапом синтеза ИТ обработки сигналов, предшествующим структурно-параметрической идентификации, является переход от пространства наблюдений к пространству потенциально полезных признаков меньшей размерности (), а затем уже этап использования этих признаков в качестве аргументов моделей косвенного контроля и диагностики, селектируемых тем или иным алгоритмом самоорганизации на основе обучающей и контрольной выборок.
Именно такой взгляд на роль алгоритмов МГУА при синтезе прикладных ИТ обработки сигналов в условиях ограниченной априорной информации представляется автору наиболее реалистичным. Структура инструментальной системы “СИДИГРАФ”, реализующая такой подход, обсуждалась в работах [5,12].
Практические результаты. Как уже отмечалось, рассмотренный в предыдущем разделе пример оценки только одного содержания углерода является упрощенной схемой задачи, которая была положена в основу синтеза ИТ “ТЕРМОГРАФ”. Оказалось, что используя всего лишь информацию о дискретных значениях температуры в процессе охлаждения пробы удается оценить с приемлемой точностью целый ряд других химических элементов расплава (содержание кремния , хрома , фосфора , марганца , и др.), а также прогнозировать механические свойства металла, в частности прочность на растяжение и твердость .
Переход от пространства наблюдений размерности к экономному пространству признаков осуществлялся на основе специальных вычислительных процедур, позволяющих автоматически выделить на термограмме и ее первой производной информативные фрагменты (см. рис. 7). Границы этих фрагментов (точки) соответствуют характерным тепловым эффектам фазовых превращений металла, а именно
А - максимальному тепловому эффекту дендритной кристаллизации;
B - максимальной скорости охлаждения после периода дендритной кристаллизации;
C - температуре начала кристаллизации эвтектики;
D - температуре метастабильного превращения расплава;
E - максимальному тепловому эффекту процесса кристаллизации эвтектики;
F - температуре солидуса расплава;
G – максимальному изменению скорости охлаждения в период кристаллизации эвтектики;
H - температуре окончания кристаллизации эвтектики;
J - моменту времени, при котором температура расплава становится равной T = 1050 град С.
Рис.7. Термограмма и ее первая производная
Для каждой из указанных девяти точек определялась тройка величин , (), представляющих собой момент времени, при которой она появилась, а также значение температуры и оценка ее первой производной в этот момент времени. Тем самым осуществлялся переход от исходного пространства наблюдений размерности к экономному пространству признаков размерности ( таблица 2).
Таблица 2. Потенциально полезные признаки термограммы
ЗНАЧЕНИЯ ПризнакОВ |
ХАРАКТЕРНЫЕ ТОЧКИ ТЕРМОГРАММЫ | ||||||||
A | B | C | D | E | F | G | H | J | |
, c |
22 | 43 | 101 | 159 | 178 | 209 | 267 | 286 | 307 |
, град C |
1200 | 1186 | 1138 | 1116 | 1119 | 1125 | 1108 | 1083 | 1050 |
, град /c |
-0.20 | -1.11 | -0.59 | 0.00 | 0.27 | 0.00 | -0.75 | -2.02 | -1.30 |
Именно эти признаки предложено использовать в качестве аргументов моделей для косвенной оценки химического состава и прогнозирования механических характеристик литейного чугуна.
Структурная и параметрическая идентификация таких моделей проводилось на основе использования двух выборок термограмм (обучающей и контрольной) с известными значениями технологических параметров. Построенные таким образом модели для условий Купянского литейного завода имели вид:
где - среднеквадратическое отклонение модельных и точных значений соответствующего параметра для наблюдений контрольной выборки.
Аналогичная схема была положена в основу синтеза других ИТ обработки сигналов, в частности, медицинских ИТ для диагностики заболеваний человека по кривым биохемилюминисценсии (БХЛ), электрокардиограмме (ЭКГ) и магнитокардиограмме (МКГ).
В отличие от принятого в кардиологической практике амплитудно-временного анализа был предложен новый подход к обработке ЭКГ [13-16], основанный на ее представлении в фазовом пространстве координат. Применение этого подхода для обработки ЭКГ в 12 стандартных отведениях позволило обнаружить новые диагностические признаки для распознавания больных ревматоидным артритом с неизмененными параметрами ЭКГ согласно традиционным представлениям [17].
Одна из задач исследований, проводимых в рамках международного контракта № 01 KX 96115/1 с германской фирмой L.U.M. GmbH (г. Берлин), была направлена на изучение взаимосвязи параметров ЭКГ (во временной области и в фазовом пространстве) с параметрами крови, отражающими активность воспалительного процесса. Для изучения этих зависимостей был привлечен комбинаторный алгоритм МГУА [3]. В качестве потенциальных регрессоров использовались 33 показателя результатов анализа венозной крови испытуемых - развернутый общий анализ, коагулограмма, печеночные пробы и ревмопробы (таблица 3).
Таблица 3. Потенциальные регрессоры
Обозначение | Наименование |
ERY | Эритроциты, x10e12 |
HGB | Гемоглобин, г/л |
COL | Цветной показатель |
RET | Ретикулоциты, % |
LEU | Лейкоциты, x10e9 |
BAS | Базофилы, % |
EOS | Эозинофилы, % |
PLN | Палочкоядерные нейтрофилы, % |
SGN | Сегментоядерные нейтрофилы,% |
LYM | Лимфоциты, % |
MON | Моноциты, % |
SOE | Скорость оседания эритроцитов, мм/г |
PTI | Протомбиновый индекс, % |
REC | Время рекальцификации,сек. |
FIB | Фибрин, мг |
FBG | Фибриноген, мг/л |
BNA | Бета-нафтоловый тест |
ETH | Етаноловый тест |
BIL | Биллирубин общий, микромол/л |
TIM | Тимоловая проба |
FRM | Фермоловая проба |
ALT | Аланиновая трансфераза |
AST | Аспаргиновая трансфераза |
MUK | Мукопротеины |
BEL | Общий белок, г/л |
ALB | Альбумины, % |
GLB | Глобулины, % |
A1G | Aльфа-1 глобулин, % |
A2G | Aльфа-2 глобулин, % |
BGL | Бета-глобулин, % |
GGL | Гамма-глобулин, % |
ASL | Антистрептомицин-O, МВ/мл |
CRP | C-реактивный протеин |
В результате селекции построены модели, связывающие показатели ЭКГ (отклики) с указанными регрессорами в виде линейных уравнений множественной регрессии оптимальной сложности. Так, например, установлено, что существуют надежные статистические связи относительных углов ориентации усредненной фазовой траектории ЭКГ во втором стандартном (отклик ) и в пятом грудном (отклик ) отведениях с параметрами крови. Эти модели имеют вид:
где - коэффициентом множественной корреляции, а - число наблюдений.
Заключение. В статье показано, что вульгаризация идеи метода самоорганизации моделей, вызванная недопонимания его основной сути, может приводить к необоснованному пессимизму в оценке практической ценности алгоритмов МГУА.
Показано, что реалистичный подход к использованию алгоритмов самоорганизации в задаче синтеза ИТ обработки сигналов, основан