Стратегии приобретения знаний
Кан и его коллеги атаковали проблему извлечения знаний с двух направлений. С одной стороны, в процессе проектирования системы MUD они совершенствовали методику опроса экспертов инженерами по знаниям. С другой стороны — проанализировали используемую методику в терминах метода решения проблем с помощью эвристической классификации, который используется в MUD. В результате были выделены восемь вариантов стратегий извлечения знаний, которые перечислены ниже. Каждый из вариантов стратегии используется программой MORE для подтверждения или опровержения гипотез в процессе диагностирования.
- Дифференциация. Поиск
симптомов, позволяющих разделить гипотезы, например симптомов, которые могут
иметь единственную причину. Такое взаимно однозначное соответствие между симптомом
и явлением, его вызвавшим, в медицинской литературе называется патогенетической
(pathognomic) ассоциацией.
- Частотное упорядочение
условий. Определение тех фоновых условий, которые влияют на степень правдоподобности
конкретных гипотез. Если подходить к задачам диагноза с точки зрения теории
принятия решения, то степень поддержки конкретной гипотезы об источнике неисправности,
которую вносит определенное свидетельство (симптом), зависит от априорной
вероятности этой неисправности.
- Отчетливость симптомов.
Идентификация тех свойств симптомов, которые могут являться индикаторами
лежащих в глубине причин появления этих симптомов. Так, в схеме на рис. 12.1
видно, что резкое повышение плотности пласта является довольно отчетливым
индикатором наличия притока воды.
- Установление связи
между симптомами и условиями. Отыскание таких условий, при которых можно
рассчитывать на то, что разные симптомы проявятся сами по себе при данной
неисправности. Такие ожидания могут служить для опровержения гипотез, если
они не получили подтверждения.
- Разделение пути.
Попытка найти такие промежуточные события между гипотезами о причинах
неисправности и вероятными симптомами, которые имеют более высокую условную
вероятность, чем сами симптомы. Если такие промежуточные события не фиксируются
в процессе диагностирования, то это может служить более серьезным доводом
против данной гипотезы, чем отсутствие симптома.
- Дифференциация путей.
Как и в случае разделения пути, анализируется "траектория" причинно-следственных
связей между симптомами и неисправностями. В процессе этого анализа стараются
выявить такие промежуточные события, которые позволят провести разделение
неисправностей, имеющих одинаковые симптомы.
- Дифференциация тестирования.
Определение степени доверия к результатам тестирования. Свидетельство,
как правило, является результатом тестирования, а последнее может быть охарактеризовано
различными значениями степени достоверности.
- Установление связи
между тестированием и условиями его проведения. Определение фоновых условий,
которые могут сказаться на степени достоверности результатов тестирования.
Такая информация влияет на оценку результатов текущих наблюдений для анализируемого
случая.
В той предметной области, на которую ориентирована программа MORE, существуют три типа порождающих правил.
- Диагностические
правила описывают соответствие между симптомами и гипотезами. Правила
такого типа имеются во многих экспертных системах — MYCIN, ONCOCIN, MUD и
т.п.
- Правила оценки степени
достоверности симптомов. С помощью этих правил выполняется неявная качественная
оценка абстрактных категорий данных в пространстве симптомов, которая опирается
на уровень достоверности результатов тестирования при различных фоновых условиях.
- Правила оценки степени
правдоподобности гипотез позволяют провести неявную качественную оценку
абстрактных категорий решений в пространстве гипотез. При этом оценивается
априорная вероятность гипотез при различных фоновых условиях.
Программа MORE работает с двумя видами моделей — моделью событий и моделью правил. Модель событий охватывает симптомы, гипотезы и условия и связи между ними, как показано на рис. 12.1. В MORE это представление используется для формирования порождающих правил, в отличие от программы OPAL, в которой правила формируются на основании модели предметной области.
Если быть точным, то программа MORE генерирует целое семейство диагностических правил по одному на каждую гипотезу. Например, прямо из модели событий MUD программа MORE может сформировать следующее диагностическое правило:
[Правило 1]
ЕСЛИ обнаружено повышение уровня хлоридов,
ТО существует солевое загрязнение.
Но это правило является слишком общим. Ему нужно дать качественную оценку, например с помощью стратегии отчетливости симптомов. Эта оценка позволит учесть эффект влияния фоновых условий на степень важности симптома. Таким образом, в семейство правил солевое загрязнение может быть добавлено следующее правило:
[Правило 2]
ЕСЛИ обнаружено повышение уровня хлоридов и пласт недостаточно насыщен, ТО существует солевое загрязнение.
Программа MORE работает с семействами правил следующим образом. Когда программа "изучает" новые условия, имеющие отношение к некоторой гипотезе, она создает новое правило с единственным условием в левой части и добавляет его в семейство правил этой гипотезы. Если же новое условие имеет отношение и к другим правилам, ранее включенным в это же семейство, то в них также добавляется это условие. (Если новое условие не совместимо с другими, указанными в одном из правил семейства, то такое правило не изменяется.) Правила, в которые добавляется новое условие, называются составными правилами (constituent rules). О них мы поговорим в следующем разделе, когда будем рассматривать коэффициенты уверенности.
Приведенный пример применения стратегии отчетливости симптомов показывает, как с помощью той или иной стратегии извлечения знаний выполняется уточнение сформулированных правил. Стратегия отчетливости симптомов используется тогда, когда в семействе не оказывается правил с отчетливо выраженным положительным коэффициентом доверия. Приведенное выше исходное правило было слишком общим, а потому ему нельзя было назначить высокий коэффициент доверия. Поскольку на начальном этапе это правило является единственным в семействе, для его уточнения и активизируется стратегия отчетливости симптомов. Чаще всего, после того как формулируются другие правила семейства, в которых специфицируются различные фоновые условия, такие общие правила удаляются из семейства. Такое удаление можно рассматривать как стремление отдавать предпочтение специализированным правилам, а не более общим, на чем основаны некоторые стратегии разрешения конфликтов.
Стратегия установление связи между симптомами и условиями используется в том случае, если в семействе отсутствуют правила с отчетливо выраженным отрицательным коэффициентом доверия. В таких случаях программа MORE предпринимает попытку выявить те фоновые условия, которые позволяют более отчетливо проявиться симптому какой-либо определенной гипотезы. Знание условий, при которых повышается вероятность проявления симптома, позволяет компоненту решения задач отбрасывать часть гипотез, для которых наиболее показательные симптомы отсутствуют.
Другие стратегии — дифференциация, дифференциация путей и разделение пути — используются для создания новых семейств правил. Стратегия дифференциации задейст-вуется в тех случаях, когда программа обнаруживает пару гипотез, не имеющих отличающихся симптомов. В этом случае на схеме модели событий, аналогичной приведенной на рис. 12.1, возникает ситуация, когда для пары гипотез Н1 и H2 не оказывается ни одного симптома, который имел бы связь с Н1 но не имел связи с H2, или наоборот. Используя стратегию дифференциации, программа MORE пытается выяснить у эксперта, какой еще симптом можно добавить в набор и с его помощью устранить неоднозначность. Этот новый симптом добавляется затем в модель событий и связывается с определенными гипотезами. Таким образом модель уточняется до тех пор, пока не появится возможность сформировать отдельные семейства правил для гипотез Н1 и H2
Стратегия дифференциации путей выбирается в том случае, если в модели событий некоторый симптом оказывается связан с двумя разными гипотезами. В этой ситуации программа MORE пытается выяснить у эксперта, существует ли какое-либо промежуточное событие, которое, с одной стороны, может послужить причиной появления такого симптома, а с другой, может возникнуть только в том случае, когда правдоподобна одна из "конкурирующих" гипотез и неправдоподобна другая. Включение такого события в модель поможет разделить существующие объяснения появления такого симптома, а соответственно и уточнить связанные с ними правила.
К стратегии разделения пути программа обращается в том случае, если в семействе правил некоторой гипотезы обнаруживается отсутствие правила, которое связало бы высокое значение отрицательного коэффициента доверия с отсутствием какого-либо симптома. В этой ситуации программа MORE пытается выяснить у эксперта, существует ли какое-либо промежуточное событие, причиной которого могла бы быть данная гипотеза. Если такое событие существует, то тот факт, что оно не наблюдается, может с большей очевидностью свидетельствовать против данной гипотезы, чем тот факт, что симптом не наблюдается. В результате можно создать новое семейство правил для гипотезы.
Остальные стратегии — частотное упорядочение условий, дифференциация тестирования и установление связи между тестированием и условиями его проведения — активизируются в случаях, когда в семействе обнаруживается отсутствие правил с достаточно высоким или достаточно низким значением положительного или отрицательного коэффициента доверия. В таком случае правила нельзя считать достаточно информативными для решения проблемы классификации. Получение от эксперта информации о новых тестовых процедурах и условиях их выполнения, а также оценок априорной вероятности гипотез при различных фоновых условиях позволит либо увеличить, либо уменьшить коэффициенты в правилах, связывающих симптомы и гипотезы. Информация первого типа используется для корректировки правил оценки степени достоверности симптомов, а информация второго типа — для корректировки правил оценки степени правдоподобности гипотез.