Экспертная оценка качества. Экспертные оценки

Экспертные оценки часто возникают на практике, например, при дегустации продуктов питания. Вообще они типичны для социологических опросов, например, менеджер по контролю качества проводит опрос покупателей в супермаркете. При использовании экспертного метода для оценки качества часто используется шкала порядка. Решается вопрос сравнеия по принципу "лучше хуже", "больше меньше". Более подробная информация о том, во сколько раз лучше или хуже часто не требуется.

Попарное сравнение (объекты сравниваются друг с другом попарно). При построении шкалы порядка или так называемого ранжированного ряда эксперты используют метод попарного сопоставления . В таб. 1 приведен пример ранжирования шести объектов путем попарного сравнения. Это результат работы одного эксперта, оценивавшего объекты определенным образом. Предпочтение одного объекта перед другим обозначено 1, обратная ситуация - 0.

Ранжированный ряд (шкала порядка) для объектов, сравнительная оценка которых приведена в таб. 1, будет иметь вид:

Если использовать несколько экспертов, то можно получить более точный результат.

Можно использовать более совершенные критерии, например, преимущество определить оценкой 1, худшее качество определить оценкой -1, а равноценное качество определить оценкой 0. Механизм составления ранжированного ряда остается прежним.

Психологами доказано, что попарное сопоставление лежит в основе любого выбора (т.е. Вы выбираете продукты, сравнивая их попарно), тем не менее, шкалу порядка часто составляют заранее (не ранжированный ряд) и фиксируют в ней опорные (реперные) точки, которые называют баллами.

Так появилась двенадцатибальная шкала интенсивности землетрясений MSK - 64, минералогическая шкала Мооса, пятибалльная шкала оценки знаний, баллы в фигурном катании и т.д. В таблице 2 в качестве примера приведена шкала твердости минералов Мооса.

Номер объекта							Итог

Таблица 1. Ранжирование шести объектов путем попарного сравнения

Таблица 2. Шкала Мооса

Каждый последующий минерал оставляет царапину на предыдущем, т.е. является более твердым. Результаты измерений, полученные попарным сопоставлением, можно уточнить методом последовательного приближения.

Влияние состава экспертов на результаты экспертизы

При формировании экспертной группы целесообразно провести тестирование, взаимооценку экспертов и проверку согласованности мнений.

Тестирование состоит в решении экспертами задач, с известными организаторам тестирования, но неизвестными экспертам результатами, и проверке по критерию Фишера гипотезы о принадлежности оценок разных экспертов к одной и той же генеральной совокупности оценок.

Самооценка состоит в том, что каждый эксперт в ограниченное время отвечает на вопросы специально составленной анкеты. Такое испытание проводят на компьютере и затем получают балльную оценку. Эксперты могут оценивать и друг друга, но для этого необходима доверительная обстановка и опыт совместной работы. Согласованность мнения экспертов можно оценивать по величине коэффициента конкордации:

где S - сумма квадратов отклонений всех оценок рангов каждого объекта экспертизы от среднего значения;
n - число экспертов;
m - число объектов экспертизы.

Коэффициент конкордации изменяется в диапазоне 0<W <1, причем 0 - полная несогласованность, 1 - полное единодушие.

Пример

Необходимо определить степень согласованности мнения пяти экспертов, результаты ранжирования которыми семи объектов приведены в таблице 3. Для определения степени согласованности используется специальная мера - коэффициент конкордации Кендалла (от лат. concordare - привести в соответствие, упорядочить).

Номер объекта экспертизы	Сумма рангов	Отклонение от среднего	Квадрат отклонения
Номер объекта экспертизы	Сумма рангов	Отклонение от среднего	Квадрат отклонения

Таблица 3. Данные для оценки согласованности мнений пяти экспертов

Оцениваем среднеарифметическое число рангов:

Q ср = (21 + 15 + 9 + 28 + 7 + 25 + 35)/7 = 20.

Затем оцениваем сумму квадратов отклонений от среднего: S = 630. Определяем величину коэффициента конкордации:

W = 12 * 630 / 25 * (343 - 7) = 0,9.

Много это или мало? Если провести соответствующие вычисления в STATISTICA , то можно получить следующую таблицу результатов:

Рис. 1. Результаты проведения анализа в STATISTICA

Из этой таблицы следует, что различные мнения экспертов в данном примере незначимы: р<0.00014.

Влияние на результаты экспертизы количественного состава экспертов. С ростом числа экспертов в группе точность измерения повышается, что характерно для многократных измерений.

Количество экспертов n , обеспечивающее заданную точность измерений, можно установить, зная закон распределения мнений экспертов и максимально допустимую стандартную ошибку оценки Sx

ЦЕЛИ ЗАНЯТИЯ: 1) изучение методов количественной оценки качества экспертов при формировании экспертной группы;

2) использование методов статистической оценки качества экспертов при создании экспертной группы, предназначенной для оценки качества конкретного изделия.

1.ОБЩИЕ ПОЛОЖЕНИЯ

Одним из наиболее важных вопросов, которые приходится решать в процессе экспертной оценки качества продукции, является подбор экспертов. Так же как в метрологии точность результата измерения зависит от точности прибора, которым производится это измерение, так и объективность экспертной оценки, ее точность зависят в основном от квалификации эксперта, его способности к аналитическому мышлению, синтетическому обобщению, от его кругозора, эрудиции, психофизиологических способностей и т.д.

В настоящее время на практике для количественной оценки качества экспертов используются следующие методы:

Эвристические, при которых значение оценок определяются человеком; методы эвристической оценки основаны на том, что представление, сложившееся о данном эксперте у окружающих (или у него самого), достаточно правильно отражает его истинное качество; эвристические оценки включают: самооценку, взаимооценку, оценку эксперта членами рабочей группы.
Статические, при которых значение оценок получаются в результате обработки суждения экспертов об оцениваемой продукции.
Тестовые, при которых значения оценок получаются в результате специальных испытаний, основанных на решении специально подобранных тестовых задач.
Документальные, при которых значения оценок получаются на основе анализа документальных данных об экспертах.
Комбинированные, при которых значения оценок получаются с помощью любой совокупности перечисленных выше методов.

Наиболее обоснованными в настоящее время являются статистические методы оценки качества экспертов, поэтому рассмотрим их более подробно.

К методам статической оценки относят оценку по отклонению от среднего мнения экспертной группы Кос и оценку воспроизводимости результата Квр, которые могут быть получены после обработки результатов специальных опросов, предшествующих операции формировании экспертной группы.

В основе первого метода лежит посылка, что истинным значением определяемой экспертами величины (свойства), является значение средней оценки экспертной группы. Чем меньше отклонение значения индивидуальной оценки, назначенной экспертом, от групповой средней оценки, тем выше качество этого эксперта, которое может быть учтено путем присвоения в результате каждому эксперту соответствующего «веса» или весового коэффициента.

В том случае, когда эксперт определяет численные значения оцениваемых свойств (в баллах, долях единицы или ппроцентах), предлагается использовать в качестве оценки эксперта расстояние между «средним» рядом значений оценок и значениями оценок назначенными данным экспертом. Например:

при этом n

j=1/2А Кi - Кij

где Кi- среднее значение i- той оцениваемой величины (свойства);

Кij- значение i- той величины (свойства), назначенное j -тым экспертом; n

В основе второго метода лежит посылка, что высоким может считаться качество такого эксперта, для которого свойственна воспроизводимость назначаемых значений оценок, т.е. значения оценок одного и того же объекта в нескольких турах должны быть достаточно близкими. В этом случае можно говорить о стабильности его мнения. Способы оценки качества эксперта по воспроизводимости результата аналогичны способам оценки по отклонению от среднего мнения.

В том случае, когда эксперты ранжируют оцениваемые величины (свойства), для количественного выражения их качества или согласованности, чаще всего на практике используется коэффициент конкордации, который вычисляется следующим образом:

m2 (n3 - n) - m Tj

где Si - сумма рангов, присвоенных m экспертами i-тому фактору;

S - среднее значение сумм рангов;

Величины Si и S определяются отношениями:

Si= Кij ; S= Si / n

где j - номер эксперта;

i - номер оцениваемого фактора.

Величина Tj определяется из выражения:

Tj= (t3jl – tjl),

где tjl - число одинаковых рангов 1-го вида в оценках j -того эксперта;

Lj -количество групп факторов с совпавшими рангами в оценках j -того эксперта.

Коэффициент конкордации изменяется в пределах от нуля до единицы и его значение, равное единице, соответствует полной согласованности мнений экспертов. Обычно согласованность мнений экспертов считается достаточной при W >0,5.

Согласованность мнений экспертов может быть случайной или неслучайной. В качестве количественной оценки степени этой случайности используется уровень значимости коэффициента конкордации. Этот уровень находится из таблицы на основе данных о числе степеней свободы n=1 и величины 2 (критерий Пирсона).

Величина 2 определяется по формуле:

mn (n +1) - 1 Tj

Определенный таким образом уровень значимости коэффициента конкордации дает значение вероятности случайного совпадения мнений экспертов, т.е. достоверность оценок. Если согласованность мнений экспертов высокая и неслучайная, то данная экспертная группа может быть принята за основу для экспертной оценки качества продукции. Если же согласованность мнений недостаточная (W<0,5), то анализируя оценки отдельных экспертов, выделяют эксперта (экспертов), имеющего наиболее отличающиеся оценки от общей совокупности оценок других экспертов и подсчитывают значение коэффициента конкордации опять. Эту операцию повторяют до тех пор, пока не будет достигнута приемлемая согласованность экспертных оценок. При этом рекомендуется, чтобы количество оставшихся экспертов было не менее 2/3 от первоначального состава экспертной группы. В противном случае требуется заново сформировать экспертную группу. Для решения большинства задач по экспертной оценке качества продукции, оптимальными могут считаться экспертные группы, включающие от 7 до 20 экспертов.

II Самостоятельная работа.

Задание 1. Для заданного аналога оцениваемого изделия, произвести экспертную оценку эргомических свойств, в соответствии с разработанной иерархической структурой свойств этого изделия (см. практическое занятие №2). Определить численные значения соответствующих эргономических показателей, руководствуясь следующей оценочной шкалой:

Произвести необходимую статистическую обработку полученных данных с целью оценки качества каждого эксперта, участвующего в эксперементе. Результаты выполнения задания рекомендуется представить в виде следующей таблицы:

						Число совпавших оценок	Максимальное отклонение

Задание 2. Используя экспресс-метод экспертной оценки качества, произвести ранжирование ряда предложенных изделий (3…5 шт.), аналогичных оцениваемому изделию, в зависимости от уровня их качества произвести необходимую статистическую обработку полученных данных с целью оценки качества каждого эксперта, участвующего в эксперементе. Результаты выполнения задания рекомендуется представить в виде следующей таблицы:

	Макси-мальное откло-нение	Сумма отклоне-ний	Число совпавших оценок






Обобщен-ная оценка (средний балл)

Высокое качество работы экспертов, участвующих в опросе, оказывает решающие влияние на получение точных и надежных результатов.

Качество экспертов определяется следующими группами свойств: компетентностью, заинтересованностью в результатах экспертизы, деловитостью и объективностью (беспристрастностью).

Компетентность эксперта должна распространяться на объект экспертизы (профессиональная компетентность) и методологию оценки (квалиметрическая компетентность).

Профессиональная компетентность включает знание технологических этапов производства продукции, значения показателей качества различных ее видов, перспектив развития продукции. требований потребителей, условий и характера потребления.

Квалиметрическая компетентность обеспечивает четкое понимание экспертом подхода к оценке качества продукции как к мере удовлетворения ею потребностей потребителей; знание методов оценки качества, особенно экспертных методов; умение пользоваться различными квалиметрическими шкалами, отличающихся большим числом градаций.

Заинтересованность эксперта в результатах экспертизы зависит от многих факторов: степени загруженности основной работой, с которой, как правило, совмещается экспертиза; возможности использования полученных результатов; целей экспертизы; характера выводов, которые могут быть сделаны по результатам экспертизы; индивидуальных особенностей эксперта.

Деловитость эксперта включает собранность, подвижность и эластичность внимания, позволяющие быстро переключаться с оценки одного показателя качества на оценку другого; контактность, т.е. умение работать с людьми при решении задач в конфликтной ситуации; мотивированность выносимых оценок.

Объективность (беспристрасность) -- способность учитывать только ту информацию, которая определяет удовлетворение потребности данной продукции. Необъективность эксперта заключается в завышении или занижении оценок объекта экспертизы по причинам, не имеющим отношения к качеству, например, из-за неспособности противостоять мнению большинства других экспертов вследствие неуверенности в своей правоте (проявление конформизма).

Методы оценки качества экспертов подразделяются на пять групп:

· эвристические (субъективные);

· статистические;

· тестовые;

· документальные;

· комбинированные.

Каждая из указанных групп делится на виды (частные оценки) и методы их получения.

Эвристические (субъективные) оценки – оценки, назначаемые человеком и основанные на предположении правильности отражения качества эксперта через оценку окружающих или самооценку.

Различают следующие виды эвристических оценок:

· самооценка;

· взаимооценка;

· оценка аргументированности и знакомства с объектом экспертизы;

· оценка эксперта рабочей группой.

Самооценка – вид и метод эвристической оценки компетентности самим экспертом. Установлено, что достоверность усредненной экспертной оценки тем выше, чем больше среднее значение самооценки членов группы. В то же время следует иметь в виду, что самооценка отличается значительной субъективностью, а это влечет за собой определенные недостатки ее. Самооценка зависит от психологических особенностей экспертов (наличия высокой или заниженной самооценки, иногда и необоснованно), степени удовлетворенности собой, понимания оценочной шкалы. Этим объясняется несовпадение результатов самооценки и взаимооценки.

Для снижения субъективности самооценку проводят дифференцированно, что повышает точность результатов. Для этого показатель самооценки определяется как функция двух коэффициентов: знакомства и аргументированности. Для экспертной оценки товаров самооценку эксперта рекомендуется определять с учетом его информированности и знакомства с оцениваемой продукцией путем заполнения «Анкеты самооценки». Эксперт отмечает регулярность чтения перечисленных в анкете источников информации и степень знакомства с оцениваемой продукцией.

Самооценка (K ca м j ) рассчитывается по формуле

K ca м j = Σ M i · K ij ,

где M i – весомость показателей информированности и знакомства; K ij – оценка, зависящая от степени информированности и знакомства.

Поскольку Σ M i = 1,00, а 0 ≤ K ij ≤ 10, то 0 ≤ K ca м j ≤ 10.

С учетом специфики оцениваемой продукции весомость отдельных показателей (M i ) может корректироваться экспертной группой.

Взаимооценка - вид и метод эвристической оценки, определяемой как средняя из оценок, назначаемых другими экспертами. Данная оценка предназначена для уменьшения субъективности оценки компетентности каждого эксперта. Установлено, что существует тесная связь между компетентностью эксперта и его усредненной оценкой, полученной от коллег. Сущность этого вида оценки заключается в том, что каждый эксперт дает оценку всем остальным экспертам, а затем рассчитывается усредненный результат.

В зависимости от количества экспертов в группе применяются две разные процедуры:

· при численности экспертов в группе менее 15 человек каждый эксперт оценивает всех остальных;

· при численности экспертов 15 человек и выше заполняется специальная анкета, в которой эксперты по квалификации поделены на три группы – выше средней, средней и ниже средней квалификации, а также по рангам внутри подгрупп (по 6– 8 человек в каждой). Затем ранжируют экспертов каждой подгруппы. Ранг 1 – самый квалифицированный эксперт, 2 – следующий по квалификации и т. д. Каждому оцениваемому эксперту присваивается числовая оценка от 10 баллов (самый квалифицированный) до 0 (совершенно неквалифицированный) с точностью до 0,5 балла.

Недостатки взаимооценки заключаются в следующем:

· эксперты могут недостаточно знать друг друга;

· на результаты оценки могут влиять взаимные симпатии или антипатии;

· эксперты, как правило, стремятся избегать сверхвысоких и сверхнизких оценок;

· неоднозначность восприятия понятия «качество эксперта».

· применять взаимооценку только в тех группах, в которых большинство экспертов хорошо знают друг друга. Если некоторые из оцениваемых экспертов незнакомы, то рекомендуется ставить прочерк в соответствующей графе;

· проводить анонимное анкетирование;

· разъяснять, что результаты анкеты будут использованы только для корректировки оценок товара;

· знакомить экспертов со структурной схемой свойств и их частных оценок.

Оценка аргументированности и знакомства с объектом экспертизы – вид и метод эвристической оценки степени специализации эксперта и факторов, влияющих на его компетентность. Эвристическая оценка компетентности, основанная на учете степени специализации и знакомства, обладает высокой эффективностью и достоверностью при условии тщательной проработки методов количественной оценки каждого из этих факторов в виде оценочных анкет. В данном случае оцениваются только те факторы, которые могут характеризоваться лишь субъективно в форме самооценки; эксперт количественно оценивает степень своей специализации по данному виду продукции и форму знакомства с ней. Затем с помощью специальной анкеты (похожей на анкету самооценки) определяет коэффициент аргументированности своих знаний и дает оценку степени своего знакомства с исследуемой проблемой. Коэффициент компетентности вычисляется как среднее арифметическое из коэффициентов аргументированности и знакомства.

Оценка эксперта рабочей группой – вид и метод эвристической оценки, предназначенной для количественной характеристики заинтересованности эксперта в экспертной оценке и его внимательности в ходе опроса. Оценка дается специалистами-аналитиками, проводящими опрос экспертов. При этом они оценивают отношение экспертов к проводимой экспертизе и их активность при обсуждении оценок. Оценки рабочей группы целесообразно выносить по 10-балльной шкале.

Статистические оценки – оценки, полученные в результате обработки суждений экспертов об объекте оценки.

Эти оценки применяются с целью уменьшения по мере возможности погрешностей, возникающих при экспертных оценках. Необходимость их обусловлена тем, что в отличие от измерений с помощью технических устройств, основанных на сравнении неизвестных величин с известными, при экспертных методах часто отсутствует известная величина (или образец, или эталон товара), значение которой принимается за действительное, т. е. максимально приближенное к истинному.

На точность результата могут оказать влияние организация и методика проведения оценки; качество построения структурной схемы показателей качества, число показателей качества, способы определения оценок, характер взаимоотношений между экспертами и т.д.

Таким образом, на точность экспертной оценки влияет множество объективных (зависящих от методики оценки) и субъективных (зависящих от эксперта) факторов, вследствие чего возникают погрешности оценки, имеющие систематическую и случайную составляющие.

Систематическая погрешность – постоянно повторяемая часть погрешности. Основной причиной возникновения ее является недостаточная или неправильная информированность экспертов. Снизить ее можно путем ознакомления эксперта с необходимой информацией перед началом экспертизы или путем проведения инструктажа, а также обсуждения, в ходе которого эксперт получает дополнительную информацию от специалистов-аналитиков или других экспертов. Кроме того, поскольку систематическая погрешность эксперта является случайной для группы экспертов, то усреднение оценок группы позволяет повысить точность оценки качества. Систематическую погрешность можно оценивать степенью отклонения от среднего мнения экспертной группы.

Случайная погрешность зависит от психолого-физиологических особенностей эксперта (собранности, уверенности в правоте, внимательности, других личных качеств) и снижается при многократных повторениях оценок. Установить ее величину можно по воспроизводимости результатов.

Различают следующие виды статистических оценок:

· оценка по отклонению от среднего мнения экспертной группы;

· оценка объективности эксперта.

Оценка по отклонению от среднего мнения экспертной группы – оценка, основанная на предпосылке, что действительным значением групповой экспертной оценки является средняя оценка экспертной группы. Поэтому чем меньше отклонение индивидуальной экспертной оценки от групповой, тем более высоким признается качество эксперта давшего эту оценку.

Индивидуальные экспертные оценки могут быть двух типов:

· ранжирование экспертом оцениваемых величин (в порядке убывания или возрастания);

· определение экспертом числовых значений оцениваемых величин (например, при определении коэффициентов весомости показателей качества каждому коэффициенту эксперты присваивают определенные числовые значения).

Оценка по отклонению от среднего мнения экспертной группы может быть выражена через совокупность абсолютных отклонений (Д і) , рассчитываемых как разница между средней групповой оценкой (Х с.г) и индивидуальной оценкой (Х і ):

Д і = Х c .г – Х і . .

Чем больше Д і , тем выше отклонение индивидуального мнения эксперта от среднего мнения экспертной группы.

Оценка объективности (беспристрастности) эксперта – оценка соблюдения экспертом принципа объективности, его способности к беспристрастной оценке конкретных образцов товаров. Эта очень важная характеристика качества эксперта существенно влияет на точность результатов групповой экспертной оценки. Статистические методы непосредственной оценки объективности экспертов не разработаны, поэтому на практике довольствуются косвенной оценкой по отклонению от среднего мнения экспертов.

Тестовые оценки – оценки с помощью тестирования психолого-физиологических особенностей экспертов. Данные оценки предназначены для оценивания объективности, квалиметрической и профессиональной компетентности эксперта. Достоинством этих оценок является возможность оценить личные качества эксперта, для чего другие методы и виды оценок неприемлемы. Недостаток их заключается в том, что полученные при тестировании результаты невозможно сравнить с данными, полученными каким-либо объективным методом.

При проведении тестовых оценок к тестам предъявляются следующие требования:

· понимание испытуемым экспертом постановки тестовой задачи и условий, которым должно отвечать ее решение;

· вероятность случайного угадывания решения задачи должна быть близка к нулю;

· тестовая задача должна иметь точное решение;

· обоснование близости тестовой задачи и тех реальных задач, которые приходится решать эксперту при оценке качества продукции.

Разновидностями тестовых оценок являются:

· оценка воспроизводимости результатов;

· квалиметрической компетентности эксперта;

· объективности корректирования своих оценок.

Оценка воспроизводимости результата – оценка степени близости индивидуальных оценок эксперта, проведенных через определенные промежутки времени. Обычно применяется в случаях, когда качество экспертов оценивается в несколько туров, при этом сравниваются оценки одного и того же автора в разных турах. Наиболее часто оценка воспроизводимости результатов применяется при органолептическом анализе пищевых продуктов.

Следует учесть, что промежуток времени между турами должен быть невелик, чтобы исключить влияние возможной новой информации, изменяющей его суждения, но в то же время достаточен, чтобы эксперт забыл данные оценки в предыдущем туре.

Если проводится ранжировка показателей качества, то оценка воспроизводимости результатов рассчитывается по формуле

где – j -го эксперта; R j – коэффициентов ранговой корреляции для j -го эксперта, определяется по формуле

где d ij – разность между рангами, присвоенными i- му показателю качества j -м экспертом в первом и втором турах опроса; n – количество объектов ранжирования.

Если же эксперты вычисляют численные значения коэффициентов весомости, то оценка воспроизводимости результатов рассчитывается по формуле

где – коэффициент воспроизводимости результатов j -го эксперта; ρ j – расстояние от среднего мнения группы для j -го эксперта, рассчитывается по формуле

где M ij * и M ij ** – значения i -го коэффициента весомости назначенные j -м экспертом соответственно в первом и втором турах.

Коэффициент воспроизводимости результатов эксперта может изменяться в интервале от 0 до 10. К экспертизе качества продукции рекомендуется допускать экспертов с воспроизводимостью результатов 6 и выше.

Оценка квалиметрической компетентности эксперта – оценка теоретических знаний методов оценки качества и умения их применять. Оценка теоретической подготовки эксперта может проводиться путем устного или письменного контроля знаний с использованием тестов в определенной области знаний. Несколько сложнее обстоит дело с проверкой умения, которое подразделяют на три типа:

· умение использовать разные типы оценочных шкал;

· умение определять субъективные вероятности;

· умение различать достаточное число градаций оцениваемого свойства.

Умение использовать разные типы оценочных шкал. Шкала – это упорядоченный ряд отметок, соответствующий соотношению последовательных значений измеряемых величин. В квалиметрии шкала является средством адекватного сопоставления и определения численных значений отдельных свойств и качеств различных объектов. Практически используют следующие виды квалиметрических шкал: шкалу наименований, шкалу порядка, шкалу интервалов, шкалу отношений и шкалу абсолютных значений.

Шкала наименований используется в случаях, когда несколько неизвестных размеров необходимо сопоставить с одним и определить, какие из них равны размеру, выбранному за базу для сравнения, а какие нет. По шкале наименований классифицируют размеры по признаку эквивалентности, тождества, равенства. Такое измерение является наиболее простым, но наименее информативным. При этом не определяется, какой из неодинаковых размеров больше или меньше размера, принятого за базовый, т.е. порядок возрастания или уменьшения размеров не устанавливается. Измерение заключается только в определении одинаковости (равенства) или отличия (неравенства) того или иного размера от заранее определенного значения. Следовательно, определяющие отношения между измеряемыми размерами таковы: равны или не равны, т.е. в символах = или ≠.

Математическое выражение сущности измерений по шкале наименований можно записать так:

Р i = Р j или Р i ≠ Р j ,

где Р i – размер, с которым сравнивают (базовый размер); Р j – j -й размер из сравниваемых размеров (j = 1,2,3, … , n ); n – число сравниваемых размеров.

При сопоставлении и измерении размеров по шкале наименований осуществляется, например, контроль и оценка качества чего-либо по альтернативному принципу: годен – не годен; подходит – не подходит; соответствует – не соответствует и т.п.

Шкала порядка – это последовательный ряд значений, дающий систематизированное представление о простейших соотношениях величин сопоставляемых размеров свойств, признаков или качеств в целом оцениваемых объектов.

При попарном сопоставлении всех измеряемых размеров устанавливают, какой размер больше или меньше другого, какой лучше или хуже другого. Если имеются одинаковые размеры, то это соотношение также определяется. Далее установленные соотношения размеров ранжируются в порядке возрастания и/или убывания (уменьшения) их величин. Сами величины при этом остаются неопределенными. Полученный в результате ранжирования ряд значений является шкалой порядка возрастающей или убывающей последовательности.

По шкалам порядка значения размеров могут быть классифицированы (оценены) не только по критерию «одинаковы или нет», но и по соотношению, что «больше или меньше» другого или «что лучше, а что хуже» другого.

Математическим выражением соотношений попарно сопоставляемых размеров является:

Р i = Р j или Р i ≠ Р j или Р i > Р j или Р i < Р j.

В результате сопоставления размеров Р i и Р j определяют, какой размер больше или меньше другого, а также какие размеры имеют одинаковые значения, т.е. по шкале порядка определяют следующие соотношения: равно (=), не равно (≠), больше (>), меньше (<).

Недостатком измерений по шкалам порядка можно считать то, что получаемые результаты в виде ранжированного ряда наименее информативны. В частности, при таком измерении нет возможности определить, на сколько один размер больше или меньше другого, лучше или хуже другого. Однако главным преимуществом измерений с использованием шкал порядка является то, что и их помощью инструментально неизмеряемые величины все же можно оценить (измерить) количественно. К измеряемым по шкалам порядка относятся такие свойства объектов, как вкус, запах, привлекательность, эстетичность, комфортабельность и др. По шкале порядка часто производят и общие экспертные оценки качества нескольких сопоставляемых объектов.

Шкала интервалов используется в случаях, когда нет возможности измерить сами размеры наблюдаемых величин, но возможно (или имеется необходимость) измерить только отличия (разницы) между познаваемыми сопоставлением размерами.

На измерительной шкале интервалов фиксируются отличия сопоставляемых размеров. Эта форма отображения величин измеряемого является более совершенной, так как на шкале интервалов имеются условные, но вполне определенные единицы измерений, что позволяет количественно (численно) охарактеризовать соотношение исследуемых размеров.

Математическая запись сравнения между собой двух однородных размеров по их разнице имеет вид:

ΔР i,j = Р i – Р j .

По шкале интервалов определяют такие соотношения размеров, как равно (=), не равно (≠), больше (>), меньше (<), сумма (+), разница (– ).

Классическим примером измерений по шкале интервалов является измерение температур по шкале Цельсия. По шкале интервалов невозможно определить, во сколько раз один размер больше или меньше другого.

Шкала отношений – это измерительная шкала, на которой отсчитывается (определяется) численное значение величины q i как математического отношения измеряемого размера Р i к другому известному размеру, принимаемому за единицу измерений [Р].

Любое измерение по шкале отношений предполагает сравнение неизвестного размера с известным и выражение первого через второй в кратном или дольном отношении.

Математическая запись измерения по шкале отношений имеет вид:

где i = 1, 2, 3, … , n – это номер измеряемого размера.

Шкала отношений – это шкала интервалов, в которой определен нулевой элемент – начало отсчета, а также размер (масштаб) единицы измерений [Р].

По шкале отношений определяются такие значения измеряемых размеров, как: равно (=), не равно (≠), больше (>), меньше (<), сумма (+), разница (– ), умножение (×), деление (:). Следовательно, с относительными величинами измеряемых размеров можно проводить многие логические и все арифметические действия.

Шкала отношений наиболее приемлема для измерений большинства показателей качества, особенно для таких численных характеристик, как геометрические размеры объектов, их плотность, сила, напряжение и прочих.

Шкала абсолютных величин используется в случаях, когда величина измеряется напрямую. Например, непосредственно подсчитывается число дефектов в изделии. Количество единиц производственной продукции и т.п. При таких измерениях на измерительной шкале отмечаются абсолютные количественные значения измеряемого. Такая шкала абсолютных значений обладает теми же свойствами, что и шкала отношений, с той лишь разницей, что величины, обозначенные на этой шкале, имеют абсолютные, а не относительные значения.

Результаты измерений по шкале абсолютных величин имеют наибольшую достоверность, информативность и чувствительность к неточным измерениям.

Шкалы интервалов, отношений и абсолютных величин называются метрическими, так как при их построении используются меры, т.е. размеры, принятые в качестве единиц измерений.

Характеристики, параметры или характеристики свойств объектов, измеряемые по шкале наименований или по шкале порядка, являются не количественными, а качественными , т.е. неопределенными по их истинной величине и по величине различий между ними. Размер, определенный по любой из метрических шкал, является количественной величиной, и сами эти шкалы являются количественными .

Квалиметрические шкалы, их определяющие отношения, измеряемые ими типы характеристик качества, а также некоторые примеры измеряемого приведены в табл. 4.1.

Каждая из квалиметрических шкал имеет свое значение и свою область применения, и поэтому они чаще всего не взаимозаменяемы при решении той или иной экспертной задачи. Умение определять субъективные вероятности – способность эксперта оценивать вероятность наступления определенных событий. Эксперты, которые не обладают такой способностью, не должны привлекаться к экспертизам, связанным с прогнозированием.

Умение определять субъективные вероятности при вынесении некоторых видов оценок. Например, при определении коэффициентов весомости некоторых событий эксперту иногда приходится использовать понятие субъективности вероятности их наступления. Зачастую прибегают к специальным тестам, с помощью которых можно оценить умение кандидата в эксперты точно определять субъективные вероятности.

Умение различать достаточное число градаций оцениваемого свойства – способность эксперта улавливать различия в интенсивности проявления каждого свойства. Эта способность в значительной мере обусловлена чувствительностью эксперта к самым незначительным изменениям свойств и показателей объектов экспертизы. Например, при органолептическом анализе испытателей проверяют на умение выявлять разницу во вкусах, запахах, оттенка цвета и др. От способности эксперта различать градации оцениваемого свойства зависит также точность индивидуальных и групповой экспертных оценок, поэтому тестовые испытания по выявлению указанной способности должны помочь отобрать в экспертную группу специалистов высокого качества.

Таблица 4.1 . Виды квалиметрических шкал

В образовательном сервисе

, аспирант , *****@***ru,

ФГОУВПО «Российский государственный университет туризма и сервиса», г. Москва

Success of information system depends significantly on the quality of its functioning, however it is not always possible to define it by the settlement-analytical method. In the article quality questions with reference to information systems of high school are considered. Methodological conditions of an estimation of the quality by means of an expert method are considered. The technology and model of calculation of indicators of an expert estimation of the quality are developed.

Успешность информационной системы в значительной мере зависит от качества ее функционирования, однако не всегда возможно определить его расчетно-аналитическим методом. В статье рассматриваются вопросы качества применительно к информационным системам вуза. Рассмотрены методологические условия оценки качества с помощью экспертного метода. Разработаны технология и модель расчета показателей экспертной оценки качества.

Key words : Quality of information systems, expert estimation, educational service

Ключевые слова : качество информационных систем, экспертная оценка, образовательный сервис

Эффективность информационных систем (ИС) в значительной мере определяется оценкой качества на всех стадиях их жизненного цикла . Особую значимость составляет задача оценки качества функционирования информационных систем в образовательном сервисе, например, в вузовской сфере. Существует несколько направлений в оценке качества, в частности, эвристический, расчетно-аналитический и экспертный. В практике экспертной оценки качества, в частности при экспертной оценке потребительских свойств продукции в основном применяются комплексная и оперативная экспертизы . Однако пока нет методик экспертной оценки качества функционирования информационных систем вуза.

Комплексная экспертиза проводится для всестороннего изучения и оценки качества информационных систем серийно. В связи с этим при экспертизе реализуют системный, комплексный подход к анализу и оценке функционирования ИС. При комплексной экспертизе необходимо получить не только более полную характеристику оцениваемой конкретной ИС, но также и определенный научный, методический и нормативный материал , используемый при проведении оценки качества ИС достаточно широкого класса и назначения.

Оперативная экспертиза основывается на данных, полученных при проведении предшествующих комплексных экспертиз. Этот прием позволяет существенно сократить объем и сроки экспертных работ при достаточной глубине и обоснованности экспертных заключений.

При экспертном методе оценку уровня качества или показателя того или иного свойства ИС можно определить в безразмерных единицах. В случае если результат оценки (экспертного измерения) качества эксперты представляют в виде ранжированного ряда, то численное определение оценок экспертов состоит в следующем.

1. Все объекты оценки (информационная система, ее компоненты, свойства) нумеруются произвольно.

2. Эксперты ранжируют объекты по шкале порядка.

3. Ранжированные ряды объектов, составленные экспертами, сопоставляются.

Пример . Пусть пять экспертов о семи объектах экспертизы Q составили такие ранжированные ряды по возрастающей шкале порядка:

эксперт № 1 –

эксперт № 2 –

эксперт № з –

эксперт № 4 –

эксперт № 5 –

Место объекта в ранжированном ряду называется его рангом. Численное значение ранга в ряду возрастающей шкалы порядка увеличивается от 1 до t. В нашем примере t=1.

4. Определяются суммы рангов каждого из объектов экспертной оценки. В рассматриваемом примере они таковы:

https://pandia.ru/text/78/318/images/image007_78.gif" width="85" height="85 src="> (1) ,

где n – количество экспертов; m - число оцениваемых показателей;

https://pandia.ru/text/78/318/images/image009_66.gif" width="334" height="125 src=">.

Анализируя полученные экспертным методом оценки качества, можно не только указать, какой объект лучше или хуже других, но и на сколько.

Если ранжирование объектов по их качеству осуществлять в табличной форме, то сопоставления и расчеты численных значений экспертных оценок производятся по следующей методике.

Во-первых, составляется таблица, по которой каждый эксперт осуществляет сопоставление и оценку рассматриваемых объектов. При этом каждый i-й объект сопоставляется с другими j-ми объектами сравнения. Если при попарном сопоставлении i-и объект признается лучше j-го, то это условие обозначается цифрой 1, противоположная оценка обозначается -1, а равнокачественные объекты отмечаются в таблице цифрой 0 (ноль).

В таком случае сопоставительная таблица оценок одного эксперта, например, шести ИС, как объектов исследования, будет иметь следующий вид.

Оценки эксперта по объектам

Объект j

Из этой таблицы видно, что предпочтительные оценки данного эксперта получили ИС в такой последовательности: № 5, № 3 и № 1. Предпочтительным в данном случае является ИС № 5.

Данные о предпочтениях всех экспертов группы суммируются и рассчитываются обобщенные предпочтения одних ИС над другими, то есть рассчитывается экспертный показатель качества ИС в виде ее частоты предпочтений.

Частота предпочтения находится как частное от деления всех предпочтений данного объекта на возможное число предпочтений, т. е.

https://pandia.ru/text/78/318/images/image012_50.gif" width="75" height="51 src=">,

где Оценочная деятельность" href="/text/category/otcenochnaya_deyatelmznostmz/" rel="bookmark">оценку объектов , то есть сначала это сделать в одной последовательности, а потом в противоположной. При этом, естественно, количество учитываемых оценок экспертов удваивается и С=m(m-1). В остальном методика расчетов показателей качества не изменяется.

При экспертизе качества ИС могут быть использованы балльные оценки, которые даются непосредственно экспертами или получаются в результате формализации процесса оценки. Эта формализация бывает эвристической или экспериментальной.

Непосредственное назначение балльных оценок производится экспертами независимо друг от друга или в процессе обсуждения. Количество баллов в принимаемой оценочной шкале может быть разным. Для оценки показателей качества можно использовать пяти-, семи - или десятибалльную шкалы.

Пример пятибалльной шкалы.

Оценка Число баллов

Отличное качество 5

Хорошее качество 4

Вполне удовлетворительное качество 3

Удовлетворительное качество 2

Плохое качество 1

Пример семибальной шкалы.

Оценка Число баллов

Качество очень высокое 7

Качество высокое 6

Качество выше среднего 5

Качество среднее 4

Качество ниже среднего 3

Качество низкое 2

Качество очень низкое 1

Обобщенный показатель качества K экс , определяемый экспертным методом по балльной системе исчислений, находят как среднее арифметическое значение оценок, поставленных всеми экспертами и вычисляют по формуле

https://pandia.ru/text/78/318/images/image021_27.gif" width="84" height="53 src=">,

где -- значение показателя качества, полученное в каждом туре; m -- число туров опроса.

Эвристическая формализация экспертных оценок заключается в определении зависимости между значениями параметрических показателей и их оценками в баллах. На основании этого строится график или разрабатывается математическая формула, которые позволяют выражать балльную оценку показателей качества в натуральных единицах измерений , например, производительность ИС как число выдаваемых пользователю документов в единицу времени.

При экспериментальной формализации устанавливают соотношение значений балльных оценок со значениями показателей, определяемыми в результате эксперимента. Следует отметить, что экспертный метод определения значений показателей качества с использованием способа экспериментальной формализации оценок экспертов является более объективным, чем без такой формализации .

В экспертной оценке можно применять так называемый социологический метод оценки качества ИС. Этот метод, как и экспертный, основан на опросах, мнениях, но не специальных экспертов, а различных пользователей ИС – студентов, преподавателей, аспирантов, сотрудников управления, научного сектора вуза и др. Этот социологический метод можно считать модификацией экспертного. Социологический метод определения значений показателей качества продукции является по существу маркетинговым и осуществляется с помощью не экспертов, а фактических или потенциальных потребителей результатной информации, выдаваемой ИС. Сбор мнений потребителей производится опросом или с помощью распространения и заполнения специальных анкет-вопросников, а также путем организации конференций, выставок, аукционов, опытно-показательной эксплуатации и т. п.

Экспертный метод можно эффективно применять и для оценки качества отдельных компонентов ИС – технических средств, программных продуктов, базы данных , лингвистических средств и др.

Литература

1. Исаев оценки качества информационных систем. М.: ИМСГС, 20с.

2. Орлов принятия решений. М.: Изд-во «Март», 20c.

3. Литвак оценки и принятие решений. М.: Патент, 19с.

Принцип отбора не является обоснованным, если наблюдается одна из следующих ситуаций:

1. некомпетентность всех или части экспертов по предмету экспертизы;
2. возможная заинтересованность всех или части экспертов в определенном решении;
3. отсутствие в экспертной группировке специалистов, способных рассмотреть объект с определенной стороны, существенной для его оценки;
4. квалиметрическая некомпетентность - отсутствие навыков участия в работе экспертной группы;
5. отсутствие стремления всех или части экспертов принять активное участие в работе.

Способы отбора экспертов делятся на две группы:

1. способы определения первоначального круга экспертов (кандидатов в эксперты). Результаты заносятся в банк данных.
2. способы отбора экспертов из числа этих кандидатов для участия в конкретной экспертизе.

Способы определения кандидатов в эксперты Способы назначения

1) Непосредственное назначение заказчиком экспертизы

Членов экспертной группы назначает ответственное лицо (руководитель организации), по распоряжению которого проводится экспертиза, лично в экспертизе он не участвует.

Достоинства:

§ в число экспертов попадают в основном специалисты, заинтересованные в проведении экспертизы и склонные к коллективной работе;
§ руководитель обязательно назначает авторитетных лиц, решение которых не вызовет сильных возражений у других сотрудников;
§ решение такой экспертной группы будет авторитетно для самого заказчика.

Основной недостаток:

§ эксперт, зная руководителя, может выражать не подлинное суждение, а суждение, соответствующее ожиданиям руководителя.
2) Назначение по выбору эксперта руководителя группы

Руководитель организации назначает только одно лицо - ведущего эксперта. Затем ведущий эксперт подбирает членов экспертной группы, ориентируясь на собственные неформальные критерии. Затем весь состав экспертной группы утверждается приказом руководителя.

Достоинства:

§ удается собрать специалистов, хорошо сработавшимися между собой;
§ в экспертной группе не будет лишних людей, что позволит сэкономить средства и время.

Недостатки:

§ в экспертную группу войдут специалисты одной научной школы, склонные к одностороннему подходу к решению проблемы экспертизы, совпадающему с подходом руководителя группы;
§ руководитель экспертной группы почти наверняка не сможет привлекать к работе экспертов выше себя по служебному положению. Авторитетность этой группы в глазах заказчика будет зависеть только от авторитетности ведущего эксперта.
3) Назначение комиссии, состоящей из руководителей экспертных групп

В организации могут проводиться экспертизы примерно одного и того же назначения. Создается постоянная комиссия из руководителей экспертных групп. Перед очередной экспертизой руководители экспертных групп независимо друг от друга составляют списки кандидатов в эксперты. В экспертную группу включают тех, которые названы большинством руководителей.

Достоинства:

§ в экспертную группу привлекаются необходимые специалисты различного профиля, обеспечивается многосторонность анализа проблемы;
§ перед каждой экспертизой экспертную группу формируют заново, отбирая тех экспертов, которые лучше знают конкретную проблему;
§ личная ответственность эксперта повышена, так как он ожидает критику со стороны представителей других школ. Это обеспечивает взаимный контроль результатов.

Недостатки:

§ продуктивность работы экспертной группы может оказаться невысокой из-за противоречий во взглядах у представителей разных школ. На устранение этих противоречий может уйти значительное время.
§ могут возникнуть трудности со сбором экспертов в одну группу из-за плохой психологической совместимости друг с другом.

Документальные показатели

Документальные способы основаны на использовании показателей, хранящихся в отделе кадров организации.

Основные документальные показатели: стаж работы, возраст, ученая степень, количество научных трудов, изобретений, частота участия в конференциях, количество премий и поощрений по результатам работы и др.

В экспертную группу отбирают специалистов, имеющих наилучшие документальные показатели.

Достоинства:

§ созданная экспертная группа обладает максимальной авторитетностью в глазах высшей администрации;
§ независимость суждений экспертов от мнения начальства.

Недостатки:

§ трудно добиться согласования оценок в случае появления разногласий;
§ мала вероятность попадания в экспертную группу инициативных специалистов, способных решать задачи нетрадиционными методами;
§ получила распространение практика покупки дипломов, преподнесения ученых степеней в качестве подарков и т.д.
2) Отбор по условию полноты охвата проблем

Предварительно специалист по организации групповой экспертизы путем консультаций выделяет в объекте экспертизы стороны, анализ которых требует участия представителей разных специальностей. По документальным данным сотрудников организатор производит набор требуемых специалистов.

Достоинства:

§ осуществляется всестороннее рассмотрение объекта экспертизы;
§ по документальным характеристикам удается найти экспертов узкого и широкого профиля. Участие первых обеспечивает подробность анализа, участие вторых - увязку между собой оценок различных свойств объекта.

Недостатки:

§ ввиду невозможности привлечь многих специалистов одного профиля подход некоторых экспертов может быть односторонним;
§ возможна несовместимость некоторых экспертов в группе ввиду их несработанности;
§ не исключено, что организаторы допустят решающую ошибку при выборе совокупности тех сторон, с которых следует рассматривать объект.

1) Способ «снежного кома»

Вначале опрашивают одного специалиста по объекту экспертизы. Он должен назвать других лиц, которые по его мнению должны войти в состав экспертной группы. Эти специалисты вновь должны назвать возможных экспертов. Постепенно круг взаимных рекомендаций замыкается: все потенциальные эксперты оказываются названными.

Достоинство: способ позволяет найти коллектив сработавшихся сотрудников независимо от служебного положения. Такая экспертная группа может провести наиболее глубокий анализ качества.

Недостатки: качество резервный квалиметрия эксперт

§ иногда этот способ приводит к слишком большому численному составу экспертной группы. Приходится при опросе вводить правило остановки, либо отбирать тех экспертов, которые рекомендованы большинством;
§ односторонний подход к решаемой квалиметрической задаче (все эксперты принадлежат к одной школе).
2) Способ взаимных выборов

Способ отличается от предыдущего тем, что одновременно с формированием полного списка потенциальных экспертов каждый эксперт знакомится со всем имеющимся на момент опроса списком и отмечает тех кандидатов, с которыми он хотел бы сотрудничать, и тех, сотрудничать с которыми он считал бы нецелесообразным.

При этом возможно образование в списке двух и более подгрупп, в этом случае для экспертизы следует использовать представителей одной подгруппы или проводить работу с каждой подгруппой в отдельности. При этом могут сильно отличаться результаты.

Основной недостаток: лишь некоторые кандидаты в эксперты знакомятся со всем списком, большинство специалистов получает список на стадии его формирования и не могут в полной мере выразить свой выбор.

Способы выдвижения

1) Выдвижение экспертов коллективами подразделений

Выдвижение специалистов может быть проведено коллективами подразделений данных организаций путем открытого или тайного голосования.

Таким способом могут быть отобраны эксперты, пользующиеся всеобщим доверием и уважением независимо от их служебного положения и не обязательно более квалифицированных.

Как показывает опыт, такие эксперты коммуникабельны и хорошо работают в составе экспертной группы. Применяют способ в тех случаях, когда требуется учет факторов, связанных с моралью и этикой. Например: оценка качества работы подразделений с целью премирования лучших экспертов.

Недостаток: узость области применения. Экспертизу, требующую обширных знаний, такая экспертная группа выполнить не может.

2) Выдвижение экспертов заинтересованными организациями (способ «кота в мешке»)

Если решение проблемы экспертизы требует участия представителей различных организаций в разных городах, то выбор экспертов по документальным данным становится практически невозможным.

Для привлечения специалистов обращаются к руководству соответствующей организации с просьбой о командировании представителей с указанием на те характеристики экспертов, которые желательны для участия в данной экспертизе.

Этот способ приводит к появлению в составе экспертной группы специалистов с трудно совместимыми позициями, каждый из них стремится к достижению тех или иных целей, поставленных перед ним руководством.

3) Способ максимального соответствия

Встречаются ситуации, когда члены экспертной группы должны отражать не собственную точку зрения, а позицию определенной категории населения. Целью такой экспертизы является выявление отношения населения (отношение населения к появлению новой продукции или введению нового вида услуг, отношение к сносу и возведению зданий, отношение к изменению природной среды). Цель такой экспертизы - выявить отношение населения к тем или иным решениям.

Предварительно составляется классификация контингента населения по социальным группам, которые могут иметь отличную от других групп позицию по отношению к объекту экспертизы. Эта классификация вручается всем работникам организации, которая проводит экспертизу. Каждый сотрудник должен указать своих коллег, наиболее способных имитировать позицию определенной социальной группы населения.

Трудности способа: При подготовке анкет для опроса при самой классификации групп населения. При рациональной классификации и хорошей организационной работе метод дает хорошо обоснованную оценку.

Достоинство: меньшие затраты времени и средств, чем при использовании социологического метода.

4) Способ «фокус-групп»

Фокус-группа - это 7-10 человек, проводящих дискуссию по заранее составленному плану и направленную на выявление суждений представителей различных социальных групп по квалимитрическому вопросу.

В отличие от способа максимального соответствия фокус-группу формируют из числа представителей общественных организаций, заинтересованных в решении вопроса.

Так как к экспертизе привлекаются лица, не знакомые с такой формой работы, то формирование группы и работа с ней требуют хорошей подготовки организатора.

Влияние состава экспертов на результаты экспертизы

Пример

Способы определения кандидатов в эксперты Способы назначения

Популярное