- Проф. Герганов, 4 години след въвеждане на националните изпити постигнахме ли обективността на оценяване, която всички очакваха?
- Провеждането, контролът и цялата организация на процеса у нас все още е много далече от доближаването до надеждни данни от това оценяване. В тестовете продължава да има компоненти, които са пак по старата система. Децата пишат текстове. Тези текстове някой ги оценява. Този някой си носи определените дефекти на оценител. Така че няма някаква съществена промяна. Приемният тест за американските университети - SAT, например също включва свободни отговори. Но оценяването им става по определени правила, които свеждат до минимум възможностите за големи отклонения. У нас в Центъра за контрол и оценка на качеството в образованието за пръв път започнахме да обучаваме проверители - както за матурите, така и за изпитите от външното оценяване. По време на тези семинари оценявахме две важни характеристики на оценителя - каква е неговата строгост (снизходителност) и каква е степента на съгласуваност на оценките между всеки двама оценители. Знаете, че всяка писмена работа се оценява от двама проверители. Искахме да разберем дали има съгласуваност на оценките им, тоест когато първият проверител е писал висока оценка на една писмена работа, и вторият ли й е писал висока оценка. Оказва се, че има много лоши коефициенти на съгласуваност при преподавателите по хуманитарните предмети. Установихме, че след тренингите нещата се променят и в двете посоки. В някои групи броят на лошите коефициенти на съгласуваност намалява, в други се увеличава. Нямаше никаква закономерност при промяната на този параметър. Аналогична е картината и за параметъра строгост (снизходителност).
Тестовете могат да бъдат прекрасни, обаче могат да бъдат опорочени по един елементарен начин. Например в Америка компютърна програма "лови", когато двама души, седнали един до друг, имат абсолютно еднакви отговори по тестовите задачи, дори и грешните им отговори са еднакви. Хоп, уловени са, но няма анулиране. Пишат им едно писмо и на двамата: "Уважаеми еди-кой си, случи се нещо непредвидено. Компютърната ни система се срина и вашите данни изчезнаха. Много ви молим да се явите пак на теста на наши разноски - ще ви платим пътните, командировките, нощувките, заповядайте да се явите пак". Обикновено никой не идва. Разбират, че са ги разкрили. Те остават без оценка, все едно, че не са се явявали на тест. Америка много държи на човешките права, но там са намерили юридическите основания да прилагат подобна практика. А при аналогичен случай според критериите у нас не можем да обявим, че еди-кой си е измамник, защото не е уловен на място. При всички нашенски правила няма как да хванеш мошеника, измамника.
- Защо според вас част от университетите не използват матурите за вход и продължават да държат на своите си изпити?
- Има различни посоки на разсъждение. Едно от нещата е консервативност. Другото е, че когато има тестов формат, кандидатите по-малко се нуждаят от частни уроци, от помощта на тези, които ще ги оценяват. Ако изпитният формат обаче са писмените съчинения от различен вид, отиват на частни уроци при тези, които след това ги оценяват. Така успешно си взимат изпита. По този начин пък се осигуряват на проверителите в университетите допълнителни доходи. Това се обсъжда публично, не е само мое мнение... Тестовете в Америка са се появили, след като вече са се знаели лошите качества на класическата процедура на оценяване чрез проверители, решили са да се отърват по някакъв начин от нея и са стигнали до тестовете. Веднага обаче започват критики. Всички критики на тестовете, които ги има сега у нас, ги е имало в началото на ХХ век в Америка. И това силно е стимулирало научните изследвания в областта на науката за оценяването, за да се отговори на обществените критики, че слабостите са преодолими.
Например, една от критиките е, че само по лотариен принцип на избор на отговори може да се изкара добър резултат на теста. Аз обаче бих попитал: "Ако това е така, защо никой от играта "Стани богат" все още не е стигнал до 100 000 лв.?" Много зависи как е направен тестът. Например в тест, включващ 100 тестови задачи от затворен тип (въпрос с 4 предложени отговора, от които един е верен) вероятността да уцелиш верния отговор е 25%. Така при 100 задачи и максимален брой точки 100, само 25 т. могат да се изкарат чрез случаен избор. Оттам нагоре с лотария никой не може да получи 30, 40, 50, 100 т. Но при тези вероятностни изчисления лесно може да се определи къде е двойката - 25 т. Дори по-малкият брой точки от този брой носи информация за знания. Известни са следните интересни примери. Даден ученик получава 0 т. на теста. Родителите му са учудени, защото знаят, че детето им е много силен ученик. След като правят справка, специалистите по теста се подсмихват и им казват: "Детето ви наистина е много силен ученик, но нарочно е избирало грешните отговори на всяка тестова задача, защото по някакви причини не е искало да изкара теста. Не е съобразило обаче, че нулевият брой точки означава, че също знае много".
- Има много дебати по скалата за оценяване на националните изпити, която се прави след проверката на работите. Много експерти настояват, че трябва предварително да е ясно колко точки отговарят на съответната оценка по шестобалната скала.
- Разбира се, че трябва да се знае предварително. Това обаче е политически въпрос и го решават политиците. Да приемем, че тестът се състои от 100 задачи, всяка от които е с 4 отговора - един верен и три грешни (подвеждащи). Максималният брой точки ще бъде 100, минималният - 0. При нулево количество знания и случаен избор на отговори тестуваният би получил около 25 т. Точно тези 25 т. са за "Слаб 2", ако това се приеме като критерий. Въпросът за определяне на праговите стойности обаче е много сложен. Неговото решаване е свързано с чисто научна задача към какво е насочен тестът - дали е по отношение на норма (постиженията на даден тестуван се сравняват с постиженията на всички останали) или по отношение на критерий (постиженията на даден тестуван се сравняват с предварително зададени критерии). Обикновено у нас тестовете са насочени към норма. Как да преобразуваме точките от теста в оценки по шестобалната система е въпрос, който се решава от политическата власт. Министърът като политическо лице взима решение въз основа на резултатите, които всеки може да види. Той с екипа си решава къде да се сложи двойката. Така се определя и какъв да бъде процентът на двойките. Това е политическото решение на въпроса. Другото решение е да се съберат експерти с голям опит по съответния предмет и да преценят колко от задачите трябва да бъдат решени, за да се пише тройка. Ако се питат 100 души, се вижда какво е честотното разпределение на техните мнения и се взима онази зона, където са мненията на най-голям брой експерти. Примерно, най-често те отговарят: "30 точки". Ако има такава информация, министърът може да каже: "ОК, 30 точки означава "Среден 3", под 30 точки се пише "Слаб 2". В този случай не се интересуваме какъв процент от тестуваните ще попаднат в категорията "Слаб 2". Може изобщо да няма двойкаджии. Но нещата при нас не са такива. За министъра и политиците не е без значение какъв ще бъде процентът на слабите оценки. Затова те преценяват къде да сложат границата на тройката чак когато вече имат готови резултати. Оттам нататък се правят равни интервали за другите оценки.
Проблемът за определяне на праговата стойност за "успешно" издържан тест в науката се обсъжда много. Има десетки предложения и начини как да се реши. Не съм видял обаче някой у нас да излезе публично и да каже: "Ние използваме такива и такива подходи при решаването на проблема къде да сложим границата между "Среден" и "Слаб". Щом като не се казва това, значи процедурата за решаване на този проблем не е прозрачна.
ЦИТАТИ
Никой не може да изкара с лотария висока оценка на теста.
У нас е почти невъзможно да хванеш измамниците на изпита.