- Доц. Стоянова, каква оценка бихте написали за матурите?
- За организация бих дала оценка Много добър (5.00), която трудно би могла да бъде по-висока, ако се вземат предвид обхватът, ограниченията във времето и фактът, че се провеждат за пръв път. Що се отнася до качеството на самите тестове и професионализма при разработката им, то общата ми оценка е Среден (3.00). Въпросът дали някой харесва, или не харесва тестовете от матурите, всъщност е без значение, защото те не са произведения на изкуството, а измерителни инструменти, за които има обективни критерии за качество. Важно е дали те мерят това, което се твърди, че измерват, и дали го измерват точно. Това не става ясно само чрез разглеждане на тестовите задачи. На тези въпроси би трябвало да отговори МОН и подчертавам ПРЕДИ провеждането на самите матури. Това е изискване, залегнало във всички професионални и етични кодекси в областта на тестирането. Според международните правила тестовете трябва да притежават доказателства за надеждност и валидност според целите, за които са създадени. Тези доказателства трябва да са достъпни за потребителя на теста, както и за евентуална независима проверка или оценяване. Оправданието, че подобни матури се провеждат за пръв път и затова сме "на тъмно", едва ли ще удовлетвори тазгодишните зрелостници - още повече че миналата година бяха проведени пробни матури и данните от тях биха могли да се използват, за да се отговори на подобни въпроси.
- Какво ви смущава в организацията и провеждането на матурите?
- В допълнение към проблема с недоказаното качество на използваните тестове има още два момента, които са, меко казано, смущаващи. Първият е организацията на работата на оценителите и по-конкретно - липсата на обучение на оценителите. Самите критерии за оценка са само маркирани без детайлно описание на отделните оценъчни категории и без илюстративни примери. Така разминаването между оценките на двамата оценители ще бъде значително, а надеждността на получените резултати - съмнителна. Фактът, че са използвани двама оценители, е положителен и трябва да се приветства, но това не е достатъчно. Само за сравнение ще отбележа, че обучението на оценителите на задачите с къс свободен отговор (1-2 изречения максимум) в международното изследване на грамотността PIRLS (Progress in International Reading Literacy Study) обикновено продължава дотогава,
докато не се постигне 85% съгласуваност
между оценителите, и обикновено изисква около една седмица. Другият смущаващ момент е липсата на доказателства за съгласуваност между съответните държавните образователни изисквания и конкретните тестове. Независимо от тази липса на доказателства на базата на тестовите резултати се издават зрелостни свидетелства, които удостоверяват, че даденият зрелостник е покрил съответните държавни образователни изисквания. Подобна съгласуваност обикновено се търси и постига още на етапа разработка на теста, но това очевидно не е направено.
- Имаше много различни становища и разгорещени дебати за скалата за оценяване. Подходяща ли е тази скала според вас?
- Този въпрос за съжаление няма еднозначен отговор. Зависи за какво е подходяща. Ако искаме да докладваме, че над 50% от учениците са получили четворки на матурата по български, а двойките са само 4% - очевидно дадената скала е подходяща. Що се отнася до моето мнение, то отговорът ми е не - скалата не е подходяща. Първо, избраният подход не отговаря на заявените цели на това външно оценяване, защото при него оценката е резултат от сравнението на резултатите на отделния ученик с резултатите на останалите, а не от сравнение със съответните държавни образователни изисквания. Паралелът със SAT, който се прави понякога, е некоректен, защото SAT за разлика от матурите не е задължителен тест, не е и заключителен тест, а е тест за селекция. Потенциална опасност от избрания подход е, че благодарение на него неграмотността се превръща в стандарт, с който ще се сравняват бъдещите зрелостници. Второ, погрешен според мен е и стремежът към унификация и използването на една и съща скала за всички предмети. Зрелостниците, явявали се на различните изпити, са различни, тестовете също са с различна трудност и събирането на всички резултати в едно е все едно да събереш ябълки, круши и сливи - резултатът и в двата случая е компот. Излиза, че е все едно да решиш 23 задачи на труден и на лесен тест - и в двата случая получаваш тройка. Трето, както за тестовете, така и за оценъчните скали съществуват обективни критерии за качество, които обаче не могат да се приложат в случая, защото допреди 2 седмици оценъчна скала изобщо нямаше и следователно няма и доказателства за качествата на предлаганата скала. Събирането на доказателства изисква време и уверенията на министъра нямат доказателствена стойност.
- Един от коментарите след обявяването на оценките бе, че 23 т. за тройка е твърде нисък праг. Какво е вашето мнение за различните прагове за съответните оценки?
- Смея да твърдя, че познавам доста добре световната практика в това отношение, но
досега не съм срещала минимален праг
от 23% вярно решени задачи. Обикновено минималният праг е над 60% и в изключително редки случай пада до 50, но да получиш по-малко от половината от максималния бал и да бъдеш квалифициран като "добър", е, меко казано, странно.
- Всъщност министърът отбива всички критики с аргумента, че тези, които критикуват, са или против матурите, или са обидени, защото не са включени в организацията?
- Не съм против матурите - напротив, смятам, че матури трябва да има. От друга страна, изобщо не съжалявам, че не съм в екипа, разработил тестове с подобно съмнително качество. Това, което искам, е МОН да направи публично достояние информацията за качествата на тестовете и оценъчните скали. Искам министърът да си свърши неговата работа и вместо да ни уверява колко хубави са тестовете и лоши учителите, да обяви и предостави съответните доказателства за грешката на измерването за всеки един от тестовете, за надеждността на всеки един от оценителите, за грешката на измерването поотделно за всяка една от петте прагови стойности за всеки конкретен тест, за качествата на отделните тестови задачи и за съдържателната валидност на отделните тестове. Докато МОН не направи това, ще продължавам да критикувам матурите и да твърдя, че тестовете са непрофесионално направени, не защото аз не участвам в разработката им, а защото не съответстват на професионалните и етични стандарти за качество.












