Информационно-образовательный портал СОДРУЖЕСТВА НЕЗАВИСИМЫХ ГОСУДАРСТВ
ИНФОРМАТИЗАЦИЯ ОБРАЗОВАНИЯ
И ДИСТАНЦИОННОЕ ОБУЧЕНИЕ В СНГ
Информационно-образовательный портал СОДРУЖЕСТВА НЕЗАВИСИМЫХ ГОСУДАРСТВ  

Страны
Азербайджанская Республика
Республика Армения
Республика Беларусь
Республика Казахстан
Кыргызская Республика
Республика Молдова
Российская Федерация
Республика Таджикистан
Туркменистан
Республика Узбекистан
Украина

Типы материала
Информационно-коммуникационные технологии
Дополнительные информационные материалы
Нормативно-правовое обеспечение
Организация и методики обучения
Экономика образования
Межгосударственное сотрудничество
Образовательные центры
Методики обучения
Межвузовское сотрудничество
Повышение квалификации
Международные проекты и гранты, конкурсы
Конференции, симпозиумы, семинары и др.
Библиотека
 
Журнал «Вестник РУДН» серия «Информатизация образования»
 
2014, №4
2014, №3
2014, №2
2014, №1
2013, №4
2013, №3
2013, №2
2013, №1
2012, №4
2012, №3
2012, №2
2012, №1
2011, №4
2011, №3
2011, №2
2011, №1
2010, №4
2010, №3
2010, №2
2010, №1
2009, №4
2009, №3
2009, №2
2009, №1
2008, №4
2008, №3
2008, №2
2008, №1
2007, №4
2007, №3
2007, №2-3
2007, №1
2006, №1(3)
2005, №1(2)
2004, №1
Научные и специальные электронные ресурсы
Учебная, научная и специальная литература
Комиссия по дистанционному обучению совета по сотрудничеству в области образования государств-участников СНГ
Новости

Информационные технологии в управлении школьным образованием (II)


Аннотация
В настоящей статье рассматриваются вопросы информационного обеспечения процесса управления образованием (в частности школьным образованием); математико-статистические модели в управлении школой и примеры грамотного использования современных средств обработки данных (пакетов статистических программ) для формирования управленческих задач и принятия решений.

Текст документа

3.2.4.Второй этап информатизации. Аналитическая статистическая обработка данных.

 Проверка гипотезы однородности. Один из аспектов управления процессом качества школьного образования – обеспечение справедливости. Девочки и мальчики, дети из обеспеченных  и необеспеченных семей, дети с хорошей физической подготовкой и более слабые в физическом отношении должны иметь равные возможности получения знаний.

Ответ на вопрос, так ли это в действительности, менеджер может получить, сравнивая успеваемость учеников, разделенных на группы по различным группирующим факторам: пол, уровень обеспеченности, состояние здоровья и т.д. Если окажется, например, что средняя успеваемость девочек по какому-либо предмету значимо хуже, чем мальчиков, это может говорить о наличии некоторого неслучайного фактора (к примеру, предвзятое отношение к девочкам), который менеджеру предстоит выявить и устранить.

Другой аспект управления – нововведения: новый учебник или новую методику стоит вводить, если успеваемость учеников, обучавшихся по этому учебнику (методике) значимо лучше, чем у обучившихся по старому.

Все перечисленные задачи представляют одну и ту же статистическую задачу: сравнение однородности распределения двух групп. Приведем математический анонс этой задачи.

Для решения нужно сформировать два ряда чисел:

x¹,.....,x¹ - оценки по какому-либо предмету учеников 1-ой группы,

 x²,.....,x² - оценки по тому предмету учеников 2-ой группы.

Затем нужно сформировать некоторую функцию от этих рядов чисел

T = T (x¹,... x¹; x²,.....,x²),

называемую статистикой критерия, и сформировать правило, называемое критерием для нулевой гипотезы Н (гипотезы однородности), которое по??воляет по значению статист????????ки Т отклонить либо принять нулевую гипотезу. Правило может быть одним из следующих трех типов:

а) отклонить Н, если Т>t

b) отклонить Н, если Т<t

c) отклонить Н, если лежит вне интервала, причем значения t , t , t , t  , называемые критическими значениями, выбираются исходя из вероятностных свойств самой функции Т так, чтобы обеспечить желаемую исследователем надежность  = 1  (0,95; 0,99 и т.д.).

В теоретической статистике разработано большое количество статистик для проверки однородности двух выборок: t  - статистика Стьюдента, F – статистика Фишера,  Z – статистика для сравнения бинарных данных (т.е. данных, принимающих значения 0 либо 1), непараметрические статистики Вилкоксона, Кoлмогорова-Смирнова. Существуют также обобщения этих статистик на случай сравнения трех и большего числа выборок (например, сравнения по успеваемости по какому-либо предмету трех различных классов одного уровня).

Выбор той или иной статистики Т зависит: от того, какой именно параметр распределения мы хотим сравнить, какого характера исходные данные, каким образом они получены и т.д. Так, например, для установления различий в среднем значении двух независимых выборок, распределенных нормально применяется t  - статистика, если априорная информация в виде распределения сравниваемых выборок отсутствует применяется статистика Вилкоксона, если условия проведения эксперимента таковы, что сравниваемые выборки зависимы, применяется модифированная t  - статистика, если желательно сравнивать разброс относительно среднего, т.е. проверить различие в дисперсиях двух выборок применяется F – статистика Фишера.

Пример: применение t-критерия для обнаружения эффекта новой методики обучения [4]. Сравниваются две группы учеников, обучавшихся чтению по методике ESL, обучавшихся чтению без применения методики ESL. Группы различны, поэтому выборки можно считать независимыми и применить t - статистику, вычисляемую по формуле

Т

  - среднее значение 1-ой выборки,

  - среднее значение 2-ой выборки,

  - выборочная дисперсия (т.е. средняя сумма квадратов отклонений наблюдаемых значений от среднего) 1-ой выборки,

    - выборочная дисперсия 2-ой выборки.

Получены следующие значения:

Выборочные характеристики

С методикой

Без методики

Объем выборки

n = 10

n = 10

Выборочное среднее

31

27,2

Выборочная дисперсия

4,52

463,8

 

Расчетное значение статистики  t (18)=1,855

По таблицам процентных точек t-распределения, которые можно найти в любом учебнике по математической статистике, например [10], найдем для 1-α = 0,95 

t   = 2,101   t   = -2,101. Полученное значение t-статистики 1,855 лежит внутри интервала (-2,101; 2,101), поэтому с заданной вер??ятностью 0,95 можно утверждать, что между средними оценками групп, обучавшимися по методике и без применения нет значимой разницы. Иначе говоря, эффект от применения новой методики обучения не обнаружен.

Итак, процесс проверки гипотезы однородности требует от исследователя умения:

- выбрать соответствующую статистику критерия (например, t-статистику);

вычислить эту статистику по данным наблюдений (в случае t-статистики по формуле (1)), т.е. найти t - расчетное ;

-  определить критические границы для заданного уровня надежности и сравнить расчетное значение статистики с критическими границами.

Использование системы STATISTICA позволяет решать эти задачи, не обладая специальной подготовкой в области математической статистики. Вначале следует обратиться к STATISTICAL Advisor (статистическому советнику) – модулю, встроенному в справочную систему. Если выбрать папку Advisor в меню Help, программа будет задавать несложные вопросы о характере стоящей проблемы, типе исходных данных; затем Advisor выдает наиболее связанные процедуры и опции для их решения (а также объяснит как воспользоваться ими в STATISTICA).

Далее следует использовать рекомендованную Advisor процедуру и запустить ее из соответствующего модуля системы STATISTICA. На рис 9 (а), (в), (с) представлены результаты процедуры проверки гипотезы однородности распределений оценок мальчиков и девочек по математике, языку и естествознанию для данных рабочего файла student.sta  с помощью t-критерия. Запуск процедуры из модуля Basic Statistics показан в Приложении.

Для интерпретации результатов, представленных на рис. 9 приведем определения понятий надежности, значимости, р-значения и т.д. Поскольку речь идет о сравнении случайных величин, то вероятность того, что выборочные  средние двух групп совпадут, даже в случае справедливости нулевой гипотезы Н , (гипотеза о том, что вероятностные распределения 1-ой и 2-ой группы совпадают) равна нулю. Поэтому t-статистика, вычисленная по формуле (1) только в редких случаях (с вероятностью равной нулю), будет отличаться от нуля, вообще говоря, она будет принимать любое значение из некоторого интервала с некоторой вероятностью и чем этот интервал шире, тем вероятность попадания в него больше.

Интервал, соответствующий заданной надежности, называется областью принятия нулевой гипотезы. Область принятия при применении t-критерия  зависит от двух параметров: надежности и, так называемого числа степени свободы, которое равно общему числу наблюдений в двух сравниваемых группах минус 2.

В нашем рабочем примере с файлом  student.sta число степеней свободы равно 48. На рис.10 показаны области принятия Н, соответствующее числу степеней свободы 48 и различным значениям вероятности принятия нулевой гипотезы от 0.75 до 0.99. Вероятность принятия g - равна площади заштрихованной области под кривой плотности. Вероятность отклонения Н или уровень значимости – это площадь незаштрихованной области a=1-g. Надежность 95% означает, что, если повторить эксперимент много раз и вычислить t-статистику, то в 95% случаев значение t будет принадлежать области принятия гипотезы Н , в том случае, когда распределения обоих групп действительно совпадают, а в 5% случаев лежать вне этого интервала. Надежность в терминах вероятности означает, что вероятность принять гипотезу однородности, когда она верна равна 0,95, а вероятность отклонить гипотезу, когда она верна, равна 0,05.

Вероятность отклонить гипотезу, когда она верна, или иначе, уровень значимости, называется вероятностью ошибки первого рода. Существует также вероятность ошибки второго рода – принять нулевую гипотезу, когда верна альтернативная гипотеза Н (гипотеза о том, что вероятностные распределения 1-ой и 2-ой групп совпадают).

Область принятия гипотезы желательно выбирать так, чтобы уменьшить ошибки 1-го и 2-го рода, однако, уменьшая ошибку одного рода, мы увеличиваем ошибку другого рода.

Как было отмечено выше нулевая гипотеза принимается, если расчетное значение t-статистики попадает в область принятия. Другое правило принятия или отклонения Н – это сравнение так называемого р-значения, которое равно минус вероятности попадания в интервал [ t–расчетн, - t-расчетн] с заданным уровнем значимости a=1-g. Если р-значение больше a, то нулевая гипотеза принимается, в противном случае, отклоняется.

На рис.9 (а) в первой строке указаны: среднее оценок мальчиков G1:1=3.966667, среднее оценок девочек G2:2=3.875, расчетное значение t-статистики t-value=0.375074, число степеней свободы df=48, р-значение= 0.709258. Если выбрана вероятность принятия нулевой гипотезы g=0.95, то, поскольку р-значение больше a=0.05, нулевая гипотеза принимается.

Выбор уровня значимости или вероятности ошибки первого рода зависит от того, что важнее для менеджера: не пропустить даже небольшое различие в сравниваемых группах, или же не предпринимать каких-то лишних шагов для устранения незначительных различий. Обычно, для социо-психологических исследований уровень значимости равный 0.05 является вполне разумным.

Критерий, основанный на  t-стати??ти??е, ??р??дназначен для сравнения средних двух групп. Однако, часто средние могут совпадать, но вероятностные распределения двух групп различаться. В этом случае необходимо сравнить дисперсии двух групп с помощью F-статистики Фишера, либо применить другие крите??ии однородности. На рис.9 во второй строке приведены квадратный корень из дисперсии: для мальчиков Std. Dev C1:1= 0,860366 и для девочек Std. Dev G2:1= 0,825179, значение F-статистики:  F-ratio variancs  со своим р-значением: p-variancs. Поскольку и в этом случае р-значение больше  a=0.05 для всех трех предметов, можно утверждать, что группы девочек и мальчиков для файла student.sta значимо не различаются по успеваемости ни в смысле средних значений, ни в смысле дисперсий.

Обычно, если нулевая гипотеза не отвергнута, но это еще не означает, что на этом анализ может быть завершен. Следует выяснить, нет ли каких-либо факторов, вызывающих различие в распределениях двух групп, которые не удалось обнаружить поскольку не были рассмотрены все возможные группировки по различным группирующим факторам. Например, если сравнить данные об успеваемости девочек и мальчиков, занимающихся у различных учителей по объединенной выборке, то можно и не обнаружить предвзятое отношение к девочкам одного из преподавателей.

Продолжение исследований приведет к дисперсионному анализу (в английской терминологии ANOVA – сокращение от Analysis of Variation), позволяющему проверять однородность нескольких групп. В случае, когда группировка ведется по одному фактору, например, учителю - это однофакторный дисперсионный анализ, когда группирующих переменных две: пол ученика и учитель – двухфакторный. Здесь также как и в обычной задаче  сравнения двух выборок существует ряд статистик для проверки нулевой гипотезы об однородности нескольких групп, и если однородность отсутствует, то вклад, какого из группирующих факторов выше.

Анализ зависимости и подгонка кривой. Во многих ситуациях принятие оптимального управленческого решения базируется на прогнозировании того или иного выходного показателя, характеризующего учебный процесс. Прогнозирование связано с оценкой зависимости между входными и выходными показателями, определенной по ряду наблюдений. По измерениям входных и выходных переменных необходимо определить каким образом зависят выходные переменные от входных, а также как связаны между собой входные переменные. При этом выходные переменные называют результативными, а входные – факторными переменными или просто факторами. Приведем некоторые примеры таких задач.

1.                    Необходимо спрогнозировать успеваемость ученика, имея значение комплексной оценки его состояния здоровья. Здесь Y (выходной параметр) – успеваемость, а X (входной параметр) – комплексная оценка состояния здоровья. Для прогноза необходимо найти зависимость между в??одом и вы??одом т.е. получить уравнение, связывающее Y и X, подставляя в это уравнение значение X для интересующего нас случая, получим прогноз для Y. Зависимость оценивается по ряду из n наблюдений, т.е. по парам значений (Y, X),......( Y, X) для n – учеников.

2.                    Более сложный вариант этой задачи – прогнозирование успеваемости по значениям двух входных параметров (например, состояния здоровья и уровня дохода).

Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно  и только одно значение результативного признака. Если причинная зависимость проявляется не в каждом отдельном случае, а в общем среднем при большом числе наблюдений, то такую связь называют статистической.

Если статистическая связь между явлениями приближенно описывается уравнением прямой линии, то она называется линейной; если же она выражается уравнением какой-либо кривой линии (параболы, гиперболы, экспоненты), то такую связь называют нелинейной.

В статистике подбор наилучшего уравнения, описывающего наблюдаемые значения выхода от соответствующих значений входа называется регрессионным анализом, а подобранная кривая уравнением регрессии. Парная регрессия описывает зависимость результативного признака только от одного фактора, а множественная регрессия сразу от нескольких факторных признаков.

Процедуры регрессионного анализа содержатся во всех статистических пакетах. В STATISTICA регрессионный анализ осуществляется в модулях Multiple Regression  и Nonlinear Estimation.

Визуально оценить зависимость между переменными возможно с помощью графиков Scatterplot – диаграмма рассеяния и Matrix Scatterplot, представленных в 3.2.3. Если точки ( x,y), где x – фактор, а y – отклик равномерно заполняют весь прямоугольник, то с большой уверенностью можно сказать, что статистической зависимости отклика от фактора нет, если же они концентрируются около некоторой прямой или кривой, то, построив регрессионное уравнение

 y=f(x)

с помощью модулей регрессионного анализа, мы можем использовать его затем для прогнозирования.

Так, например, построив регрессионную зависимость успеваемости у от комплексной оценки состояния здоровья х можно затем по значению х – состоянию здоровья нового ученика (т.е. такого, данные которого не были использованы в построении регрессионной зависимости) предсказать его успеваемость у=f(x).

В педагогической практике и психологии регрессионный анализ применяется для оценивания данных педагогических или психологических тестов [11, 12]. В этом  случае отклик часто являе??ся величиной, принимающей всего два значения: 0 или 1. Для оценивания вероятности получения 0 или 1 применяется специальный тип регрессионного анализа: logit- или probit-анализ.

Классификация многомерных данных. В задачах управления проблема классификации многомерных данных возникает довольно часто. Смысл ее в том, отнести объект, характеризуемый несколькими признаками, на основе их наблюдений, к одной из нескольких групп некоторым оптимальным образом. Критерии оптимальности в разных ситуациях определяются различным образом. Иногда так, чтобы минимизировать ошибочность ложной классификации.

Например, руководителю школы нужно создать три специализированных девятых класса: один с углубленным изучением физ.-мат. дисциплин, другой гуманитарного направления, третий – естественнонаучного. Каждый ученик характеризуется тремя показателями – баллами (суммарный или средний) в каждом из этих направлений.

Математически эта задача решается методами дискриминантного или кластерного анализа. Подробное изложение теории можно найти в [3,13]. В STATISTICA в модулях Discriminant analysis и Cluster analysis имеется широкий набор средств, обеспечивающих визуализацию проведения этих анализов. И интерпретацию результатов.

Кстати, один из возможных результатов - это вывод о том, что рассматриваемая совокупность учеников статистически однородна, т.е. ее невозможно разбить на статистически различные группы. Заметим, что причины такой однородности могут быть различными: все ученики одинаково хороши в одном предмете и плохи в двух других, хороши во всех трех предметах и т.д., поэтому и управленческие решения открывать или нет специализированный класс с данным уклоном могут быть весьма различными.

Для предварительного анализа и формирования задачи классификации в системе STATISTICA существует очень удобный метод визуализации многомерных данных – пиктографик «звезды». Для рассматриваемой задачи каждый ученик это точка на плоскости, из которой выходят под равными углами три луча, каждый из которых соответствует одному из направлений обучения. На лучах в выбранном масштабе откладываются баллы ученика, затем полученные значения соединяют прямыми линиями, в результате каждому ученику соответствует некоторый треугольник, характеризующий его успеваемость по всем трем направлениям. Большие и симметричные треугольники показывают высокую успеваемость по всем предметам, несимметричные  - то, что данный ученик успевает в каком-то одном направлении, маленькие треугольники, то что по всем трем направлениям. Использовав этот вид графика, руководитель сразу наглядно может оценить большой объем информации и принять оптимальное решение, даже не прибегая к специальным математическим методам. Пиктографик «звезды» для рассматриваемой задачи, выполненный на данных файла sudent.sta  показан на рис. 11.

На более высоком уровне управления такой прием может быть использован для классификации школ по направлениям.

Литература:

1.                              Социальная статистика (под ред. И.И. Елисеевой). М., Финансы и статистика, 1997.

2.                              Калинина В.Н. Математико-статистические методы в управлении. Учебное пособие. М.: МИУ.

3.                              Калинина В.Н. Многомерный статистический анализ в управлении. Учебное пособие. М.: МИУ, 1987.

4.                              Crejghton T.B. Schools and Data. The Educator’s Guide. Corwin Press. California, 2001.

5.                              Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере.

6.                              Боровиков В.П., Боровиков И.П. STATISTICA – Статистический анализ и обработка данных в среде Windows. М.: Филинъ, 1998.

7.                              Боровиков В.П.  STATISTICA – искусство анализа данных на компьютере. Санкт-Петербург, Питер, 2001.

8.                              Перегудов Ф.И., Тарасенко Ф.П. Основы системного анализа. Томск, 1997.

9.                              Федотов А.В. Моделирование в управлении вузом. Ленинград, 1985.

10.                          Браунли К.А. Статистическая методология в науке и технике. М.: Наука, 1977.

11.                          Калугян К.К. О существующих подходах к построению шкалы оценок в тестовых системах. «Обозрение прикладной и промышленной математики», 2001, М., ТВП, Т8, вып.1, с.202-203.

 

Приложения

Здесь представлены основные моменты анализа данных с помощью системы STATISTICA, начиная с запуска системы

Для запуска системы вначале нужно нажать кнопку Пуск Windows, затем указать курсором мыши на команду Программы в появившемся меню выбрать STATISTICA и еще раз щелкнуть мышью на STATISTICA. После щелчка на рабочем столе Windows  появится переключатель модулей системы

Анализ данных в любом модуле начинается с открытия файла с данными. После того как файл открыт, он появляется в рабочей области STATISTICA. Далее из открытого файла выбираются переменные для анализа, для этого на верхней панели предназначена кнопка Vars, и, если необходимо выбрать определенные строки файла, то задают специальные условия для их выбора, для этого предназначена специальная кнопка Cases. После запускается выбранная процедура обработки. На следующем рисунке показано построение гистограмм в окне Descriptive Statistics.

Гистограммы, также как и некоторые другие типы графиков доступны непосредственно благодаря кнопкам на панели электронной таблицы с данными. На рис. 5П показано построение матричного графика, а на рис. 6П построение пиктографика “звезды”, с использованием этих кнопок.

 


Автор оригинала: Аветисян П.С., Сафарян И.А.
Источник оригинала: Журнал «Вестник РУДН» серия «Информатизация образования», 2007, №1

Новости
16.06.2017

Российский университет дружбы народов объявляет о проведение первой волны вступительных испытаний среди иностранных граждан для обучения на программах магистратуры на контрактной основе. Первая ...

13.10.2016

26 октября-27 октября 2016 года Российский университет дружбы народов проводит Международную конференцию «Сетевые университеты и международный рынок труда (пространства БРИКС, СНГ, ШОС)».

19.05.2016

The Peoples’ Friendship University of Russia (PFUR) announces the beginning of admission of foreign citizens who graduated from Bachelor and Specialist Degree programs of PFUR and other Russian and ...

19.05.2016

Российский университет дружбы народов (РУДН) объявляет о наборе иностранных граждан -выпускников бакалавриата и специалитета РУДН и других российских и зарубежных ВУЗов на программы магистратуры на ...

11.12.2015

Проект рекомендаций Семинара-совещания научной общественности по проблемам международного научно-технического и образовательного сотрудничества