Информационно-образовательный портал СОДРУЖЕСТВА НЕЗАВИСИМЫХ ГОСУДАРСТВ
ИНФОРМАТИЗАЦИЯ ОБРАЗОВАНИЯ
И ДИСТАНЦИОННОЕ ОБУЧЕНИЕ В СНГ
Информационно-образовательный портал СОДРУЖЕСТВА НЕЗАВИСИМЫХ ГОСУДАРСТВ  

Страны
Азербайджанская Республика
Республика Армения
Республика Беларусь
Республика Казахстан
Кыргызская Республика
Республика Молдова
Российская Федерация
Республика Таджикистан
Туркменистан
Республика Узбекистан
Украина

Типы материала
Информационно-коммуникационные технологии
Дополнительные информационные материалы
Нормативно-правовое обеспечение
Организация и методики обучения
Экономика образования
Межгосударственное сотрудничество
Образовательные центры
Методики обучения
Межвузовское сотрудничество
Повышение квалификации
Международные проекты и гранты, конкурсы
Конференции, симпозиумы, семинары и др.
Библиотека
 
Журнал «Вестник РУДН» серия «Информатизация образования»
 
2014, №4
2014, №3
2014, №2
2014, №1
2013, №4
2013, №3
2013, №2
2013, №1
2012, №4
2012, №3
2012, №2
2012, №1
2011, №4
2011, №3
2011, №2
2011, №1
2010, №4
2010, №3
2010, №2
2010, №1
2009, №4
2009, №3
2009, №2
2009, №1
2008, №4
2008, №3
2008, №2
2008, №1
2007, №4
2007, №3
2007, №2-3
2007, №1
2006, №1(3)
2005, №1(2)
2004, №1
Научные и специальные электронные ресурсы
Учебная, научная и специальная литература
Комиссия по дистанционному обучению совета по сотрудничеству в области образования государств-участников СНГ
Новости

Создание прототипа электронного образовательного ресурса по информатике на основе лингвистической онтологии предметной области


Аннотация
В статье рассматривается механизм создания прототипа электронного образовательного ресурса по информатике на основе лингвистической онтологии предметной области. Ключевые слова: онтология, информатика, термин, информация.

Текст документа

А.В. Абрамов

кафедра программного обеспечения и администрирования информационных систем

Курский государственный университет

 

В [1] рассматривается механизм накопления терминологической базы образовательной предметной области для цели создания лингвистической онтологии по информатике. Напомним некоторые основные моменты, отраженные в предыдущей публикации. Итак, под лингвистической онтологией – понимается иерархическая сеть терминов. Каждое понятие связывается отношениями с другими понятиями лингвистической онтологии. Процесс создания лингвистической онтологии состоит из следующих этапов: формирование терминологической базы некоторой предметной области по массиву текстовой информации; анализ полученной информации человеком экспертом, с целью «фильтрации» терминов, и указания определения данных терминов; установление человеком экспертом отношений между набором терминов предметной области.

В результате выполнения данных этапов на выходе системы получаем множество слов – «кандидатов» вида:  где:  - слово-«кандидат»;  - вес «кандидата». Далее в модуле редактирования терминов (рис. 1) человеком экспертом осуществляется «фильтрация» терминов, указание соответствующих им определений, установление отношений между набором терминов предметной области. На завершающем этапе формируется выходной файл лингвистической онтологии, представляющий собой совокупность терминов рассматриваемых в данном курсе информатики, их определений и словоформ, а также частоты их встречаемости в обрабатываемом тексте.

Рис.1. Модуль редактирования онтологии

Структура данного файла представлена в виде схемы на рис. 2.

 

 

Рис.2. Структура файла лингвистической онтологии по информатике

 

После этого файл, содержащий лингвистическую онтологию по информатике, передается в модуль создания HTML страницы ( рис. 3).

 

Рис. 3. Модуль редактирования лингвистической онтологии.

 

При запуске данного модуля файл онтологии подгружается в оперативную память в специально организованную динамическую структуру, оптимизированную для процесса преобразования текста из предметной области в html-страницу.

В данной структуре предусмотрены поля для хранения всех данных, находящихся в файле онтологии, а также поле, хранящее ссылку на список индексов термина. Под словом «индекс» в данном контексте понимается упорядоченная пара целых чисел (m,n), где m – номер предложения, содержащего термин, а n – номер слова в данном предложении. Данный список динамически заполняется для каждого обрабатываемого текста.

Таким образом, лингвистическая онтология по информатике, с точки зрения организации динамической памяти, представляет собой трехмерную совокупность данных: список терминов, список словоформ терминов, список индексов для всех словоформ. Схема рассматриваемой динамической структуры данных лингвистической онтологии представлена на рис. 4.

 

Рис. 4. Структура данных лингвистической онтологии по информатике

 

Процесс нахождения всех возможных вхождений терминов онтологии (а также их словоформ) в тексте основывается на его графематическом анализе. Текстовая информация обрабатывается посимвольно и при каждом событии выделения очередной лексемы проверяется её эквивалентность (с учетом словоформ) терминам из онтологии. При успешной проверке текущие значения номера предложения и номера слова в предложении заносятся в список индексов для данного термина.

Для хранения вышеупомянутых номеров используется два временных целочисленных счетчика. Первый счетчик хранит номер предложения. Он изменяется на основе анализа встречаемости точек в тексте. Второй счетчик – номер слова в предложении – инкрементируется при каждом событии выделения лексемы и сбрасывается при увеличении номера предложения. На рис. 5 изображена обобщенная схема алгоритма индексирования терминов в тексте.

 

Рис. 5. Схема алгоритма индексирования

 

По завершении процесса обработки динамическая структура терминов онтологии содержит всю необходимую информацию для генерации html-страницы которая будет содержать термины предметной области с их определением, с возможностью перехода по ссылкам ниже на уровень, содержащий подробную информацию о данном термине (рис. 6).

Рис. 6. HTML – страница с терминами

 

В данной статье была рассмотрена лингвистическая онтология предметной области, используемая в качестве средства создания электронного образовательного ресурса по информатике на основе гипертекстовой модели позволяющая получать при анализе только релевантные данные и «не замечать» информацию, не представляющую интереса. Также на примере разработанного программного комплекса «DisOnto» охарактеризовали этапы создания электронного образовательного ресурса по информатике использующего гипертекстовую модель.

ЛИТЕРАТУРА

[1]  Абрамов А.В. Создание лингвистической онтологии образовательной предметной области. 2010 // URL: http://scientific-notes.ru/pdf/014-5.pdf


Автор оригинала: А.В. Абрамов
Источник оригинала: Журнал Вестник РУДН серия «Информатизация образования», №2, 2011

Новости
16.06.2017

Российский университет дружбы народов объявляет о проведение первой волны вступительных испытаний среди иностранных граждан для обучения на программах магистратуры на контрактной основе. Первая ...

13.10.2016

26 октября-27 октября 2016 года Российский университет дружбы народов проводит Международную конференцию «Сетевые университеты и международный рынок труда (пространства БРИКС, СНГ, ШОС)».

19.05.2016

The Peoples’ Friendship University of Russia (PFUR) announces the beginning of admission of foreign citizens who graduated from Bachelor and Specialist Degree programs of PFUR and other Russian and ...

19.05.2016

Российский университет дружбы народов (РУДН) объявляет о наборе иностранных граждан -выпускников бакалавриата и специалитета РУДН и других российских и зарубежных ВУЗов на программы магистратуры на ...

11.12.2015

Проект рекомендаций Семинара-совещания научной общественности по проблемам международного научно-технического и образовательного сотрудничества