Информационно-образовательный портал СОДРУЖЕСТВА НЕЗАВИСИМЫХ ГОСУДАРСТВ
ИНФОРМАТИЗАЦИЯ ОБРАЗОВАНИЯ
И ДИСТАНЦИОННОЕ ОБУЧЕНИЕ В СНГ
Информационно-образовательный портал СОДРУЖЕСТВА НЕЗАВИСИМЫХ ГОСУДАРСТВ  

Страны
Азербайджанская Республика
Республика Армения
Республика Беларусь
Республика Казахстан
Кыргызская Республика
Республика Молдова
Российская Федерация
Республика Таджикистан
Туркменистан
Республика Узбекистан
Украина

Типы материала
Информационно-коммуникационные технологии
Дополнительные информационные материалы
Нормативно-правовое обеспечение
Организация и методики обучения
Экономика образования
Межгосударственное сотрудничество
Образовательные центры
Методики обучения
Межвузовское сотрудничество
Повышение квалификации
Международные проекты и гранты, конкурсы
Конференции, симпозиумы, семинары и др.
Библиотека
 
Журнал «Вестник РУДН» серия «Информатизация образования»
 
2014, №4
2014, №3
2014, №2
2014, №1
2013, №4
2013, №3
2013, №2
2013, №1
2012, №4
2012, №3
2012, №2
2012, №1
2011, №4
2011, №3
2011, №2
2011, №1
2010, №4
2010, №3
2010, №2
2010, №1
2009, №4
2009, №3
2009, №2
2009, №1
2008, №4
2008, №3
2008, №2
2008, №1
2007, №4
2007, №3
2007, №2-3
2007, №1
2006, №1(3)
2005, №1(2)
2004, №1
Научные и специальные электронные ресурсы
Учебная, научная и специальная литература
Комиссия по дистанционному обучению совета по сотрудничеству в области образования государств-участников СНГ
Новости

Разработка и описание гипертекстового информационно-поискового тезауруса по алгебре


Аннотация
В статье описана разработка гипертекстового информационно-поискового тезауруса по алгебре в процессе конструирования гипертекстового информационно-поискового тезауруса метаязыка науки. Ключевые слова: алгебра, гипертекст, дефиниция, математика, метаязык, тезаурус.

Текст документа

И.В. Кузнецова

Кафедра математики и информатики

Коряжемский филиал Поморского государственного университета им. М.В. Ломоносова

 

С.В. Лесников

Кафедра математического моделирования и кибернетики

Сыктывкарский государственный университет

 

Особенностью моделируемого информационно-поискового тезауруса (далее ИПТ) является то, что сама его структура дает возможность пользователю осуществлять поиск информации не только по отдельным ключевым словам, но и по смысловым полям, разделам математики и терминологическим парадигмам.

Суть гипертекстового ИПТ по алгебре заключается в расширении возможностей современных поисковых систем для обеспечения запросов пользователей. Используя тезаурус, можно с достаточной степенью эффективности получать результаты поиска, соответствующие информационной потребности пользователя, уместности и состоятельности результатов. Программа выдает пользователю не только информацию о ресурсах, узуально и/или окказионально содержащих введенные ключевые слова, но и семантически связанные с ними термины, соответствующие дескрипторы, дефиниции, иллюстрации, интерпретации, леммы, объяснения, определения, понятия, разъяснения, толкования, трактовки, формулировки, экскурсы и эксцерпции. Программно сконструировав гиперссылки, на базе такого тезауруса можно также подсказать пользователю, по каким еще вокабулам целесообразно продолжить поиск (напр., антоним, гипероним, гипоним, квазисиноним, лексико-семантический вариант, мероним, холоним).

«Thesaurus (греч.) = научная коллекция; капитальный словарь» [3]. «Тезаурус (от греч. thesauros - сокровище, сокровищница) - 1) словарь, в котором максимально полно представлены все слова языка с исчерпывающим перечнем примеров их употребления в текстах; 2) идеографический словарь, в котором показаны семантические отношения (родо-видовые, синонимические и др.) между лексическими единицами» [4].  «Тезаурус (греч. thesauros - сокровище) - словарь для поиска какого-либо слова по его смысловой связи с другими словами… 1) лингвистический тезаурус - словарь, содержащий перечень слов естественного языка, отобранных в результате содержательного анализа текстов и систематизированных в соответствии с принятой классификационной системой, 2) статистический тезаурус - информационно-поисковый словарь, содержащий перечень слов, отобранных в результате статистического анализа текстов по какой-либо определенной тематике и сгруппированных в словарные статьи на основе частоты совместной встречаемости этих слов в одних и тех же текстах (документах)» [1]. «ТЕЗаУРУС (др.греч. θησαυρ?ς сокровище, запас) 1) словарь, в котором максимально полно представлены слова языка с примерами их употребления (в полном объеме возможен только для мертвых языков); 2) полный систематизированный набор данных по к.-л. теме, обычно с указанием семантических отношений между лексическими единицами» [2].

Современной тезаурус - это особая разновидность словарей общей или специальной лексики, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т.п.) между лексическими единицами. Тезаурусы в электронном формате являются одним из действенных инструментов для описания отдельных предметных областей и создания информационно-поисковых систем. Первым тезаурусом в современном смысле слова фактически был английский Тезаурус Роже (англ. Roget’s Thesaurus, оригинальное название Thesaurus of English Words and Phrases - «Тезаурус английских слов и фраз»), составленный британским лексикографом Питером Марком Роже около 1805 г. и опубликованным в 1852 г.)  [5].

Словарь П. Роже - это свод английской лексики, в котором выделены 6 тематических классов, разбитых в свою очередь на 24 подкласса, каждый из которых представляет собой объединение более мелких семантических групп (1000 тем). При этом возможны пересечения классов. Темы - типовые семантические контексты для слов; класс семантических контекстов слова - множество тем, которые могут быть ему приписаны.

В гипертекстовом ИПТ по алгебре (в формате компьютерного, гипертекстового тезауруса /ГИЗАУРУСА/ - базе данных с перекрестными гипертекстовыми ссылками) дается определение (дефиниция, иллюстрация, интерпретация, объяснение, понятие, пояснение, разъяснение, толкование, трактовка, формулировка, цитата, экскурс и/или эксцерпция) ключевых понятий-терминов, относящихся к сфере алгебры и ряду смежных дисциплин, которые в той или иной мере связаны с ее проблемами. Конструирование тезауруса обусловлено необходимостью единства в терминологии - нередко учёные одно и то же явление называют по-разному, с другой стороны, один и тот же термин бывает полисемичен даже в рамках одной научной области. Кроме этого, при анализе уже опубликованных терминологических словарей определенной науки бросается в глаза лакунарность состава словников и некая тенденциозность подачи научных материалов авторами-составителями. Фактически речь идет о составлении метаязыка науки - особого языка, объектом которого является содержание и выражение другого языка, т.е. в нашем случае метаязык - это язык второго порядка как специальная семиологическая система, употребляемая тогда, когда надо говорить о естественном (или искусственном) языке же, выступающем в качестве «языка-объекта».

При этом можно отдельно выделить в метаязыке следующее:

1) собственно термины (слова, которые или совсем не употребляются в языке-объекте, либо приобретают, после заимствования из языка-объекта, особое значение);

2) с??четания слов, которые характеризуют собственно метаязык определенной науки в его полном виде (напр., составные термины);

3) определенный социально-предметный аспект (напр., когда метаречь отражает специфику эпохи, того или иного научного направления, школы).

Одноязычный ИПТ - словарь лексических единиц дескрипторного языка, основанный на лексике одного естественного языка, отображающий семантические отношения между лексическими единицами (выбранные для использования в ИПТ слова, словосочетания или лексически значимые компоненты сложных слов естественного языка) и предназначенный для организации поиска информации путем индексирования документов и/или запросов. Главной целью создания ИПТ является повышение показателей качества поиска информации в автоматизированных информационно-поисковых системах. Тезаурусы, как правило, используют в своей работе специалисты, в той или иной степени связанные с подготовкой и обработкой текстовой информации: переводчики, редакторы, научные работники, референты и др. В свою очередь, ИПТ используются при индексировании документов и запросов.

Индексирование можно осуществлять следующими способами:

1) бестезаурусно - поисковый образ документа представляется в виде списка ключевых слов, выбранных непосредственно из текста документа (требуется меньше времени и менее трудоемко, но возможна синонимия и нельзя отразить парадигматические отношения);

2) с тезаурусным контролем лексики для выражения содержания документа и запроса - используются только дескрипторы, входящие в ИПТ (позволяет исключить синонимию и учесть парадигматические связи, что, естественно, повышает эффективность поиска).

ИПТ подразделяют на два типа:

1) выделяющие среди своих лексических единиц дескрипторы (лексическая единица ИПТ, предназначенная для использования в поисковых образах документов и/или запросов) и аскрипторы (недескриптор – лексическая единица ИПТ, которая в поисковых образах документов (запросов) подлежит замене на дескриптор при поиске или обработке информации);

2) все лексические единицы, которые являются дескрипторами.

ИПТ может быть применен для:

а) перевода текста с естественного языка на дескрипторный информационно-поисковый язык путем замены ключевых слов соответствующими дескрипторами, при этом исключается многозначность;

б) отображения парадигматических связей между дескрипторами.

Правила разработки, структура, состав и форма представления ИПТ определены ГОСТ 7.25-80 (Постановлением Государственного комитета СССР по стандартам от 31 декабря 1980 г. N 6340 срок введения установлен с 01.01. 1982 г.) и ориентированы на использование лексики русского языка и разрабатываемых в рамках автоматизированных систем научно-технической информации.

Построение ИПТ состоит из следующих этапов: 1) определение тематического охвата ИПТ; 2) сбор массива лексических единиц; 3) формирование словника ИПТ; 4) построение словарных статей и указателей; 5) оформление ИПТ; 6) экспертиза и регистрация ИПТ.

В базе данных разработанного ИПТ по алгебре выделено несколько разделов: основные алгебраические структуры, кольцо многочленов от одной переменной, матрицы, отношения и отображения, системы линейных уравнений, многочлены над числовыми полями, а также отдельно сформирован электронный словарь-справочник основных понятий, определений и теорем по алгебре. 

При разработке данной ИПТ были использованы программные средства Visual Basic и СУБД Microsoft Access. Перед тем как начать работу с ИПТ по алгебре, необходимо установить программу и базу данных на компьютере. Для этого двойным щелчком запускаем мастер установки программы (файл «Установка ИСС»). После соблюдения всех пунктов установки, можно приступать к работе с данной программой. Работа с ИПТ по алгебре начинается с главной формы, на которой написано ее название. На приветственной форме находятся две кнопки «Запустить программу» и «Выход».

После запуска программы нужно заполнить базу данных интересующей нас информацией. Но для этого можно или сначала создать новую базу данных или использовать уже имеющуюся. На панели инструментов находится кнопка «Создать базу данных», при нажатии на нее появится окно, в котором необходимо указать путь, по которому будет храниться новая база данных, и указать ее имя в строке «Имя файла».

После того, как создали базу данных, появляется форма, в которой спрашивается, сколько таблиц будет содержать создаваемая база данных. Поскольку будет создаваться только одна таблица, после нажатия на кнопку «Нет» появится еще одна форма, в которой нужно указать имя  создаваемой таблицы. Для того чтобы вносить информацию, необходимо созда??ь столбцы и строки, далее необходимо указать поля таблицы, для это??о нужно щелкнуть правой кнопкой мыши по заголовку таблицы. В раскрывшемся списке необходимо выбрать пункт «Добавить новое поле», после этого появится столбец, необходимо указать его название и нажать клавишу «Ввод (Enter)» для подтверждения имени поля. Эту же операцию повторять столько раз, сколько необходимо иметь столбцов. В сконструированном ИПТ по алгебре имеем четыре столбца со следующими именами: «Понятия и теоремы», «Формулировка», «Литература», «Некоторые примеры и доказательства теорем». Аналогично тому, как создавались столбцы для таблицы, создаются  строки и заполняются соответствующей информацией. Количество строк в данной таблице не ограничено.

После заполнения всей таблицы необходимо сохранить базу данных. Для этого на панели инструментов существует кнопка «Сохранить изменения». При нажатии на эту кнопку база данных сохранится. Но если вдруг забыли сохранить все то, что ввели, и решили создать или открыть другую базу данных, то появится предупреждение о том, что несохраненные данные будут утеряны. После сохранения всей внесенной информации можно закрывать программу. Вся информация будет храниться в таблице базы данных, которую создавали в начале работы с программой.

Итак, база данных создана, таблица заполнена соответствующей информацией и сохранена. Теперь можно приступать к самой работе программы, с использованием ранее созданной базы данных. После запуска программы появляется приветственная форма, на которой написано ее название. Также на этой форме находится кнопка «Запуск программы», при нажатии на которую происходит запуск самой программы. Но данная форма пустая, для того чтобы ее заполнить, нужно открыть соответствующую базу данных. Сделать это можно с помощью кнопки на панели инструментов «Открыть базу данных». Нажав на данную кнопку, появится окно «Открыть файл». В открывшемся окне можно указать путь, по которому сохраняли базу данных.

Существует еще один способ открытия базы данных. Ниже панели инструментов находится строка с надписью «Быстрый доступ к базе данных» и поле со стрелочкой. При нажатии на эту стрелку появляется список. В раскрывшемся списке находятся пути хранения баз данных, которые были созданы с помощью данной программы. В этом списке находим нужную базу данных, наводим на нее курсор мыши и левой кнопкой мыши активизируем её. При нажатии в первом столбце по любому разделу во втором столбце появятся соответствующие данному разделу понятия и теоремы.

Поиск дефиниций в созданной базе данных может осуществляться двумя способами. Первый из них предусматривает последовательный просмотр вручную всех имеющихся в ИПТ данных. Для этого с правой стороны таблицы есть полоса прокрутки, с помощью которой можно двигаться сверху вниз, и внизу таблицы, чтобы двигаться слева направо. При нажатии в первом столбце по любому разделу во втором столбце появятся соответствующие данному разделу понятия и теоремы.

Второй способ состоит в наборе нужного слова в специальном “окне”. Для этого на панели инструментов есть п??ле, в которое необходимо ввести то понятие, которое нужно найти (рис.1). После ввода необходимой для поиска информации, надо нажать на кнопку «Начать поиск», которая находится слева от строки ввода.

 

Рис. 1. Результат поиска дефиниций в ИПТ

 

Сконструированный гипертекстовый ИПТ по алгебре совместим с разными версиями, например, Windows XP и  Windows 7. ИПТ можно редактировать. Для этого необходимо переключиться в режим редактора с помощью кнопки на панели инструментов «Редактировать». И только после этого можно вносить любые изменения: добавлять, удалять, переименовывать названия таблиц, строк и столбцов и т.д.

Допустим, что при создании базы данных, была допущена ошибка в названии таблицы. Чтобы изменить название данной таблицы, для этого нужно навести курсором мыши на данное название и правой кнопкой мыши нажать по нему. В раскрывшемся списке необходимо выбрать пункт «Переименовать таблицу», после этого можно изменить название таблицы и подтвердить ввод клавишей «Ввод (Enter)». А если нужно удалить одну из строк какого-либо раздела, то сначала нужно выбрать этот раздел, в котором находиться эта строка, навести на нее курсор и правой кнопкой мыши активизировать соответствующий раздел. В раскрывшемся списке выбрать пункт «Удалить строку полностью». Данная строка из этого раздела удалится.

При добавлении строк в базу данных необходимо выбрать в раскрывшемся списке пункт «Добавить новую строку». Новая строка появится в самом конце таблицы. В эту строку соответственно столбцам вносим необходимую информацию. После  всех  внесенных  в  базу  данных  изменений, необходимо сохранить базу данных, иначе она останется такой, какой была до изменения.

Таким образом, в режиме «Редактор» можно выполнять много действий над базой данных. Это очень удоб??о, позволяет держать базу данных в актуальном состоянии, обновлять ее, добавлять недостающую информацию или наоборот удалять из нее, что-то лишнее. На панели инструментов есть еще одна кнопка «Настройки», которая находится после строки ввода для поиска. При нажатии на данную кнопку появляется форма, которая разбита на две части: левую и правую. В левой части формы находится цветовая схема. С помощью данной схемы можно менять цвет оформления самой программы. Первые пять цветов уже заданы в самой программе, а шестой можно задать самим. Чтобы выбрать один из заданных цветов, для этого нужно с левой части названия цветов на кружок навести курсор и левой кнопкой мыши выбрать тот цвет, который вам нужен, после выбора цвета нужно нажать внизу формы на кнопку «Применить».


Если нужно, чтобы база данных загружалась автоматически при загрузке программы, то необходимо установить галочку напротив надписи «Загружать БД по умолчанию» и ниже в поле ввести путь хранения той базы данных, которая должна загружаться, нажать кнопку внизу формы «Применить». Это удобно тогда, когда постоянно работаете только с одной базой данных. Если работаем с несколькими базами данных, то лучше всего поставить галочку перед надписью «Вести учёт загружаемых файлов в списке быстрого доступа». Тогда все базы данных, которые были обработаны с помощью данной программы, будут отражаться в списке быстрого доступа к базе данных. Это очень удобно для переключения с одной базы данных на другую, не придется затрачивать много времени на поиск необходимой базы данных.

Разработанный гипертекстовый ИПТ по алгебре является своего рода инструментальной программной оболочкой, к дидактическим функциям которой относятся информационная, систематизирующая и самообразовательная составляющие. Использование ИПТ в учебном процессе по алгебре позволит индивидуализировать обучение, сформировать информационную культуру, подготовить обучаемых к жизни в  современном информационном обществе.

Процесс использования гипертекстового ИПТ в целом напоминает обычную работу в системе Интернет, но в локальном варианте на персональном компьютере. В перспективе предполагается, что, после необходимой апробации в локальном варианте в режиме диалога, сконструированный тезаурус будет доступен и в Интернете, напр., по адресам http://lsw.ru, http://ЛСВ.РФ.

ЛИТЕРАТУРА

[1] Кондаков Н.И. Логический словарь-справочник / Отв. ред. Д.П. Горский. М.: Наука, 1975. – С. 587.

[2] Новейший словарь иностранных слов и выражений. – М.: Современный литератор, 2005. – С. 786.

[3] Смирнов В. Полный словарь иностранных слов, вошедших в русский язык с общедоступным толкованием их значения и употребления, и со включением отдельных слов и фраз, употребляющихся в устной и письменной речи в их оригинальной иностранной форме. – М.:  Издание торгового дома В. Коновалова и К, 1908. – С. 730.

[4] Шайкевич А.Я. Тезаурус // Лингвистический энциклопедический словарь. – М.: Советская энциклопедия, 1990. – С. 506.

[5] Roget P.M. Thesaurus of English Words and Phrases. – New ed. N.Y., 1964 // URL: http://www.gutenberg.org/files/10681/10681-body.txt


Автор оригинала: И.В. Кузнецова, С.В. Лесников
Источник оригинала: Журнал Вестник РУДН серия «Информатизация образования», №3, 2011

Новости
16.06.2017

Российский университет дружбы народов объявляет о проведение первой волны вступительных испытаний среди иностранных граждан для обучения на программах магистратуры на контрактной основе. Первая ...

13.10.2016

26 октября-27 октября 2016 года Российский университет дружбы народов проводит Международную конференцию «Сетевые университеты и международный рынок труда (пространства БРИКС, СНГ, ШОС)».

19.05.2016

The Peoples’ Friendship University of Russia (PFUR) announces the beginning of admission of foreign citizens who graduated from Bachelor and Specialist Degree programs of PFUR and other Russian and ...

19.05.2016

Российский университет дружбы народов (РУДН) объявляет о наборе иностранных граждан -выпускников бакалавриата и специалитета РУДН и других российских и зарубежных ВУЗов на программы магистратуры на ...

11.12.2015

Проект рекомендаций Семинара-совещания научной общественности по проблемам международного научно-технического и образовательного сотрудничества