Е. В. Жаркова Пензенская государственная технологическая академия



Скачать 36,29 Kb.
Дата29.10.2016
Размер36,29 Kb.
Жаркова Е.В. Вопросы применения технологии Text Mining для анализа соответствия образовательных программ требованиям к специалистам. // Проблемы информатики в образовании, управлении, экономике и технике: Сб. статей Междунар. научно-техн. конф.– Пенза: ПДЗ, 2010. – С. 97-99.
ВОПРОСЫ ПРИМЕНЕНИЯ ТЕХНОЛОГИИ TEXT MINING
ДЛЯ АНАЛИЗА СООТВЕТСТВИЯ
ОБРАЗОВАТЕЛЬНЫХ ПРОГРАММ
ТРЕБОВАНИЯМ К СПЕЦИАЛИСТАМ

Е.В. Жаркова

Пензенская государственная технологическая академия,
г. Пенза, Россия

Изложены основные методы и задачи технологии Text Mining, которая может применяться для автоматизированного сопоставления текста документов образовательных стандартов с текстами документов, содержащих требования работодателей к специалистам. Технология предназначена для проведения смыслового анализа, обеспечения навигации и поиска нужной информации в неструктурированных текстах.


Zharkova E.V. The matters of text mining technology for the analysis of accordance educational programs and requirements for specialists. The basic methods and problems of the Text Mining technology for automated text-matching educational standards documents with the texts of the employers’ requirements for specialists are described. The technology is designed for the semantic analysis, providing navigation and retrieval of relevant information in unstructured texts.
Сегодня часто можно услышать, что квалификация молодых специалистов, выпускаемых вузами, не соответствует требованиям работодателей. По данным исследований независимого рейтингового агентства «РейтОр», почти 70% опрошенных работодателей отмечают необходимость дополнительной подготовки молодых специалистов. Среди основных причин необходимости дополнительной подготовки молодых специалистов работодатели отмечают общий недостаток знаний, недостаток специальных знаний, недостаток практических навыков, отсутствие опыта, оторванность знаний от производства [1]. Для устранения указанных недостатков руководители большинства вузов считают, что для подготовки качественных специалистов необходимо согласование образовательных стандартов с требованиями бизнеса.

Одним из способов определения соответствия требований работодателей к специалисту и квалификационных характеристик специалиста, описанных в федеральном государственном образовательном стандарте, является анализ текста объявлений о вакансиях рабочих мест. В настоящее время разработаны методы извлечения знаний из документов, представленных в текстовом виде [2], которые позволяют автоматизировать задачу анализа. Для эффективного анализа неструктурированного текста применяются технологии Text Mining, которые предназначены для проведения смыслового анализа, обеспечения навигации и поиска нужной информации в неструктурированных текстах. В методах технологии глубинного анализа текста широко используется методология и подходы технологии добычи данных Data Mining. Ландэ Д. в работе «Добыча знаний» отмечает, что для технологии добычи текстов справедливо определение, данное Пятецким-Шапиро Г. для технологии добычи данных – «процесс обнаружения в сырых данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности» [3]. Являясь когнитивной технологией, Text Mining представляет собой алгоритмическое выявление прежде неизвестных связей и корреляций в уже имеющихся текстовых данных.

Как указано в работе [3], в соответствии с уже сложившейся методологией к основным элементам Text Mining относятся суммаризация (summarization), выделение феноменов, понятий (feature extraction), кластеризация (clustering), классификация (classification), ответ на запросы (question answering), тематическое индексирование (thematic indexing) и поиск по ключевым словам (keyword searching). Также в некоторых случаях набор дополняют средства поддержки и создания таксономии (oftaxonomies) и тезаурусов (thesauri). К задачам, которые решает Text

Mining, относят: нахождение шаблонов данных, получение структурированной информации, построение иерархий объектов, классификация и кластеризация данных, определение тематики или области знаний, автоматическое реферирование документов, задачи автоматической фильтрации контента, определение семантических связей и другие. Для решения задач Text Mining используют статистические методы, методы интерполяции, аппроксимации и экстраполяции, нечеткие методы, методы контент-анализа. Одним из основных видов приложений Text Mining является задача кластеризации – выделение компактных подгрупп объектов с близкими свойствами. Система должна самостоятельно найти признаки и разделить объекты по подгруппам. В процессе кластеризации строится базис ссылок от документа к документу, основанный на весах и совместном употреблении определяемых ключевых слов. Кластеризация сегодня применяется при реферировании больших документальных массивов, определении взаимосвязанных групп документов, упрощении процесса просмотра при поиске необходимой информации, нахождении уникальных документов из коллекции, выявлении дубликатов или очень близких по содержанию документов [4]. Для решения рассматриваемой задачи могут быть использованы методы кластеризации данных, для интерпретации результатов большое значение имеет визуализация данных, используемая для представления контента всего массива документов, а также в качестве навигационного механизма.

Библиографический список

1. Артюшина И.А., Шутилин В.А. Выпускники вузов юга России на региональном рынке: оценки работодателей // Официальный сайт издательства «Аккредитация в образовании». – http://www.akvobr.ru/


index.php?page=6&subpage=4&p=2&mag=22&list=2&article=49 (дата обращения 21.09.2010).

2. Башмаков А.И., Башмаков И.А. Интеллектуальные информационные технологии: учеб. пособие. – М.: МГТУ им. Н.Э. Баумана, 2005. – 304 с.



3. Ландэ Д.В. Основы интеграции информационных потоков. – К.: Инжиниринг, 2006. – 240 с.

4. Ландэ Д.В., Снарский А.А., Безсуднов И.В. Интернетика: Навигация в сложных сетях: модели и алгоритмы. – M.: Либроком, 2009. – 264 с.

Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©grazit.ru 2017
обратиться к администрации

    Главная страница