Лекция 1 Место и назначение лингвистического обеспечения в информационных системах



страница1/9
Дата29.10.2016
Размер1,61 Mb.
ТипЛекция
  1   2   3   4   5   6   7   8   9
Лекция 1

Место и назначение лингвистического обеспечения в информационных системах.

Понятие информационной системы.

Под системой понимают любой объект, который одновременно рассматривается и как единое целое, и как объединенная в интересах достижения поставленных целей совокупность разнородных элементов. Системы значительно отличаются между собой как по составу, так и по главным целям.

В информатике понятие "система" широко распространено и имеет множество смысловых значений. Чаще всего оно используется применительно к набору технических средств и программ. Системой может называться аппаратная часть компьютера. Системой может также считаться множество программ для решения конкретных прикладных задач, дополненных процедурами ведения документации и управления расчетами.

Приведем несколько систем, состоящих из разных элементов и направленных на реализацию разных целей.



Система

Элементы системы

Главная цель системы

Фирма

Люди, оборудование, материалы, здания и др.

Производство товаров

Компьютер

Электронные и электромеханические элементы, линии связи и др.

Обработка данных

Телекоммуникационная система

Компьютеры, модемы, кабели, сетевое программное обеспечение и др.

Передача информации

Информационная система

Компьютеры, компьютерные сети, люди, информационное и программное обеспечение

Производство профессиональной информации

В информатике понятие "система" широко распространено и имеет множество смысловых значений. Чаще всего оно используется применительно к набору технических средств и программ. Системой может называться аппаратная часть компьютера. Системой может также считаться множество программ для решения конкретных прикладных задач, дополненных процедурами ведения документации и управления расчетами.

Добавление к понятию "система" слова "информационная" отражает цель ее создания и функционирования. Информационные системы обеспечивают сбор, хранение, обработку, поиск, выдачу информации, необходимой в процессе принятия решений задач из любой области. Они помогают анализировать проблемы и создавать новые продукты.

Информационная система — взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки и выдачи информации в интересах достижения поставленной цели.

Структуру информационной системы составляет совокупность отдельных ее частей, называемых подсистемами.



Подсистема — это часть системы, выделенная по какому-либо признаку.

Общую структуру информационной системы можно рассматривать как совокупность подсистем независимо от сферы применения. В этом случае говорят о структурном признаке классификации, а подсистемы называют обеспечивающими. Таким образом, структура любой информационной системы может быть представлена совокупностью обеспечивающих подсистем.





Информационное обеспечение — совокупность единой системы классификации и кодирования информации, унифицированных систем документации, схем информационных потоков, циркулирующих в организации, а также методология построения баз данных.

Техническое обеспечение — комплекс технических средств, предназначенных для работы информационной системы, а также соответствующая документация на эти средства и технологические процессы.

Математическое и программное обеспечение — совокупность математических методов, моделей, алгоритмов и программ для реализации целей и задач информационной системы, а также нормального функционирования комплекса технических средств.

Организационное обеспечение — совокупность методов и средств, регламентирующих взаимодействие работников с техническими средствами
и между собой в процессе разработки и эксплуатации информационной
системы.

Правовое обеспечение — совокупность правовых норм, определяющих создание, юридический статус и функционирование информационных систем, регламентирующих порядок получения, преобразования и использования информации.

Формальный язык – это знаковая система для описания и обмена информацией между людьми, человеком и ЭВМ, различными автоматическими устройствами.

Лингвистическое обеспечение образуется следующими языками:


  программирования;
  управления;
  проектирования.

Языки программирования необходимы для создания программного обеспечения при разработке ИС.

Языки управления служат для управления ЭВМ, периферийными устройствами.

Языки проектирования  ориентированы на пользователей-проектировщиков и предназначены для эксплуатации ИС. Эта группа языков условно делится на входные, внутренние и выходные. Входные языки являются средством взаимодействия конечного пользователя с ИС, например, в ходе подготовки исходных данных или формулировки проблемы.

Внутренние языки обычно скрыты от рядового пользователя и служат для представления информации, передаваемой между различными подсистемами ИС и ЭВМ. 

Выходные языки  обеспечивают оформление результатов проектирования в текстовом или графическом виде.

Первичными элементами любого языка являются знаки, символы. Заданную конечную их совокупность называют алфавитом. Символы алфавита разделяют на буквы, цифры и специальные знаки (препинания, разделительные, арифметические и логические операции и т. п.).

Определенные сочетания символов алфавита образуют слова, из которых составляется словарь языка. Сочетания цифр с десятичной точкой или без нее образуют числа. Слова и числа при помощи специальных знаков объединяются в предложения, а предложения – в тексты.

Правила построения слов называют морфологией языка. В этих правилах предусматривается представление слова в виде префикса, основы и постфикса. В любом языке можно выделить конечные множества определяющих элементов слова и указать конечное число правил формирования из них всего многообразия слов языка.

На практике это многообразие часто становится труднообозримым, поэтому ограничиваются использованием специально построенных лексик, составленных из наиболее характерных слов словаря – лексем.

В действующих ИС находят применение формальные языки разного уровня сложности и назначения, соответственно многообразию различных задач, решаемых в проектировании.



Базовое лингвистическое обеспечение является языковой основой программного обеспечения ИС и состоит в основном из действующих языков программирования, с помощью которых в комплексе средств ИС, реализуются вычислительные и моделирующие процедуры обобщенного алгоритма проектирования, а также обеспечивается решение сервисных задач.

Управляющее лингвистическое обеспечение  состоит из специализированных проблемно-ориентированных языков, которые описывают обобщенный алгоритм проектирования в терминах проектных операций, процедур и задач. В этих языках формируются словарь, синтаксис и семантика, существенно связанные с конкретной предметной областью проектирования.

Языкам управляющей части лингвистического обеспечения должна соответствовать определенная система агрегирования элементов базового обеспечения. Только при согласовании словарных составов и грамматик управляющих и базовых языков возможна исполнение в системе проблемно-ориентированных заданий.

Для осуществления такого рода связи (перевода директив проектирования с одних языков на другие) приходится создавать специализированные программные комплексы – языковые процессоры.

Управляющее лингвистическое обеспечение и языковые процессоры обычно реализуются в ИС в составе управляющих мониторов, через которые проектировщик и комплекс средств ИС осуществляют свое взаимодействие в процессе проектирования.

Работа мониторов обеспечивается, в основном, обычными языками программирования. Она ложится дополнительной нагрузкой на располагаемые вычислительные и иные возможности комплекса средств ИС. Однако при хорошей организации проблемно-ориентированных языков и их трансляции, достигаемые положительные эффекты значительно превосходят потери.



Лекция 2

Управляющее лингвистическое обеспечение.

Управляющее лингвистическое обеспечение ИС, описывая обобщенный алгоритм, предоставляет словарный состав, синтаксис и семантику языковых средств основных операций той или иной типовой процедуры.

Можно говорить о языковых средствах описания целей, исходных данных, описания объектов, моделей их функционирования, алгоритмов поиска проектных решений и формирования выходных документов. Состав и содержание этих средств определяются в процессе типизации и унификации всего многообразия информации и алгоритмов ее обработки в проблемной области.

Типизация и унификация позволяют выделить конечные множества элементарных данных и операций с их наименованиями и смысловыми значениями, а также синтаксические и семантические правила описания структурных данных и операций.

В зависимости от степени формализации тех или иных задач обобщенного алгоритма удовлетворение требований осуществляется в условиях пакетного или диалогового режимов функционирования комплекса средств ИС.



Языки пакетного режима (или пассивные языки) ориентированы на автоматическое решение полностью формализованных задач. В состав этих языков включаются средства формулирования задач, достаточные для их однозначного решения в приемлемое время.

Если задачи тех или иных фрагментов обобщенного алгоритма не поддаются полной формализации, то используются языки диалогового режима (или диалоговые языки). Они относятся к числу основных в ИС, позволяя проектировщику принимать и сообщать системе решения по отработке неформализуемых участков алгоритма проектирования.

Состав языковых средств диалогового взаимодействия существенно зависит от принятой стратегии распределения функций управления человеком и комплексом средств ИС.

В зависимости от распределения этих функций различают три основных вида человеко-машинного общения.



«Ведущая – ЭВМ». Здесь система посредством специальных сообщений запрашивает необходимые описания объекта, либо указывает возможные пути решения задачи и требует от проектировщика конкретизации задания. Эти сообщения оформляются на естественном языке пользователя с соблюдением требования, однозначного толкования их смыслового содержания.

«Ведущий – проектировщик». Здесь пользователь на специальном языке задает для ЭВМ последовательность операций и процедур обработки указываемой информации. Этот вид общения требует от проектировщика четкого знания алгоритма и возможностей используемого комплекса ИС.

«Равные партнеры». Здесь реализуется двухстороннее управление алгоритмом, в котором, в зависимости от ситуации, принятие решений о дальнейшем ходе проектирования осуществляет либо человек, либо ЭВМ. Этот вид общения является наиболее эффективным с точки зрения достижения целей.

Диалоговые языки, ориентированные на взаимодействие по принципу «Ведущая – ЭВМ», наибольшее распространение получили в так называемых запрос-ответных языках. В зависимости от формы запроса различают языки «Выбор из меню» и «Заполни пустые места».

Более широкими возможностями организации диалога обладают директивные языки, реализующие взаимодействие по принципу «Ведущий – проектировщик». Основной синтаксической единицей этих языков является директива, которая представляет собою управляющее предложение фиксированной структуры. Каждая директива позволяет задать определенное действие по управлению процессом.

Более широкими возможностями организации диалога обладают директивные языки, реализующие взаимодействие по принципу «Ведущий – проектировщик». Основной синтаксической единицей этих языков является директива, которая представляет собою управляющее предложение фиксированной структуры. Каждая директива позволяет задать определенное действие по управлению процессом.

В состав директивы, как правило, входят название действия, которое должна выполнить автоматизированная система, а также параметры, устанавливающие определенный режим выполнения этого действия. Параметры директивы могут быть позиционными и ключевыми. Позиционные параметры характеризуются их позицией в синтаксической структуре директивы и должны перечисляться в определенном порядке. Каждый ключевой параметр характеризуется своим наименованием.

Развитие преимуществ запрос-ответных и директивных языков осуществляется в комбинированных языках, поддерживающих диалоговое взаимодействие по принципу «Равные партнеры».

Отличительной особенностью этих языков является их естественность для пользователей – приближение средств, предоставляемых в распоряжение проектировщиков, к тем языковым средствам, которыми они привыкли оперировать в процессе решения профессиональных задач, и освобождение от необходимости использования машинно-обусловленных терминов и понятий.
Базовое лингвистическое обеспечение.

Базовое лингвистическое обеспечение ИС, являясь языковой основой программного обеспечения, содержит иерархию языков программирования, каждый уровень которой позволяет с различной эффективностью реализовывать автоматически исполняемые операции обобщенного алгоритма проектирования.

На эффективность реализации проектных операций существенное влияние оказывают свойства выбранного языка программирования: удачный выбор языка позволяет быстро создавать качественный программный продукт. При этом важнейшими характеристиками качества отдельной программы и программного комплекса в целом являются их надежность, эффективная транслируемость в достаточно компактные и быстродействующие машинные программы, модифицируемость и мобильность.

В зависимости от требований, накладываемых на программный продукт, его исходное описание может производиться на языках программирования кодового, низкого и высокого уровня.

Языками программирования кодового уровня (или машинными языками) называются языки системы команд ЭВМ и внутримашинного представления информации. Алфавит таких языков включает только цифры (двоичные, восьмеричные или шестнадцатеричные), с помощью которых кодируются команды машины и данные, над которыми эти команды выполняются. Каждая ЭВМ имеет индивидуальную, свойственную только ей систему команд, но определенные закономерности присущи всем вычислительным системам.

Система команд современных ЭВМ содержит несколько сотен элементов, семантика каждого из которых определяется функциональным назначением элемента: перемещения данных, преобразования данных, управления программой, ввода-вывода, специальные.

Команды перемещения данных организуют обмен информации между арифметико-логическим устройством (точнее аккумулятором) и оперативной памятью. 

Команды преобразования данных используются для выполнения арифметических и логических действий. Данные, над которыми эти действия совершаются, чаще всего находятся в аккумуляторе и регистре. Результат действия обычно остается в аккумуляторе

Команды управления изменяют содержимое регистра адреса следующей выполняемой команды. Команды управления могут быть условными и безусловными. Условная команда сопровождается указанием состояния, которое должно быть предварительно проверено: положительное, значение результата команды, переполнение или отсутствие его и т. д. Безусловная команда управления изменяет содержимое регистра адреса без проверки каких-либо условий. 

Команды ввода - вывода организуют обмен информации с внешними устройствами ЭВМ: накопителями на магнитных лентах, дисках. Специальные команды позволяют выполнять особые действия, такие, например, как разрешение прерывания выполнения программы, запрещение прерывания и т. п.

Детальное кодирование действий и объектов этих действий в терминах кодов операций, аккумулятора, регистров, машинных слов и т. п. позволяет получать компактные и быстродействующие машинные программы, полностью использующие возможности современных ЭВМ. Кроме того, программы на машинном языке не нуждаются в трансляции; после ввода в ЭВМ их можно сразу же исполнять.

Однако машинные языки используются очень редко: для программного управления ЭВМ и оборудования, для которых не созданы или не реализованы языки более высокого уровня, а также для написания особо реактивных и незначительных по объему программ. Это обусловлено высокой трудоемкостью кодирования.

Цифровые коды трудно воспринимаются человеком, поэтому велика вероятность указания неверного кода, т. е. надежность программ, составленных на машинных языках низкая. Кроме того, программы машинного языка немобильны: они не могут исполняться на ЭВМ, система команд и кодировка информации которых не содержат средств данного языка.



Языками программирования низкого уровня (или машинно-ориентированными языками) называются языки символического кодирования машинных и служебных команд и данных. В этих языках каждая машинная команда записывается в виде мнемонического обозначения кода операции и операнда. Каждой операции машинного языка ставится во взаимно однозначное соответствие выразительное, как правило, сокращенное наименование, называемое мнемокодом.

Например, операция сложения может иметь мнемокод СЛЖ. Мнемоническое обозначение операнда представляет собой произвольную последовательность символов, выражающую либо наименование переменной, либо значение константы, участвующей в операции. Такое символическое изображение операций и операндов позволяет облегчить их запоминание, а значит и использование.

Служебные команды машинно-ориентированных языков предназначены для упрощения программирования и отладки программных комплексов: команды управления трансляцией, определения адресов и идентификаторов, резервирования памяти и определения констант, управления печатью текста программы и т. д.

Поскольку система команд ЭВМ является подмножеством соответствующего машинно-ориентированного языка, последний позволяет, подобно машинным языкам, создавать компактные и быстродействующие программы, полностью использующие возможности ЭВМ. Выразительность символического представления команд и данных способствует повышению надежности создаваемых программ, удобству их записи, чтения и изменения.

В то же время эти программы немобильны, поэтому на машинно-ориентированных языках в основном кодируют системные компоненты программного обеспечения ИС, к которым предъявляются высокие требования по быстродействию и потребляемой памяти ЭВМ.

Языками программирования высокого уровня (или процедурно-ориентированными языками) называются языки задания алгоритмов решения определенного класса задач в терминах и понятиях, характерных и наиболее эффективных для этого класса. Процедурно-ориентированные языки с четко продуманной системой хорошо взаимодействующих между собой понятий, достаточно общих, но в то же время простых и ясных для человека, позволяют существенно повысить эффективность разработки и развития программного обеспечения ИС, особенно ее прикладных компонентов.

Качественным отличием этих языков от языков кодового и низкого уровней является их машинная независимость: программы процедурно-ориентированных языков могут выполняться на любых ЭВМ, снабженных соответствующими языковыми процессорами. Последние автоматически отображают языковые конструкции, понятные человеку, в семантически эквивалентные конструкции машинного языка.

При этом лаконичным и выразительным исходным конструкциям ставятся в соответствие, как правило, значительные по объему совокупности машинных команд и данных. Тем самым существенно повышается производительность разработчиков программного обеспечения ИС. Вместе с тем выдаваемые языковыми процессорами машинные программы являются не экономными по потребляемым ресурсам ЭВМ, так как машинно-ориентированные языки позволяют создавать, как правило, более компактные и быстрые программы.

Представление алгоритма решения задачи на процедурно-ориентированном языке заключается в указании последовательности процедурных шагов, конкретизирующих вычислительный процесс. При этом типичными процедурными шагами являются ввод данных, выборка значений, вычисления по формулам, присваивания значений переменным, проверка логических условий, передача управления определенным шагам, вывод данных.

Выражение этих действий производится в терминах допустимых типов данных, типов операций и механизмов управления последовательностью применения операций и данных. Различие в содержании этих понятий обусловливают основные различия языков программирования высокого уровня.

Исходя из вышесказанного, можно составить схему лингвистического обеспечения ИС.


http://www.coolreferat.com/ref-2_1951774249-14246.coolpic

Лекция 3

Теория интерпретации.

Проблема лингвистического обеспечения информационных систем во многом кроется в том, что до сих пор точно неясны механизмы получения, переработки, хранения и передачи информации человеком. Теория интерпретации и вычислительная лингвистика – это именно те области лингвистики и психолингвистики, на пересечении которых находится решение данной проблемы. Когда станет известна и понятна система естественной интерпретации языка, тогда можно будет создать искусственную систему, идентичную ей.
Общие понятия теории интерпретации.

Понятие «интерпретация» лежало с самого начала в основе общелингвистических теорий, а также в основе логических исследований (вспомним классическую работу Аристотеля «Об истолковании»). В последние годы в общем и прикладном языкознании выработался такой взгляд на язык, который можно было бы назвать «интерпретационизмом» в широком смысле слова. Этот взгляд представлен как в разнообразных областях чисто лингвистического анализа (в теориях формальных грамматик, в описании дискурсивной деятельности, в «теории речевых актов», в социолингвистике, в истории языка), так и в исследованиях по «искусственному интеллекту».



Интерпретационизм – весьма разнородное течение, к определению его основных положений можно прийти только в результате сопоставления различных современных концепций интерпретации и вычленения общего для них теоретического ядра. Это тот взгляд, согласно которому в основе владения языком и использования его лежит один и тот же интерпретирующий механизм, обслуживающий различные сферы языковой деятельности и при этом использующий различные виды знаний. Среди этих сфер – говорение, понимание, редактирование, комментирование, перифразирование, рассуждение, аргументация, обучение, перевод и др. Сама же интерпретация, через которую и определяются указанию сферы, представляет собой получение на основе одного исходного объекта (называемого интерпретируемым объектом) другого, отличного объекта, предлагаемого интерпретатором в качестве равносильного исходному на конкретном фоне ситуации, набора презумпций, знаний.

В интерпретационизме владение языком и знания рассматриваются как различные понятия. Так, хотя специальные виды знаний (химические, физические, математические и т.п.) вовлечены в понимание речи, они, тем не менее, к ведению лингвистической теории не относятся. Например, мы понимаем предложение “Камень просвистел у Петра над головой” в том смысле, что можем дать ему следующую интерпретацию: Камень пролетел над головой Петра; камень был тяжелым в той степени, какая необходима для того, чтобы предмет издавал соответствующий свистящий звук, и Петр услышал этот звук, оценив его как свист. Однако это толкование вовсе не обязывает нас среди словарных толкований глагола свистеть помещать (как одно из потенциальных значений) такое: «свистеть – о предметах средней тяжести: издавать характерный звук при полете».

Если остаться на той позиции, что знания о свойствах тяжелых предметов не обязаны входить в компетенцию языка, то отпадет необходимость в бесконечно дробных толкованиях для языковых единиц (обрекающих составителя словаря на бесконечную работу: ведь с расширением кругозора у добросовестного лексикографа будет постоянно возникать необходимость в ревизии словаря). Для лингвиста-интерпретациониста проблема снимается с этой стороны (так как лингвист отвлекается от энциклопедической информации), но усложняется с другой. При построении описания языка, он попутно (но отдельно от своих прямых лингвистических обязанностей) должен составлять компендий «схем знания» (а не компендий собственно знаний), совместимых с языковым описанием таким образом, чтобы на основе такого компендия – «информационного запаса» – можно было моделировать интерпретации высказываний.

Построить процессор естественного языка – значит, воплотить принципы интерпретации языковых выражений, заложенные в человеческой деятельности.

Построение процессора естественного языка – одна из наиболее актуальных проблем современной вычислительной лингвистики и создания искусственного интеллекта. Эта проблема порождена информационным взрывом, переживаемым человечеством в настоящее время: зачастую легче бывает выяснить какой-либо факт (доказать теорему, решить уравнение и т.п.) или сконструировать какое-либо приспособление непосредственно самому, чем извлечь нужный рецепт из существующей литературы. Не помогает в таком поиске информации даже то, что довольно многие издания одновременно с публикацией заносятся на машинные носители: даже тогда извлечь непосредственно нужные сведения фундаментально трудно именно потому, что текст на естественном языке с трудом пока что поддается информационной обработке. В частности, на сегодняшний день не существует пока еще даже такой системы, которая для произвольного текста на данном (скажем, русском) языке давала бы полный его морфологический анализ (для произвольно большого, а не ограниченного словаря) или полный его словарь. А ведь задача морфологического распознавания, или «лемматизации», является предпосылкой для решения многих других информационных задач.

Последние 20 лет в центре внимания вычислительной лингвистики находится вопрос о моделировании той деятельности человека, результатом которой является речь. Однако если в начале этого периода больший интерес, как правило, вызывали исследования, исходящие из точки зрения говорящего, то, начиная с 1970-х годов и вплоть до настоящего времени все чаще и чаще делаются попытки построить модель понимания. Такое изменение интересов связано с тем, что подход к пониманию как к простой перекодировке поверхностных (наблюдаемых) структур в «смысловые репрезентации» стал представляться все менее и менее вероятным. Произошел постепенный переход от «лингвистики говорящего» к «лингвистике понимающего», что, в свою очередь, объясняет тенденцию к интерпретационистскому объяснению.

При всем многообразии современных концепций общение стали характеризовать как то, что связывает двух иди большее число личностей, говорящих и одновременно интерпретирующих как чужую, так и собственную речь. Интерпретация – это процесс, в конечном итоге расцениваемый как понимание, недопонимание, недоразумение и т.д.; шкала такой оценки непрерывна и не ограничивается полярными точками. Причем процесс этот заключается не в «переводе» выражения-объекта в смысловую структуру, а в построении и проверке гипотез о такой структуре, о том, насколько одни структуры более вероятны по сравнению с другими, и даже о том, стоит ли дальше пытаться интерпретировать поступающие сообщения. В «перекодировочной» концепции обычно исходят из неизменности ключа к шифру, в интерпретирующем же подходе вполне допускается случай, когда по ходу понимания речи воспринимающая сторона постепенно меняет ту базу знаний, на которую она опирается.

Возможные перспективы теории интерпретации представляются следующим образом:



Коммуникация в рамках теории интерпретации обладает многими аспектами, среди которых – столкновение намерений и их интерпретация каждой из общающихся сторон. Намерение может быть связано как с мотивами поведения говорящего (при понимании намерений), так и с тональностью понимания.

Намерение в речевом поведении обладает следующими параметрами:

а) степень преднамеренности в выполнении заранее запланированного действия

б) выбор действий

в) психологическое состояние, интерпретируемое как «желание» или «воля»

г) предвидение результатов данного речевого действия;

д) степень контролируемости действий, их привычность, главным образом, связанная с навыками речи, а не со знаниями.



Каталог: library
library -> Практикум по дисциплине «Основы организационного управления в информационной сфере»
library -> Лабораторная работа № Изучение микроконтроллера msp430. Последовательный ввод-вывод и измерение температуры
library -> Программа вступительного экзамена для магистерской подготовки по специальности 1-40 80 01
library -> Лабораторная работа № Изучение микроконтроллера msp430. Аналоговый ввод-вывод и коммуникация
library -> Энциклопедия авиации. Главный редактор: Г. П. Свищёв. Издательство: Москва, «Большая Российская Энциклопедия»
library -> Космодром Байконур. Наша гордость или боль?: Проблема крупным планом/Г. Искакова // Индустриальная Караганда. 2002. 19 янв
library -> Системы мониторинга региональных финансов


Поделитесь с Вашими друзьями:
  1   2   3   4   5   6   7   8   9


База данных защищена авторским правом ©grazit.ru 2019
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал