Департамент образования города Москвы



Скачать 249,92 Kb.
страница1/3
Дата29.10.2016
Размер249,92 Kb.
  1   2   3
Департамент образования города Москвы

Государственное бюджетное образовательное учреждение

Высшего профессионального образования

МОСКОВСКИЙ ГОРОДСКОЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ

ИНСТИТУТ МАТЕМАТИКИ И ИНФОРМАТИКИ
Общеинститутская кафедра естественнонаучных дисциплин


КОМПЬЮТЕРНЫЙ КОНТЕНТ-АНАЛИЗ ТЕКСТОВ

Направление подготовки:

040100.62 «CОЦИОЛОГИЯ»

ДОЦЕНТ ОИК



естественнонаучных дисциплин

ИНСТИТУТА МАТЕМАТИКИ И ИНФОРМАТИКИ ГБОУ ВПО МГПУ

Полтавский А.В.
Москва 2013

СОДЕРЖАНИЕ ДИСЦИПЛИНЫ


1. Дидактическая единица «Общие сведения о контент-анализе текстовой информации»
Компетенция ОК-1. Владение культурой логического мышления, способность к обобщению, анализу, восприятию информации, постановке цели и выбору путей ее достижения.

Логико-содержательный анализ информации. Научный подход к анализу тестов. Применение контент-анализа текстовой информации.

Контент-анализ в системе социологических исследований. Математические алгоритмы контент-анализа: частоты, относительные частоты, обработка частот методами математической статистики.

Компьютерные технологии для контент-анализа в Мicrosoft Office/


2. Дидактическая единица «Понятие информации»

Компетенция ОК-12. Способность понимать сущность и значение информации в развитии современного информационного общества, сознавать опасность и угрозы, возникающие в этом процессе, соблюдать основные требования информационной безопасности, в том числе защиты государственной тайны.
Понятие информации. Информация как содержание символа. Свойства информации: объективность, репрезентативность, полнота, точность, содержательность, актуальность, достоверность, своевременность, доступность, куммулятивность. Текстовая информация (ТИ) как объект исследования в социологии.

Количественные меры информации: объемная ( формула Хартли ) и вероятностная ( формула Шеннона ).

Угрозы информации: предумышленные и непредумышленные. Способы защиты информации. Организационные, программные, технические. Шифрование как метод защиты информации. Шифр Цезаря. Технология передачи шифрованной информации. Стойкости шифра Цезаря. Блоковые шрифты. Алгоритм хранения пароля в компьютере. Открытый и закрытый ключи шифрования. Электронная подпись.
3. Дидактическая единица «Способы представления и обработки информации в компьютере»
Компетенция ОК-8. Владение основными методами, способами и средствами получения, хранения, переработки информации, имеет навыки работы с компьютером как средством управления информацией.
Системы счисления. Схема Горнера представления чисел в различных системах счисления. Перевод чисел из одной системы счисления в другую. Двоичная, восьмеричная и шестнадцатеричная системы счисления. Арифметические операции в различных системах счисления. Нормализованные числа. Представление чисел в виде «с плавающей запятой» в разрядной сетке компьютера. Кодирование отрицательных чисел. Прямой, обратный, дополнительный и смещенный коды. Распределение памяти в компьютере. Понятие машинного слова. Форматы записи целых и действительных чисел в компьютере.

Представление в компьютере символов естественного языка. Использование формулы Хартли при кодировании символов. Кодирование текстовой информации. Восьмибитовые кодировки латинского алфавита и русского алфавита. Понятие кодовой страницы. Шестнадцатибитовая кодировка уникод(универсальный код). Кодировки переменной длины.

Способы сжатия текстовой и графической информации в компьютере. Алгоритм кодирования длинных серий. Словарные алгоритмы сжатия. Вероятностный алгоритм сжатия информации. Коды Хаффмана.

Кодирование текстовой, ауди и видеоинформации в компьютере.

Логические и математические операции обработки информации. Логические функции. Преобразование высказываний на естественном языке в высказывания математической логики.. Преобразование табличных логических данных в логические функции. Совершенные дизъюнктивная и конъюнктивная нормальные формы. Логические элементы как реализация логических функций с помощью электронных схем.

Алгоритм как метод преобразования информации. Базовые типы алгоритмов: линейный, ветвления, циклический. Запись алгоритмов на естественном языке и с помощью блок-схем. История языков программирования. Переменные и операторы языков программирования. Сохранение и обработка информации в виде массивов.

Транслятор: компилятор и интерпретатор. Объектно-ориентированное программирование. Операционные системы. Виды программного обеспечения.
4. Дидактическая единица « Работа с информацией в Интернет».

Компетенция ОК-9. Способность работать с информацией в глобальных компьютерных сетях.

Понятие компьютерной сети. Локальные и глобальные сети. Системы доступа к информации «клиент-сервер», «файл-сервер», « с сервером приложений», «распределенная архитектура», «облачная архитектура».

Протоколы Интернет. Семиуровневая модель протоколов. Четырехуровневая модель протоколов. Адресация в Интернет. Доменная служба имен. Универсальный указатель ресурса и универсальный идентификатор ресурса. Маршрутизация поиска информации. Поиск ТИ информации в Интернет. Web-ресурсы Интернет.

5. Дидактическая единица «Методы статистической обработки информации».

Компетенция ОК-4. Способность использовать знания о современной естественнонаучной картине мира в образовательной и профессиональной деятельности, применять методы математической обработки информации, теоретического и экспериментального исследования

Использование математической статистики при обработке текстовой информации. Основные понятия теории вероятности: случайное событие, невозможное событие, достоверное событие, совместные и несовместные события, зависимые и независимые элементарные события (случаи), сложные события, вероятность события, частота события. Вероятность суммы несовместных событий. Вероятность произведения независимых событий. Условная вероятность. Вероятность произведения и суммы событий. Комбинаторные задачи и формулы комбинаторики. Случайная величина, закон распределения случайных величин, многоугольник(полигон частот).Числовые характеристики распределения случайных величин: математическое ожидание, дисперсия, среднеквадратичное отклонение. Статистический ряд, объем выборки, средняя выборочная величина, среднеквадратичная выборочная величина, мода, медиана. Построение гистограмм. Формулы Шеннона и Хартли для расчета количества текстовой информации.



Учебный план


Поделитесь с Вашими друзьями:
  1   2   3


База данных защищена авторским правом ©grazit.ru 2017
обратиться к администрации

    Главная страница