Форум Поща Карта на сайта Търсене Връзки Контакти
Начало Обучение Дисциплини в учебните планове на специалностите Информатика (бакалавър) Учебен план Компютърна лингвистика    English
Факултет по математика и информатика - Компютърна лингвистика
Специалност
Форма на оценяване
Дисциплината
се води
Информатика (бакалавър) редовно обучение
изпит
 
Анотация
Естествен език. Предмет на компютърната лингвистика. Проблеми на анализа на ЕЕ текстове. История на КЛ. Регулярни изрази и автомати. Компютърна морфология. Ортографичен анализ. Компютърна фонология и модели на произношение. Вероятностни и статистически модели в КЛ. Контекстно-свободни граматики. Анализ с КСГ. Видове синтактичен анализ. Дефинитно клаузални граматики. Семантика. Компютърна лексикография. Прагматика. Синтез на текст. Трансформация на текст в текст. Машинен превод. Обработка на текстови документи. Езикови ресурси. Софтуерни средства за обработка на ЕЕ текстове.
 
Съдържание
 1. Естествен език. Език и мислене. Нива на лингвистичния анализ: фонология, морфология, синтаксис,семантика, прагматика.Познание.
 2. Предмет на компютърната лингвистика. Основни понятия, задачи и проблеми на КЛ.
 3. Проблеми на анализа на ЕЕ текстове. Примери за многозначност и неопределеност при анализа на ЕЕ текстове.Сегментация, лематизация, разпознаване и класификация, извличане на информация.
 4. История на КЛ. Началото (1940-1950). Първи стъпки (1957-1971). Обработка на естественоезикови текстове (1972-1983). Генериране и модели на крайните състояния (1983-1993). Интегрирани модели. Съвременни направления на КЛ.
 5. Регулярни изрази и автомати. Основни операции. Крайни автомати и преобразуватели. Приложения в КЛ.
 6. Компютърна фонология и модели на произношение. Фонематична транскрипция. Фонеми и фонологични правила. Синтез на реч по естествено-езикови текстове.
 7. Компютърна морфология. Флективна и деривационна морфология. Морфологични анализатори и синтезатори. Модел на Коскениеми. Машинни речници. Алгоритъм на Porter.
 8. Ортографичен анализ. Минимално разстояние при редактиране. Разпознаване на морфологичния клас на “непознати” думи.
 9. Вероятностни и статистически модели в КЛ. Модели на Байес. Вериги на Марков.
 10. Контекстно-свободни граматики (КСГ). Групи на съществителното и глагола. Съгласуване.
 11. Анализ с КСГ. Възходящ (отдолу – нагоре) и низходящ (отгоре-надолу) анализ. Алгоритъм на Earley.
 12. Видове синтактичен анализ. Анализ с преместване и сливане. Анализ от левия ъгъл. Табличен анализ. Възходящ табличен анализ. Низходящ табличен анализ
 13. Дефинитно клаузални граматики. Унификационни граматики. Атрибутни структури. Съгласуване и унификация.
 14. Семантика. Представяне на смисъла. Синтактично-управляван семантичен анализ. Модели на управление.
 15. Компютърна лексикография. Значения на думите и синонимни редове. Лексикални типове и йерархии. Полисемия. WordNet. Машинно-читаеми речници. Приближен семантичен анализ на “непознати” думи.
 16. Прагматика. Дискурс и диалог. Дискурсови структури. Анафора и резолюция.
 17. Синтез на текст. Нива на синтеза: избор на думи, синтаксис, дискурсова структура. Многоезиков синтез.
 18. Трансформация на текст в текст. Многоезиково резюмиране на текст. Автоматична идентификация на езика.
 19. Машинен превод, подпомогнат от човек или компютър. Наивни подходи. Превод дума-дума. Синтактични трансформации. Превод по аналогия. Системи за машинен превод: SYSTRAN, METEO, ПРОМТ и др.
 20. Обработка на текстови документи. Търсене и резюмиране на документи. Извличане на информация. Компютърно-подпомогнато редактиране и създаване на текст.
 21. Езикови ресурси. Текстови корпуси. Звукови корпуси. Видове машинно-читаеми речници. Лексикални стандарти и ресурси.
 22. Софтуерни средства за обработка на ЕЕ текстове.
Актуално
Още новини
Архив на новините
© 2009 ФМИ