Слова, отсутствующие в словнике, автоматически не разбиваются (для нек. буквосочетаний и словообразовательных моделей предусмотрена гипотетическая обработка)




Правила сокращений

Можно дать только списком.

Проблемы:

Расширение словаря спеллера

Трудность в соотнесении с исходными словами – и нужно ли это?

Существование разных типов сокращений

Проблема диалога с пользователем

Интерфейс коррекции текста

Выбор варианта из предложенных

Работа с разорванными словами, многобуквенными орфограммами

Подключение разноуровневых операций

Др. уровни автокорректора

Проверка грамматики

Выявление языковых элементов, не соответствующих заданному стилю документа

Выводы по разделу
«Компьютерная проверка правописания»

Автокорректоры отражают проблемы АОТ на всех уровнях текста

нерешенность проблем правописания сказывается на плохой формализованности многих правил и существовании вариантов написания одного и того же слова

следует развивать диалоговый интерфейс в плане реакции на ошибки и подсказок

Изменяемость языка, проблема пополнения и редактирования базы

Повышение скорости набора текста

«Предиктивный ввод» текста

Способ набора текста, при котором с помощью математических алгоритмов происходит выбор наиболее вероятных для ввода букв. Он базируется на анализе конкретного языкового словаря и частотных характеристик использования в письменной речи тех или иных букв.

от predictive (англ.) – предсказывающий

Появление сервиса SMS

Г. Институт Стандартов в области Телекоммуникаций (ETSI) представляет технологию обмена небольшими блоками текстовой информацией между мобильными терминалами. Первое в мире SMS было отправлено со своего телефона в 1992 г.

Системы предиктивного ввода

Система ввода текста iTAP, предложенная компанией Lexicus, (подразделение корпорации Motorola).

Система T9

Компания Tegic Communications (www.tegic.com), параллельно iTAP занималась разработкой альтернативной системы, названной T9. Сегодня T9 торговая марка компании Nuance Communications. T9 быстро сумел стать стандартом интеллектуального ввода на мобильных устройствах с ограниченной клавиатурой. Название T9 происходит от T ext on 9 keys.

t9.com © Nuance Communications, Inc. All Rights Reserved.
T9 is a registered trademark of Nuance.

Дополнительные возможности системы

Многоязыковая поддержка.

Функция продолжения ввода слова

Добавка не только слов и аббревиатур, но и целых фраз, адресов электронной почты и даже веб-ссылок.

Пользовательская подстройка (какие слова использует владелец телефона, каким образом он строит фразы и т.п.)

Технические признаки

Поддержка десятков языков

Совместимость с сотнями моделями сотовых телефонов

Проблемы t9. Примеры из Wikipedia

смешение слов тело и ужин: «приедешь домой — в холодильнике лежит ужин » → «приедешь домой — в холодильнике лежит тело »

Номер мобилки — номер могилки

тебя — себя: Я люблю тебя…

Машинный (автоматический) перевод

Машинный перевод

Процесс перевода текстов с одного естественного языка на другой с помощью компьютерной программы.

Направление научных исследований, связанных с построением подобных систем.

Машинный = автоматический
Автоматизированный ≠ автоматический

Автоматизированный перевод:

Компьютерный алгоритмпомогает человеку переводить тексты.

Различные формы взаимодействия:

Использование переводчиком-человеком компьютерных словарей.

Автоматический перевод избранных фраз только определенной структуры.

Неоднозначность термина «перевод»

ПЕРЕВОД

Деятельность

Результат деятельности

Теория осуществления этой деятельности

Перевод как прикладная лингвистическая дисциплина

Теория перевода

Анализ перевода

Методика обучения переводу

Междисциплинарность перевода.

Перевод как сложный когнитивный феномен.

Классификации перевода

По типу речи

Устный

Синхронный

Последовательный

Письменный

Классификации перевода

По направлению:

Односторонний

Двусторонний

Классификации перевода

Специальные виды перевода:

Пословный (подстрочник)

Филологический

Адаптивный (реферативный)

Машинный перевод

Интенсивно развивающаяся область исследований, экспериментальных разработок и работающих систем, в которых к процессу перевода с одного ЕЯ на другой привлекаются компьютеры.

Междисциплинарность МП (!).

Привлекательность МП

АОТ на всех уровнях языка

Отработка лингвистических теорий

Лексико-синтаксическая основа

«интеллектуальность» ®

МП называют центральным направлением искусственного интеллекта.

Лингвистические проблемы

разрешение неоднозначностей (!)



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-04-01 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: