Модуль 4. ИТ в лингвистике




1. Базы данных, построенные с использованием Access, Paradox, D-Base, Toolbox, используются....

для дистанционного обучения

для создания и поддержки словарей

для перевода

для работы с лексикой

 

2. Автором книги «Основы стилеметрии» является....

 

3. Исторически самым первым является корпус Брауновский.

 

4. Представленный ниже рисунок демонстрирует Визуализацию текста

 

5. Назовите особенности электронных словарей.

Удобство пользования

Быстрый поиск

Возможность добавления новых слов

Практически неограниченный объем

Словари разных направлений

 

6. Укажите характерные особенности гипертекста.

 

7. На сегодняшний момент наиболее распространенной структурой базы данных является....

иерархическая

реляционная

линейная

сетевая

 

8. Перечислите известные Вам программы CAT (Translation Memory).

Trados

OmegaT

SmartCat

 

10. Существуют два принципиально разных подхода к построению алгоритмов машинного перевода: основанный на правилах (rule-based) и статистический, или основанный на статистике (statistical-based). Какая система машинного перевода относится ко второй группе?

Google Translator

 

11. Какая программа ТМ разработана профессиональным французским переводчиком Ивом Чамполлионом и предназначена для перевода информации путем накопления переводов непосредственно в текстовом редакторе Word?

Word Fast

12. Тег (теги) - это элемент языка разметки гипертекста.

 

13. Единица обрабатываемого текста (в большинстве случаев – предложение), на уровне которой происходит поиск и обработка в системе ТМ, называется сегментом

 

14. Это очень полезная функция всех программ TM. Нередко бывает, что какой-то термин (или сочетание терминов) может иметь несколько значений или оттенков значений. Выделив термин, можно просмотреть в окне все варианты, имеющиеся в копилке, причем в самых разных контекстах. Это всегда облегчает выбор наиболее точного варианта перевода данного термина или сочетания. Эта функция называется конкорданс.

 

15. Каким цветом выделяются исходные сегменты оригинала, которые подлежат переводу, в ТМ OmegaT?

Зеленым

 

16. Какие клавиши используются в ТМ OmegaT для перехода к следующему непереведенному сегменту?

Ctrl + U

 

17. OmegaT является свободным программным обеспечением. Это означает, что любой может свободно загрузить и пользоваться таким ПО с минимальными ограничениями. Разрешается также свободно копировать и передавать программу другим людям.

 

18. НКРЯ предназначен для...

профессиональных лингвистов

преподавателей русского языка как иностранного

специалистам по информатике и программированию

школьных учителей

 

19. НКРЯ содержит....

тексты 19 века

образцовые тексты

только художественные тексты

все типы текстов, представленные в данном языке в данный исторический период

 

20. Проект по созданию ХАНКО осуществляется на Отделении славянских и балтийских языков и литератур Хельсинкского университета. ХАНКО - это Хельсинкский аннотированный корпус русского языка

 

21. Слово «национальный» в словосочетании «Национальный корпус русского языка» имеет значение многообразия

 

22. Разметка корпуса – это …?

 

23. Корпус языка – это собрание размеченных текстов

 

24. Укажите определение, никак не связанное с термином «тезаурус».

идеографический словарь

совокупность всех сведений, которыми обладает субъект

нетрадиционный тип словаря

словарь, полно отражающий лексику языка

 

25. Таксоны - это семантическое поле слова

(в тесте все ответы верные)

 

26. Дополните название Roget's … of English Words and Phrases.

 

27. Свободная система автоматизированного перевода, поддерживающая память переводов, написанная на языке программирования Java, предназначенная для профессиональных переводчиков, называется....

 

28. Укажите поддерживаемые системой OmegaT форматы файлов документов:

 

30. Процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы называется....

 

31. Перевод текстов профессиональным переводчиком с использованием компьютерных технологий называется....

 

32. Процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем.

 

33. Четыре формы организации взаимодействия ЭВМ и человека при машинном переводе это:

 

35. Системами автоматизированного перевода являются....

PROMT

OmegaT

Deja Vu

Systran

Lingvo

SDL Trados

 

36. Русский термин «компьютерная лингвистика» является калькой с английского computational linguistic

 

37. Укажите неверное утверждение.

Как особое научное направление компьютерная лингвистика оформилась в 1990-е годы.

Компьютерная лингвистика – направление в прикладной лингвистике, ориентированное на использование компьютерных инструментов для моделирования функционирования языка.

Компьютерная лингвистика использует такие компьютерные инструменты, как программы, компьютерные технологии организации и обработки данных.

Компьютерная лингвистика – сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах.

 

38. В зарубежной лингвистике термин «Applied Linguistics», «Angewandte Linguistik» часто связывается с преподаванием иностранных языков

 

39. Наука, исследующая свойства знаков и знаковых систем, называется семиотикой

 

40.Искуственные языки - это знаковые системы, создаваемые для использования в тех областях науки и техники, где применение естественного языка ограничено, менее эффективно или невозможно.

 

41. Первое крупное событие в истории машинного перевода – Джорджтаунский эксперимент – произошло в 1954 году.

 

42. С точки зрения лингвистики понятие "корпус" обозначает....

a collection of utterances, as spoken or written sentences, taken as a representative sample of a given language or dialect and used for linguistic analysis.

a large or complete collection of writings: the entire corpus of Old English poetry.

the body of a person or animal, esp. when dead.

a mass of body tissue that has a specialized function.

 

43. Наиболее известной зарубежной системой машинного перевода, работающей по правилам, является....

 

45. Среди лингвистических типов разметки (корпусов текстов) выделяются морфологическая, семантическая и синтаксическая

 

46. Авторство цитаты "Современная цивилизация есть цивилизация словаря" приписывается Рэй

 

48. Дополните предложение: Специальный международный проект Text Encoding Initiative (TEI) предназначен для того, чтобы разработать стандартизированные средства... корпусов текстов.

 

 

55. Дополните предложение: Важнейшим направлением компьютерной лингвистики является разработка....

баз данных и корпусов текстов

информационно-поисковых систем

электронных словарей

систем искусственного интеллекта

 

56. По типу хранимой и обрабатываемой информации, а также по особенностям поиска информационно-поисковые системы разделяются на две больших группы –....

 

57. К области компьютерной лингвистики в определенной степени могут быть отнесены работы в области создания...... (связанных с именем В.Буша), рассматриваемых как особый способ организации текста и даже как принципиально новый вид текста, противопоставленный по многим своим свойствам обычному тексту, сформированному в гутенберговской традиции книгопечатания.

 

58. В рамках...... разрабатываются компьютерные технологии составления и эксплуатации словарей. Специальные программы – базы данных, компьютерные картотеки, программы обработки текста – позволяют в автоматическом режиме формировать словарные статьи, хранить словарную информацию и обрабатывать ее.

 

59. Имеющиеся компьютерные программы моделирования сюжета основываются на трех базовых формализмах представлениях сюжета – морфологическом и синтаксическом направлениях представления сюжета, а также на... подходе.

онтологическом

когнитивном

семантическом

гносеологическом

 

60. Упорядочьте этапы разработки словаря.

Дистрибутивный анализ текстов, тесты с носителями языка.

Обобщение экспериментальных данных.

Отбор текстов, расписывание контекстов, характеристика грамматических форм, составление предварительных словников.

Оформление словарных статей.

Оформление словаря.

Построение дефиниций на соответствующем метаязыке и их проверка в ходе новых экспериментов.

Разработка системы требований, касающихся назначения и круга пользователей.

Разработка системы требований, касающихся таких параметров словаря как единицы описания, объем, структуру, вид словарной информации.

Сбор и систематизация дополнительной информации о каждой языковой единице.

Системный анализ и упорядочение словарных статей.

 

61. К трем основным инструментальным средствам в рамках компьютерной лексикографии относятся:

программы обработки текста

конкордансеры

оболочки тезаурусов

компьютерные картотеки

базы данных

системы морфологического анализа текстов

серверы

 

62. Теоретическую основу синтаксического подхода к сюжету текста, компьютерным моделированием структуры которого занимается компьютерная лингвистика, составили «сюжетные грамматики», появившиеся в результате переноса идей порождающей грамматики Хонского

 

66. Анализ текста, направленный на выявление семантических компонентов значения, а также на определение принципов их соединения и структурной организации, называется... анализом.

 

67. Одно из определений не является определением термина "компонентный анализ".

Такой способ анализа текста, который направлен на выделение составных частей значения слова, или семантических компонентов, а так же на выяснение принципов их соединения и структурной организации.

Анализ текста, направленный на выявление семантических компонентов значения, а так же на определение принципов их соединения и структурной организации.

Такой анализ отображает документы и отдельные слова в так называемое «семантическое пространство», в котором и производятся все дальнейшие сравнения.

Выявление предельных составляющих (компонентов) языковой единицы как дифференциальных признаков, способных отличать разные языковые единицы одного уровня друг от друга.

 

68. Соотнесите название анализа и пример. Найдите программы (бесплатные и онлайн) для каждого из указанных видов анализа.

компонентный анализ
латентно-семантический анализ    
семантический анализ   мальчик - человек, мужской пол, невзрослость; девочка - человек, женский пол, невзрослость
частотный анализ  

 

73. Одна из характеристик корпусной лингвистики неверна.

Текст рассматривается как некоторая физическая сущность

Основное внимание – изучение речи

Основное внимание уделяется форме

Предпочитает квалитативные методы

 

74. Укажите характеристику корпусной лингвистики.

Часто пользуется вероятностными методами и статистикой для первичной обработки речевого материала.

Предпочитаются искусственные примеры, из изолированных от текста словоупотреблений.

Предпочитает дедуктивные методы обработки эмпирического словесного материала.

Верит в открытия, основанные на процедурах, оценках, сравнениях и т.д., т.е., как результат многовековых исследований.

 

75. По классификации В.В. Рыкова, корпус текстов по хронологическому признаку может быть трех видов....

 

76. Словарь современного английского языка Collins COBUILD English Language Dictionary был создан с применением текстовой базы данных

 

77. Каковы все (или наиболее типичные) контексты употребления слова (конструкции, словосочетания, явления)?

Выдать весь словарь определенного автора или определенной системы Ответы на эти вопросы можно найти в....

поисковике Google

корпусе текстов

электронном словаре

базе данных

 

78. Самым крупным в настоящее время является корпус..., объем которого достигает ста миллионов словоупотреблений.

 

79. Дополните: In June 2013, an Israeli startup company called Lexifone launched an automated telephone interpreting service. Lexifone is able to interpret between English and seven other... (French, Spanish, Italian, Portuguese, German, Russian and Mandarin).

 

80. На скриншоте представлена технология перевода с помощью системы Voice translator

 

81. В процессе компьютерного анализа текста должны быть исключены некоторые слова. Укажите какие это части речи. Предлоги, союзы, местоимения и т.д.

 

82. Слова, которые не несут абсолютно никакой смысловой нагрузки, соответственно, их польза и роль для читателя несущественна, называются шумовыми, или стоп -словами.

 

83. Представление физического явления или процесса в форме, удобной для зрительного восприятия называется....

 

84. Укажите синонимы понятия "облако тегов".

 

85. Визуальное представление списка категорий (или тегов, также называемых метками, ярлыками, ключевыми словами и т. п.) называется.... (Напишите ответ в именительном падеже и со строчной буквы.)

 

86. Соотнесите показатель удобства использования облака тегов и его описание (по исследованию компании Lohmann).

Исследование   крупные теги привлекают больше внимания, чем маленькие теги (эффект зависим от таких свойств, как: количество символов, расположение, соседние теги).
Позиционирование   пользователи обычно просматривают облако, а не читают его полностью.
Просмотр   теги в середине облака привлекают больше внимания, чем теги, расположенные по краям (эффект обусловлен особенностью расположения текста в облаке).
Размер тега   верхний левый квадрант получает больше внимания, чем остальные (обусловлено чтением слева-направо).
Центрирование   облака тегов помогают найти специфические теги (которые не выделены большим размером шрифта).

 

88. Облака тегов изучались в нескольких исследованиях на предмет удобства использования. Восстановите перечень компании Lohmann, состоящий из пяти пунктов.

Шрифт

Размер тега

Семантика

Центрирование

Позиционирование

Просмотр

Воспроизведение

Исследование

 

89. Назовите технологию, которая может совершить подобные ошибки.

 

90. Какой корпус позволяет анализировать продукты учебной деятельности студентов, выявляя их успеваемость, наиболее типичные лексические, стилистические и грамматические ошибки, пробелы в знаниях, на которые следует обратить внимание преподавателям?

учебный

научный

общественно-политический

методический

 

91. Эмпирическая закономерность распределения частоты слов естественного языка называется закон Ципфра

 

93. Многоплатформенность электронного словаря - это....

 

94. Термин «bottom-up» применительно к интернет-словарям означает....

 

95. Сайт для переводчиков Мультитран открыт в 2001 году.

 

96. Дополните фразу: Закон Ципфа говорит, что если упорядочить все слова определенного текста по уменьшению частоты их использования, то частота n-го слова будет приблизительно обратно пропорциональной его рангу (порядковому номеру n). К примеру, второе слово используется в два раза реже, чем первое, третье – в... раза, и так далее.

 

97. Лексическая плотность – это....

 

98. Независимо от предмета изучения применение кластерного анализа предполагает следующие этапы:

Вычисление значений той или иной меры сходства (или различия) между объектами.

Определение множества переменных, по которым будут оцениваться объекты в выборке, то есть признакового пространства.

Отбор выборки для кластеризации. Подразумевается, что имеет смысл кластеризовать только количественные данные.

Применение метода кластерного анализа для создания групп сходных объектов.

Проверка достоверности результатов кластерного решения.

 

99. На рисунке представлено....

 

100. Словосочетание, состоящее из двух или более слов, имеющее признаки синтаксически и семантически целостной единицы, в котором выбор одного из компонентов осуществляется по смыслу, а выбор второго зависит от выбора первого (например, ставить условия – выбор глагола ставить определяется традицией и зависит от существительного условия, при слове предложение будет другой глагол – вносить), называется коллокацией



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-01-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: