Обзор средств программирования




ТЕОРЕТИЧЕСКИЕ ОСНОВЫРАЗРАБОТКИ

 

Описание предметной области

Всемирная паутина World Wide Web (WWW) соткана из Web страниц, которые создаются с помощью так называемого языка разметки гипертекста HTML (HyperText Markup Language). При разработке HTML – документа выполняется разметка текстового документа точно так же, как это делает редактор при помощи красного карндаша. Эти пометки служат для указания формы представления информации, содержащейся в документе.

Специальные программы просмотра HTML – документов, которые часто называют броузерами, служат для интерпретации файлов, размеченных по правилам языка HTML, форматирование их в виде Web – страниц и отображении их содержимого на экране компьютера пользователя.

Для передачи текстовой информации по сети Internet используется формат HTML. Существует большое количество текстовых файлов, разработанных в среде DOS, которые имеют кодировку СР-866, неудобную для обеспечения организации документооборота путём передачи текстовой информации по сети Internet или для создания удобных пользовательских интерфейсов в гипертекстовых документах, сочетающий в себе кроме текста ещё и графические объекты, а также гипертекстовые ссылки.

 

Анализ методов решения

Преобразование формата текстового файла из кодировки СР-866 в формат HTML в кодировке СР-1251 с проверкой и исправлением букв с идентичным написанием на русском и английском языках может осуществляться следующими способами:

1) Частично автоматизированным (сама перекодировка осуществляется вручную, а компьютер используется для набора и редактирования текстов в стандартных редакторах) – пользователь ищет на диске нужные текстовые файлы, формат которых необходимо преобразовать, создаёт их копии, а затем поочерёдно открывает в текстовом редакторе копию каждого найденного файла и расставляет HTML-теги, выделяя в тексте встречающиеся элементы форматирования. Затем пользователь проверяет написание и исправляет слова, в которых символы кириллицы, схожие по начертанию с латинскими символами, ошибочно заменены на латинские символы, и слова, в которых латинские символы, схожие по начертанию с символами кириллицы, ошибочно заменены на символы кириллицы. Такую проверку и исправление можно осуществить, открыв файл, уже находящийся в формате HTML, например, в окне редактирования среды программирования Borland C, в котором символы кириллицы выделяются подсветкой, как недопустимые. Затем пользователь должен осуществить перекодировку полученного файла в формате HTML из кодовой страницы СР-866 в кодовую страницу СР-1251, открыв этот файл в редакторе Лексикон. Каждый символ кириллицы и символ “№” необходимо будет заменить на такой символ из таблицы ASCII, который в кодировке Windows будет выглядеть также, как исходный символ до его замены. Замену большинства символов таким образом придётся выполнять при помощи сочетаний управляющих клавиш.

Так как на диске может содержаться большое количество текстовых файлов, в тексте каждого из этих файлов содержится много элементов форматирования, а в каждом элементе форматирования содержится большое количество символов, поэтому преобразование формата текстового файла этим способом требует больших затрат времени и усилий.

2) Автоматизированным – в этом случае пользователь задаёт имя каталога, в котором находятся текстовые файлы, и имя каталога, в который нужно поместить создаваемые HTML-файлы. При этом преобразование формата текстовых файлов в формат HTML, проверку написания и исправление слов, в которых символы кириллицы, схожие по начертанию с латинскими символами, ошибочно заменены на латинские символы, и слов, в которых латинские символы, схожие по начертанию с символами кириллицы, ошибочно заменены на символы кириллицы, а также перевод текста из кодировки СР-866 в кодировку СР-1251 выполняет программа.

Для решения постановленной задачи частично автоматизированный способ не подходит, потому что он требует больших затрат времени и усилий пользователя.

Для реализации постановленной задачи подходит автоматизированный метод, но для этого нужно написать программу, работа которой основывается на использовании следующих приёмов:

1) Программа выполняет поиск текстовых файлов в кодировке СР-866 в каталоге, указанном пользователем и сохраняет на диске список имён найденных файлов. Затем программа последовательно считывает имя каждого файла из списка и выполняет для него ряд ниже перечисленных действий до тех пор, пока не будет достигнут конец списка;

2) Программа создаёт копию align.dat для считанного текстового файла. В этой копии устраняется возможный отступ текста с левой стороны;

3) Программа копирует файл align.dat в файл frame.dat. В файле frame.dat программа размечает таблицы без разметки символами +, –,| и *;

4) Файл frame.dat копируется в файл table.dat. В файле table.dat таблицы с разметкой (размеченные с помощью символов +, – и |) и таблицы без разметки (размеченные с помощью символов +, –, | и *) преобразуются в таблицы в формате HTML;

5) Файл table.dat копируется в файл error.dat. В файле error.dat выполняется проверка и исправление слов, в которых символы кириллицы, схожие по начертанию с латинскими символами, ошибочно заменены на латинские символы, и слов, в которых латинские символы, схожие по начертанию с символами кириллицы, ошибочно заменены на символы кириллицы;

6) Из файла error.dat программа формирует файл в формате HTML с расширением htm, выделяя из текста элементы форматирования и сохраняя их в виде элементов HTML. Этот htm-файл помещается в каталог, указанный пользователем.

7) После того, как программа создала HTML-файл для каждого файла из списка, создаётся конфигурационный файл style.css для HTML-тегов для созданной группы htm-файлов.

 

Обзор средств программирования

Существует множество различных языков программирования, с помощью которых можно выполнить данную программу: HTML, Java Script, CGI Script и т.д.

HTML – Язык разметки гипертекста, выполняется разметка текстового документа точно так же, как это делает редактор при помощи красного карндаша. Эти пометки служат для указания формы представления информации, содержащейся в документе.

Java Skript – небольшие программы (скрипты или сценарии) пишуться на Java Skript и особым образом внедряются в HTML – код Web страниц.

CGI - Common Gateway Interface является стандартом интерфейса (связи) внешней прикладной программы с информационным сервером типа HTTP, Web сервер.
Обычно гипертекстовые документы, извлекаемые из WWW серверов, содержат статические данные. С помощью CGI можно создавать CGI-программы, называемые шлюзами, которые во взаимодействии с такими прикладными системами, как система управления базой данных, электронная таблица, деловая графика и др., смогут выдать на экран пользователя динамическую информацию.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-04-01 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: