Document Type Definition (DTD)




В первой стоке объявляется Document Type Definition:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

DTD (Document Type Definition, определение типа документа) – язык описания структуры SGML-документа [10].

Пример очень простого XML DTD, описывающего список людей [10, 12]:

<!ELEMENT people_list (person*)>

<!ELEMENT person (name, birthdate?)>

<!ELEMENT name (#PCDATA) >

<!ELEMENT birthdate (#PCDATA) >

Начиная с первой строки:

1. Элемент <people_list> содержит любое число элементов <person>. Знак <*> означает, что возможно 0, 1 или более элементов <person> внутри элемента <people_list>.

2. Элемент <person> содержит элементы <name>, <birthdate>. Знак <?> означает, что элемент необязателен. Элемент <name> не содержит <?>, что означает, что элемент <person> обязательно должен содержать элемент <name>.

3. Элемент <name> содержит данные.

4. Элемент <birthdate> содержит данные.

Пример XML-документа, использующего этот DTD:

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE people_list SYSTEM "example.dtd">

<people_list>

<person>

<name>Иванов Иван Иванович</name>

<birthdate>22.03.1978</birthdate>

</person>

</people_list>

Сейчас идет отказ от использования DTD в XML-технологии по ряду причин:

1. Используется отличный от XML синтаксис.

2. Отсутствует типизация узлов.

3. Отсутствует поддержка пространств имен.

На смену DTD пришел стандарт консорциума W3C XML Schema.

В примере!DOCTYPE предназначен для указания типа текущего документа – DTD.

Это необходимо, чтобы браузер понимал, как следует интерпретировать текущую веб-страницу, ведь HTML существует в нескольких версиях, кроме того, имеется XHTML (EXtensible HyperText Markup Language), похожий на HTML, но различающийся с ним по синтаксису. Чтобы браузер «не путался» и понимал, согласно какому стандарту отображать веб-страницу и необходимо в первой строке кода задавать <!DOCTYPE>.

Существует несколько видов <!DOCTYPE>, они различаются в зависимости от версии HTML, на которую ориентированы [11]. В Табл. 2.1 приведены основные типы документов с их описанием.

Табл. 2.1. Основные виды DOCTYPE

DOCTYPE Описание
HTML 4.01
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "https://www.w3.org/TR/html4/strict.dtd"> Строгий синтаксис HTML – не содержит элементов, помеченных как «устаревшие» или «не одобряемые»
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "https://www.w3.org/TR/html4/loose.dtd"> Переходный синтаксис HTML –содержит устаревшие теги в целях совместимости и упрощения перехода со старых версий HTML
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "https://www.w3.org/TR/html4/frameset.dtd"> В HTML-документе применяются фреймы – аналогичен переходному, но содержит также теги для создания наборов фреймов
XHTML 1.0
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> Строгий синтаксис XHTML.
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> Переходный синтаксис XHTML.
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd"> Документ написан на XHTML и содержит фреймы.
XHTML 1.1
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN"> Разработчики XHTML 1.1 предполагают, что он постепенно вытеснит HTML.

Разница между строгим и переходным описанием документа состоит в различном подходе к написанию кода документа [10]. Строгий HTML требует жесткого соблюдения спецификации HTML и не прощает ошибок, что обычно приводит к иному отображению документа, чем планировал разработчик. Переходный HTML более «спокойно» относится к некоторым огрехам кода, поэтому этот тип использовать предпочтительнее.

Часто можно встретить код HTML вообще без использования <!DOCTYPE>, веб-страница в подобном случае все равно будет показана. Тем не менее, может получиться, что один и тот же документ отображается по-разному при использовании <!DOCTYPE> и без него. Чтобы не произошло подобных ситуаций, необходимо всегда добавлять этот тег в начало документа.

2.1.3.2. Заголовок документа

В строке 2 находится тег <HTML>, определяющий начало HTML-файла, внутри него хранится заголовок (<HEAD>) и тело документа (<BODY>). В примере тег <HTML> закрывается на строке 73.

Заголовок документа, как еще называют блок <HEAD>, может содержать текст и теги, но содержимое этого раздела не показывается напрямую на странице. В примере заголовок открывается на строке 3 и закрывается на строке 15.

<head>
<!-- Этот раздел предназначен для заголовка страницы и технической информации. -->
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />
<meta http-equiv="Content-Language" content="ru"/>
<meta name="description" content="Это теставая страница." />
<meta name="keywords" content="HTML, CSS, DTD, теги" />
<meta name="robots" content="index, follow" />
<title>Тестовая страница</title>
<link type="image/x-icon" href="images/favicon.ico" rel="shortcut icon" />
<link type="text/css" href="reset.css" rel="Stylesheet" />
<link type="text/css" href="main.css" rel="Stylesheet" />
<script type="text/javascript" src="jquery-1.3.2.min.js"></script>
</head>

Как показано в примере, некоторый текст можно скрыть от показа в браузере, сделав его комментарием (строка 4). Хотя такой текст пользователь не увидит, он все равно будет передаваться в документе, так что, посмотрев исходный код, можно обнаружить скрываемую информацию. Комментарии начинаются тегом <!-- и заканчиваются тегом -->. Все, что находится между этими тегами отображаться на веб-странице не будет.

2.1.3.2.1. Метатеги

На строках 4-9 находятся метатеги.

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />
<meta http-equiv="Content-Language" content="ru"/>
<meta name="description" content="Это теставая страница." />
<meta name="keywords" content="HTML, CSS, DTD, теги" />
<meta name="robots" content="index, follow" />

Метатеги используются для хранения информации предназначенной для браузеров и поисковых систем [13]. Например, механизмы поисковых систем обращаются к метатегам для получения описания сайта, ключевых слов и других данных. Хотя тег <META> всего один, он имеет множество параметров, поэтому для его обращения применяется множественное число.

Разрешается использовать более чем один метатег, все они размещаются в контейнере <HEAD>. Как правило, параметры любого метатега сводятся к парам «имя=значение», которые определяются аргументами content, name или http-equiv.

Метатеги имеют следующие параметры [2, 13]:

· сontent – у станавливает значение параметра, заданного с помощью name или http-equiv;

· http-equiv – браузеры преобразовывают значение параметра http-equiv, заданное с помощью content, в формат заголовка ответа HTTP и обрабатывают их, как будто они прибыли непосредственно от сервера.

Ниже приведены некоторые допустимые аргументы параметра http-equiv.

o сontent-еype – тип кодировки документа;

o expires – устанавливает дату и время, после которой информация в документе будет считаться устаревшей;

o pragma – способ кэширования документа;

o refresh – загрузить другой документ в текущее окно браузера.

· name – устанавливает идентификатор метатега для пары «имя=значение». Одновременно использовать параметры name и http-equiv не допускается.

Ниже приведены некоторые допустимые аргументы параметра name.

o author – имя автора документа;

o description – описание текущего документа;

o keywords - список ключевых слов, встречающихся на странице.

Соответственно строка в примере:

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />

определяет тип кодировки документа.

Строка

<meta http-equiv="Content-Language" content="ru"/>

определяет язык кодировки документа.

Строка

<meta name="description" content="Это теставая страница." />

определяет описание текущего документа.

Строка

<meta name="keywords" content="HTML, CSS, DTD, теги" />

определяет список ключевых слов, встречающихся на странице.

Строка

<meta name="robots" content="index, follow" />

определяет режим индексирования страницы поисковыми роботами.

2.1.3.2.2. Заголовок страницы

Тег <TITLE> (строка 10) используется для отображения строки текста в левом верхнем углу окна браузера. Такая строка сообщает пользователю название сайта и другую информацию, которую добавляет разработчик (Рис. 2.2).

Рис. 2.2. Заголовок страницы

Link

Строки 11-13 содержат тег <LINK>.

<link type="image/x-icon" href="images/favicon.ico" rel="shortcut icon" />
<link type="text/css" href="reset.css" rel="Stylesheet" />
<link type="text/css" href="main.css" rel="Stylesheet" />

Этот тег устанавливает связь с внешним документом вроде файла со стилями или со шрифтами. Тег <LINK> размещается всегда внутри контейнера <HEAD> и не создает «видимую» ссылку.

Параметры [2, 14]:

· href – путь к файлу, на который делается ссылка (URL), в качестве значения принимается полный или относительный путь к файлу;

· rel – параметр rel определяет отношения между текущим документом и файлом, на который делается ссылка, чтобы браузер знал, как использовать подключаемый документ. Аргументы:

o stylesheet – определяет, что подключаемый файл хранит таблицу стилей (CSS);

o application/rss+xml – файл в формате XML для описания ленты новостей, анонсов статей.

· type – сообщает браузеру, какой MIME-тип данных используется для внешнего документа. Как правило, применяется для того, чтобы указать, что подключаемый файл содержит CSS.

Аргументы – имена MIME-типа в любом регистре. Для подключаемых таблиц связанных стилей применяется тип text/css.

· media – определяет устройство, для которого следует применять стилевое оформление. Это позволяет сделать разный стиль для отображения документа на экране монитора и при его печати. Допускается писать несколько аргументов через запятую. Аргументы:

o all – все устройства;

o screen (значение по умолчанию) – экран монитора;

o print – печатающее устройство вроде принтера;

o projection – проектор;

o braille – устройства, основанные на системе Брайля, которые предназначены для слепых людей;

o speech – речевые синтезаторы, а также программы для воспроизведения текста вслух. Сюда, например, можно отнести речевые браузеры.

Соответственно строка

<link type="image/x-icon" href="images/favicon.ico" rel="shortcut icon" />

определяет ссылку на фавикон нашей страницы (Рис. 2.3).

Рис. 2.3. Фавикон страницы

Строки

<link type="text/css" href="reset.css" rel="Stylesheet" />
<link type="text/css" href="main.css" rel="Stylesheet" />

определяют подключаемые файлы, содержащие CSS.

Script

Строка 14 содержит тег <SCRIPT>

<script type="text/javascript" src="jquery-1.3.2.min.js"></script>

Тег <SCRIPT> предназначен для описания скриптов, может содержать ссылку на программу или ее текст на определенном языке [15]. Скрипты могут располагаться во внешнем файле и связываться с любым HTML-документом. Такой подход позволяет использовать одни и те же общие функции на многих веб-страницах и ускоряет их загрузку, т.к. внешний файл кэшируется при первой загрузке, и скрипт вызывается быстрее при последующих вызовах.

<SCRIPT> может располагаться в заголовке или теле HTML-документа в неограниченном количестве. В большинстве случаев местоположение скрипта никак не сказывается на работу программы. Однако скрипты, которые должны выполняться в первую очередь, обычно помещают в заголовок документа.

Параметры [2, 15]:

· defer – откладывает выполнение скрипта до тех пор, пока вся страница не будет загружена полностью. Этот параметр работает только в браузере Internet Explorer, а в остальных браузерах будет проигнорирован.

· language – устанавливает язык программирования, на котором написан скрипт.

Параметр language не чувствителен к регистру и может принимать одно из четырех значений:

o JavaScript (значение по умолчанию) – язык программирования JavaScript. К этому параметру часто еще присоединяют номер версии, например – JavaScript1.3.

o JScript – разновидность языка JavaScript разработанная компанией Microsoft. Смена названия продиктована тем, что имя JavaScript уже было зарегистрировано, при этом различия между языками состоят не только в названии, но и в подходах.

o VBS, VBScript - язык программирования VBScript основанный на Visual Basic. Является продуктом Microsoft и поддерживается преимущественно браузером Internet Explorer.

· src – адрес скрипта из внешнего файла для импорта в текущий документ. Как только внешние инструкции полностью загружаются, браузер обрабатывает их, словно они были внедрены в текущий документ.

Преимуществ использования внешних файлов несколько. Внешний файл после первого обращения сохраняется в кэше браузера и при последующих вызовах загружается быстрее. Кроме того, вызываемые функции удобно править в одном месте и код проще контролировать. Это особенно актуально, когда множество веб-страниц используют одни и те же скрипты.

В качестве значения аргумента принимается полный или относительный путь к файлу.

· type – указывает тип MIME для определенного языка. Поскольку некоторые старые браузеры не понимают параметр type, можно задавать два атрибута одновременно – language и type. Если браузер распознает значение параметра type, то значение language отменяется. Параметр type не чувствителен к регистру и принимает следующие значения:

o text/javascript (значение по умолчанию) – для языка программирования JavaScript.

o text/vbscript – для языка VBScript.

В нашем примере строка

<script type="text/javascript" src="jquery-1.3.2.min.js"></script>

указывает на использование Javascript-скрипта из внешнего файла.

2.1.3.3. Тело документа

Тело документа <BODY> предназначено для отображения данных на веб-странице, в частности, в теле размещается текст, изображения, ссылки, таблицы, списки и т.д.

В примере тело документа открывается на строке 16 и закрывается на строке 72.

DIV

На строке 17 (и еще в нескольких местах) находится тег <DIV>.

Элемент <DIV> является блочным элементом и предназначен для выделения фрагмента документа с целью изменения вида содержимого [16]. Как правило, вид блока управляется с помощью стилей CSS.

Cодержимое тега <DIV> всегда начинается с новой строки. После него также добавляется перенос строки.

Параметры [2, 16]:

· align – задает выравнивание содержимого тега <DIV>. Аргументы:

o center – выравнивание текста по центру;

o left (значение по умолчанию) – выравнивание текста по левому краю;

o right – выравнивание текста по правому краю;

o justify – выравнивание по ширине, что означает одновременное выравнивание по левому и правому краю.

· title – добавляет поясняющий текст к контейнеру <DIV> в виде всплывающей подсказки, которая отображается, когда курсор мыши задерживается на содержимом. В качестве аргумента принимает любую текстовую строку. Строка должна заключаться в двойные или одинарные кавычки.

2.1.3.3.2. Таблица

На строке 21 находится тег <TABLE>.

Для добавления таблицы на веб-страницу используется тег-контейнер <TABLE> [17]. Таблица состоит из строк и столбцов ячеек, которые могут содержать текст и рисунки. Обычно таблицы используются для упорядочения и представления данных, однако возможности таблиц этим не ограничиваются. C помощью таблиц удобно верстать макеты страниц, расположив нужным образом фрагменты текста и изображений.

Для добавления строк используется тег <TR>. Чтобы разделить строки на колонки применяются теги <TD> и <TH>. Разница между этими тегами следующая. Тег <TH> предназначен для создания заголовков, содержимое такой ячейки обозначается жирным начертанием и выравнивается по центру. В остальном, действуют эти теги одинаково.

У каждого параметра таблицы есть свое значение, установленное по умолчанию. Это означает, что если какой-то атрибут пропущен, то неявно он все равно присутствует, причем с некоторым значением. Из-за чего вид таблицы может оказаться совсем другим, нежели предполагал разработчик.

Чтобы понимать, что можно ожидать от таблиц, следует знать их явные и неявные особенности, которые перечислены далее:

· одну таблицу допускается помещать внутрь ячейки другой таблицы;

· размеры таблицы изначально не установлены и вычисляются на основе содержимого ячеек;

· если для таблицы задана ее ширина в процентах или пикселах, то содержимое таблицы подстраивается под указанные размеры;

· если ширину содержимого ячейки невозможно изменить, то ширина таблицы увеличивается, несмотря на указанные размеры;

· пока таблица не загрузится полностью, ее содержимое не начнет отображаться;

· таблица, если не указано особо, всегда выравнивается по левому краю;

· по умолчанию таблица выводится без рамки;

Для изменения вида и свойств таблицы используется множество параметров, которые добавляются в теге <TABLE>. Описание параметров таблицы и их значений приведено в Табл. 2.2.

Табл. 2.2. Параметры тега <table>

Свойство Значение Описание
align left right center Выравнивание таблицы.
background Гиперссылка Определяет изображение, которое будет использоваться в качестве фонового рисунка таблицы.
bgcolor Код или название цвета Цвет фона таблицы.
border Число Толщина рамки в пикселах.
cellpadding Число Расстояние между ячейкой и ее содержимым.
cellspacing Число Дистанция между ячейками.
cols Число Задает количество столбцов в таблице, помогая браузеру в подготовке к ее отображению.
nowrap   Запрещает переносы строк в тексте.
frame void above below lhs rhs hsides vsides box Задание типа рамки таблицы
rules all groups cols none rows Определяет, где рисовать границы между ячейками.
width Число или проценты Минимальная ширина таблицы, можно задавать в пикселах или процентах.

2.1.3.3.3. Заголовки

На строке 24 (а также 57) находится тег заголовка <H1> (<H2>).

Заголовки выполняют важную функцию на веб-странице [18]:

· они показывают важность раздела, к которому относятся, т.е. чем больше заголовок, тем более он значимый;

· с помощью различных заголовков легко регулировать размер текста, т.е. чем выше уровень заголовка, тем больше размер шрифта (самым верхним уровнем является уровень 1 (<H1>), а самым нижним – уровень 6 (<H6>));

· поисковики добавляют рейтинг тексту, если он находится внутри тега заголовка.

Синтаксис создания заголовков следующий.

<h1>Заголовок первого уровня</h1>

<h2>Заголовок второго уровня</h2>

<h3>Заголовок третьего уровня</h3>

<h4>Заголовок четвертого уровня</h4>

<h5>Заголовок пятого уровня</h5>

<h6>Заголовок шестого уровня</h6>

Как правило, на веб-странице применяют заголовки с первого по третий уровень, их вполне достаточно. Редко когда приходится использовать заголовки более низкого уровня.

2.1.3.3.4. Ссылки

На строке 25 (а также в других местах) находится тег ссылки <A>.

Для создания ссылки необходимо сообщить браузеру, что является ссылкой, а также указать адрес документа, на который следует сделать ссылку [19]. Оба действия выполняются с помощью тега <A>, который имеет единственный обязательный параметр href. В качестве значения используется адрес документа (URL).

Адрес ссылки может быть абсолютным и относительным. Абсолютные адреса работают везде и всюду независимо от имени сайта или веб-страницы, где прописана ссылка. Начинаются они с указания протокола передачи данных. Так, для веб-страниц это обычно HTTP, соответственно, абсолютные ссылки начинаются с ключевого слова https://.

Относительные ссылки, как следует из их названия, построены относительно текущего документа или адреса. Примерами относительных ссылок могут служить:

/

/demo/

/images/pic.gif

../help/index.html

manual/info.html

Иногда можно встретить в адресе ссылки путь в виде./file/doc.html. Точка со слешем означает, что отсчет ведется от текущей папки. Подобная запись избыточна и ее можно сократить до file/doc.html.

2.1.3.3.5. Списки

На строке 47 начинается маркированный список.

<ul>
<li>
<span>Общее описание</span>
</li>
<li>
<a href="advantages.html" title="Преимущества">Преимущества</a>
</li>
</ul>

Маркированные списки позволяют разбить большой текст на отдельные блоки [20]. Тем самым привлекается внимание читателя к тексту и повышается его читабельность. С учетом того, что восприятие текста с экрана монитора хуже, чем с его печатного варианта, это является весьма полезным приемом.

Для установки маркированного списка используются теги <UL> и <LI>.

Для выбора типа маркера используется параметр type="..." тега <UL>. Маркеры могут принимать один из трех видов:

· круг (по умолчанию) – <ul type="disc">;

· окружность – <ul type="circle">;

· квадрат – <ul type="square">.

Нумерованные списки представляют собой набор элементов с их порядковыми номерами. Вид и тип нумерации зависит от параметров тега <OL>, который и используется для создания списка. В качестве маркеров могут быть следующие значения:

· арабские цифры;

· заглавные латинские буквы;

· строчные латинские буквы;

· заглавные римские цифры;

· строчные римские цифры.

2.1.3.3.6. Абзацы

На строках 58-60 отображены абзацы.

Как правило, блоки текста разделяют между собой абзацами (параграфами) [18]. По умолчанию между параграфами существует небольшой вертикальный отступ, называемый отбивкой. Каждый абзац начинается с тега <p> и должен иметь необязательный закрывающий тег </p>.

2.1.3.3.7. Изображения

На строке 60 имеется тег <IMG>.

<p><img src="images/ex.jpg" alt="Картинка" /></p>

Для встраивания изображения в документ используется тег <IMG>, имеющий обязательный параметр src, который определяет адрес файла с картинкой [21].

Закрывающий тег для <IMG> не требуетсяю. scr представляет собой путь к графическому файлу. Для его указания можно использовать как абсолютный, так и относительный адрес (также как и у тега <A>).

Как правило, в качестве формата графического файла выступает GIF и JPEG. Есть еще формат PNG, который также поддерживается браузерами при добавлении изображений и существует в двух ипостасях – PNG-8 и PNG-24.

Для изменения размеров изображения средствами HTML предусмотрены параметры width и height тега <IMG>.

Для создания альтернативного текста используется параметр alt тега <IMG>. Альтернативный текст позволяет получить текстовую информацию о рисунке при отключенной в браузере загрузке изображений. Поскольку загрузка изображений происходит после получения браузером информации о нем, то замещающий рисунок текст появляется раньше. А уже по мере загрузки текст будет сменяться изображением.

2.1.3.3.8. Другие элементы

Кроме элементов, в HTML-документах есть и сущности (entities) – «специальные символы» [22]. Сущности начинаются с символа амперсанда и имеют вид & имя; или &# NNNN;, где NNNN – код символа в Юникоде в десятеричной системе счисления. Например, &copy; – знак авторского права (©) (строка 66).

Тег <NOINDEX> (строка 18 и другие) — имя не входящего в официальную спецификацию тега языка гипертекстовой разметки веб-страниц HTML, предназначенного для включения в него частей веб-страниц, находящуюся между <noindex> и </noindex>, не предлагаемых к индексации поисковыми системами. Тег предложен российской компанией «Яндекс» в качестве альтернативы атрибуту nofollow (значение предназначено для поисковых систем: он указывает им на то, что гиперссылку, задаваемую тегом <A>, не следует никаким образом учитывать при индексировании данной страницы) и в настоящее время распознается российскими поисковыми системами Яндекс и Рамблер.

Тег <SPAN> (строка 49) предназначен для определения встроенных элементов документа. В отличие от блочных элементов, таких как <TABLE>, <P> или <DIV>, с помощью тега <SPAN> можно выделить часть информации внутри других тегов и установить для нее свой стиль.

2.1.4. Другие элементы языка HTML

В последних версиях HTML практически у каждого тега огромное число необязательных параметров – обычно не меньше 15. Приведем только основные параметры тегов [2, 23].

Текстовые блоки

· <BR> – новая строка. Этот тег не закрывается (то есть не существует тега </BR>);

· <HR> – горизонтальная линия;

· <BLOCKQUOTE> … </BLOCKQUOTE> – цитата (обычно текст сдвигается вправо);

· <PRE> … </PRE> – режим preview. В этом режиме текст заключается в рамку и никак не форматируется (то есть теги, кроме </PRE>, игнорируются, и переводы строки ставятся там, и только там, где они есть в оригинальном документе).

Форматирование текста

· <EM> … </EM> – логическое ударение (обычно отображается курсивным шрифтом);

· <STRONG> … </STRONG> – усиленное логическое ударение (обычно отображается жирным шрифтом);

· <I> … </I> – выделение текста курсивом;

· <B> … </B> – выделение текста жирным шрифтом;

· <U> … </U> – подчеркивание текста;

· <S> … </S> – зачеркивание текста;

· <STRIKE> … </STRIKE> – то же самое, что <S> … </S>;

· <BIG> … </BIG> – увеличение шрифта;

· <SMALL> … </SMALL> – уменьшение шрифта;

· <SUB> … </SUB> – подстрочный текст;

· <SUP> … </SUP> – надстрочный текст;

· <FONT параметры > … </FONT> – задание параметров шрифта:

o COLOR= color – задание цвета (в шестнадцатеричной форме или названием);

o FACE= шрифт меняет шрифт;

o SIZE= размер меняет размер шрифта (от 1 до 7, стандартный по умолчанию 3);

o SIZE=+ размер или SIZE=- размер – размер задается по сравнению со стандартным.

Объекты

· EMBED – вставка различных объектов: не-HTML документов и media-файлов;

· APPLET – вставка Java-апплетов.

Формы

Создание форм в HTML является довольно сложным делом. Здесь приводятся только названия основных тегов.

· FORM – создание формы;

· INPUT – элемент ввода (может иметь разные функции – от ввода текста до отправки формы);

· TEXTAREA – текстовая область (многострочное поле для ввода текста);

· SELECT – список (обычно в виде выпадающего меню);

· OPTION – пункт списка.

 


XHTML

XHTML (Extensible Hypertext Markup Language, расширяемый язык разметки гипертекста) – язык разметки веб-страниц, по возможностям сопоставимый с HTML, созданный на базе XML [23]. Как и HTML, XHTML соответствует спецификации SGML, поскольку XML является ее подмножеством. Вариант XHTML 1.1 одобрен в качестве Рекомендации Консорциума Всемирной паутины (W3C) 31 мая 2001 года.

Стандарт XHTML построен не как самодостаточное описание языка, а как перечень различий между HTML 4.01 и XHTML [2]:

· Все элементы должны быть закрыты. Теги, которые не имеют закрывающего тега (например, <img> или <br>) должны иметь на конце / (например, <br />).

· Булевы атрибуты записываются в развернутой форме. Например, следует писать <option selected="selected"> или <td nowrap="nowrap">.

· Имена тегов и атрибутов должны быть записаны строчными буквами (например, <img alt="" /> вместо <IMG ALT="" />).

· XHTML гораздо строже относится к ошибкам в коде; < и & везде, даже в URL, должны замещаться &lt; и &amp; соответственно. По рекомендации W3C браузеры, встретив ошибку в XHTML, должны сообщить о ней и не обрабатывать документ. Для HTML браузеры должны были попытаться понять, что хотел сказать автор.

· Кодировкой по умолчанию является UTF-8 (в отличие от HTML, где кодировкой по умолчанию является ISO 8859-1).

Для XHTML страниц рекомендуется задавать MIME-тип – application/xhtml+xml, но это не является обязательным, более того – браузер Internet Explorer 8 и младшие версии, не смогут обрабатывать страницу, поэтому с XHTML 1.0 традиционно используется MIME-тип для HTML – text/html.

Версии XHTML:

· XHTML 1.0 Переходный (Transitional): предназначен для легкой миграции из HTML 3.2 и для тех, кто использует инлайн-фрэймы.

· XHTML 1.0 Строгий (Strict): полностью отделяет содержание документа от оформления (которое теперь задается только через CSS), многие атрибуты (такие как, например, bgcolor и align) более не поддерживаются, их поведение можно задавать только через таблицу стилей.

· XHTML 1.0 Фрэймовый (Frameset): используется, если необходимо разделить окно браузера на несколько фрэймов.

· XHTML 1.1 Модульный (Module-based): авторы могут импортировать дополнительные свойства в их разметку.

· XHTML Основной (Basic): специальная облегченная версия XHTML для устройств, которые не могут использовать полный набор элементов XHTML – в основном используется в миниатюрных устройствах, таких как мобильные телефоны. Подразумевается, что он заменит WML и C-HTML.

· XHTML мобильного профиля (Mobile Profile): основанный на XHTML Basic, добавляет специфические элементы для мобильных телефонов.

· XHTML 2.0. Пока в разработке. Синтаксис еще больше приближен к синтаксису XML. Также является модульным языком.

Валидным (т. е. отвечающим всем правилам) XHTML-документом считается документ, удовлетворяющий технической спецификации [24]. В идеале, все браузеры должны следовать веб-стандартам и, в соответствии с ними, валидные документы должны отображаться во всех браузерах на всех платформах. Валидация XHTML-документа рекомендована даже, несмотря на то, что она не гарантирует кросс-браузерности. Документ может быть проверен на соответствие спецификации с помощью онлайновой Службы валидации разметки W3C. Валидация обнаружит и разъяснит ошибки в XHTML-разметке.

Валидный документ должен содержать определение типа документа (DTD). DTD должен быть расположен до всех других элементов документа. Вот наиболее распространенные типы DTD для XHTML:

XHTML 1.0 Strict

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

XHTML 1.0 Transitional

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

XHTML 1.0 Frameset

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "https://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">

XHTML 1.1

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "https://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">

Самыми распространенными ошибками в XHTML-разметке являются:

· Незакрытые элементы (XHTML, в отличие от HTML, требует закрытия всех элементов, в том числе не имеющих закрывающего тега, как, например, <br />).

· Отсутствие альтернативных текстов для изображений (достигающийся применением атрибута alt, который помогает сделать документы доступнее для устройств, которые не в состоянии отображать изображения, или предназначенных для слабовидящих людей).

· Присутствие текста непосредственно в теге <body> документа (должен быть объявлен блочный элемент, внутрь которого следует помещать содержимое).

· Вложение блочных элементов внутрь инлайновых (внутристрочных) (например, блочные элементы <div> или <p> не могут быть вложены внутрь инлайновых элементов <a>, <span>, <em> и так далее).

· Пренебрежение заключением значений атрибутов в кавычки (<a href=https://www.ru/> вместо <a href="https://www.ru/">).

· Неправильное вложение элементов (конструкции вида <strong> <em> </strong> </em>).

· Неправильное использование ссылок-мнемоник (например, & вместо &amp;)

· Написание тегов и/или атрибутов прописными буквами (<DIV STYLE="…"> вместо <div style="...">).

· Задание в теге <!DOCTYPE …> относительного пути к DTD-файлу, скопированного с сайта www.w3.org ("DTD/xhtml11.dtd" вместо "https://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd").

Валидный XHTML-документ можно снабжать специальным баннером W3C, подтверждающим валидность XHTML-разметки.

2.1.6. Ключевые термины

HTML, Веб-браузер, W3C, Теги, DTD, Заголовок документа, Метатеги, Теги <LINK>, <title>, <SCRIPT>, Тело документа, Теги <DIV>, <TABLE>, <H1>, <A>, <IMG>, <SPAN>, Маркированные списки, Параграфы, XHTML.

2.2. Краткие итоги

HTML – стандартный язык разметки документов во Всемирной паутине.

Текстовые документы, содержащие код на языке HTML (такие документы традиционно имеют расширение.html или.htm), обрабатываются специальными приложениями, которые отображают документ в его форматированном виде, называемые «браузерами» или «интернет-обозревателями».

HTML – это теговый язык разметки документов. Чтобы браузер понимал, что имеет дело не с простым текстом, а с особым элементом, который задает его форматирование, применяются теги.

Теги бывают одиночными и парными (контейнеры).

Обычные веб-страницы состоят из двух разделов – заголовка (<HEAD>) и тела документа (<BODY>). Раздел заголовка может содержать текст и теги, но содержимое этого раздела не показывается напрямую на странице. Тело документа предназначено для размещения тегов и содержательной части.

DTD – язык описания структуры SGML-документа. DTD на HTML-странице задается с помощью <!DOCTYPE>, которые различаются в зависимости от версии HTML, на которую ориентированы.

Метатеги используются для хранения информации предназначенной для браузеров и поисковых систем.

Тег <TITLE> используется для отображения заголовка документа (строки текста) в левом верхнем углу окна браузера.

Тег <LINK> устанавливает связь с внешним документом вроде файла со стилями или со шрифтами.

Тег <SCRIPT> предназначен для описания скриптов, может содержать ссылку на программу или ее текст на определенном языке.

Элемент <DIV> является блочным элементом и предназначен для выделения фрагмента документа с целью изменения вида содержимого.

Для добавления таблицы на веб-страницу используется тег-контейнер <TABLE>.

На строке 24 (а также 57) находится тег заголовка <H1> (<H2>).

Заголовки обозначаются тегами <H1>, <H2>,…, <H6>.

На строке 25 (а также в других местах) находится тег ссылки <A>.

Для создания ссылки используется тег <A>, сообщающий браузеру, что текст, заключенный в него, является ссылкой, а также указывающий адрес документа, на который следует сделать ссылку.

Для установки маркированного списка используются теги <UL> и <LI>.

Блоки текста разделяют между собой абзацами (параграфами) с помощью тега <p>.

Для встраивания изображения в документ используется тег <IMG>.

Тег <SPAN> предназначен для определения встроенных элементов документа.

XHTML – язык разметки веб-страниц, по возможностям сопоставимый с HTML, созданный на базе XML.

2.3. Набор для практики

Вопросы для самопроверки

1. Укажите, приложением какого языка разметки является HTML:

a) OWL

b) SGML

c) XML

d) XHTML

2. Укажите некорректный синтаксис применения тега в HTML:

a) <тег параметр1="значение" параметр2="значение">

b) <тег параметр1="значение" параметр2="значение">...</тег>

c) <тег параметр1=значение параметр2=значение>

d) <тег параметр2="значение" параметр1="значение">...</тег>

e) <тег параметр1="значение" параметр2="значение" />

3. Выберите неверное высказывание по поводу свойств HTML-тегов:

a) Теги не чувствительны к регистру

b) Если для тега не до



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-16 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: