Краткие теоретические сведения




Интернет представляет собой глобальную сеть компьютерных сетей и существует в той или иной форме с 1961 года - именно тогда Пентагон объединил вычислительные сети различных родов войск. В 1982 году была завершена разработка единого протокола передачи данных для объединённых компьютерных сетей - TCP / IP. Расшифровывается он как протокол управления передачей (Transaction Control Protocol, TCP) и протокол Интернет (Internet Protocol). Само слово Internet произошло от interconnected networks, то есть «соединённые сети». Сегодня в Интернет входят практически все существующие глобальные сети, из американских это AOL и CompuServe, из российских - Relcom. Важно отметить, что Интернет - децентрализованная сеть, то есть у неё нет и не было никакого управляющего центра. Есть только единый протокол обмена информацией - TCP / IP и некие общие правила, по которым действуют все участники сети.

Чтобы посетить какой-нибудь сайт, надо знать его адрес (URL) [78]. Возьмём для примера такой адрес https://www.microsoft.com. Первые четыре буквы, т. е. http - это протокол, по которому браузер будет загружать данные с веб-страницы. Аббревиатура http расшифровывается как HyperText Transfer Protocol. В переводе на русский язык - «протокол передачи гипертекста», т. е. HTML -документов. Ранее так и было. Но теперь протокол стал поистине универсальным: по нему пересылаются изображения, бинарные файлы, ведутся конференции видео/аудио и т.д. Одним из самых распространённых убеждений является то, что Интернет состоит только из web-сайтов. На самом деле это не так. Существует множество протоколов, позволяющих работать с различными типами данных. Например, при помощи РОРЗ принимаются сообщения e - mail, a News позволяет работать с группами новостей [13].

Далее идёт www, что расшифровывается как World Wide Web. Так иногда называют Интернет. До не давнего времени адреса сайтов должны были иметь приставку www. Теперь это необязательно, и получить доступ к веб-странице можно и без набора этой аббревиатуры.

После www ставится точка и идёт собственно само имя сайта (домен). В рассматриваемом примере, это Microsoft. Домен выбирается самостоятельно компанией. Причём его использование не бесплатно (около 20$ в год). Последнее - принадлежность сайта к одной из групп. Например, если в адресе страницы стоит ru после имени домена, то эта страница имеет некую принадлежность к русскому Интернету (хотя необязательно).

Для просмотра web-страниц используются специальные программы - браузеры. К числу наиболее популярных относится браузер Internet Explorer, входящий в стандартную поставку Windows, а также Netscape Communicator.

Язык поисковых запросов на примере поисковой машины Rambler.

Поисковый запрос может состоять из одного или нескольких слов, в нём могут присутствовать знаки препинания. Составлять простые запросы можно и не вдаваясь в тонкости языка запросов. Так, если ввести в поисковую строку несколько слов без знаков препинания и логических операторов, будут найдены документы, содержащие все эти слова (причём на ограниченном расстоянии друг от друга). Однако знание и правильное применение языка запросов поисковой машины поможет сделать Ваш поиск быстрым и эффективным.

Регистр. В общем случае, регистр написания поисковых слов и операторов значения не имеет, то есть компьютер и КОМПЬЮТЕР, Money и money воспринимаются одинаково. И лишь иногда, в целях повышения качества поиска, регистр слов поискового запроса принимается во внимание.

Например, если запрос состоит из двух, трёх или четырёх слов, каждое из которых написано с большой буквы, то предполагается поиск по имени собственному, и автоматически производится изменение ограничения расстояния между словами запроса со значения по умолчанию на величину (n-1)*2, где n - количество слов запроса. Это позволяет находить группу слов запроса, внутри которой есть не более одного «лишнего» слова или знака препинания, например «Баден-Баден», «А. Пушкин», «Федор Михайлович Достоевский».

Операторы. Запрос, состоящий из нескольких слов, может содержать операторы. Поиск операторов в документе не производится, они служат лишь инструкцией поисковой машине. Все операторы поисковой машины бинарные, то есть имеют левую и правую часть, каждая из которых также является запросом (по умолчанию состоящим из одного слова). Для изменения сферы действия операторов (группировки нескольких слов запроса в аргумент оператора) применяются скобки и кавычки.

Два запроса, соединённые оператором AND (логическое И) образуют сложный запрос, которому удовлетворяют только те документы, которые одновременно удовлетворяют обоим этим запросам. Иными словами, по запросу «монитор AND принтер » найдутся только те документы, которые содержат и слово «монитор », и слово «принтер ».

Сложному запросу, состоящему из двух запросов, соединённых оператором OR (логическое ИЛИ) удовлетворяют все документы, удовлетворяющие хотя бы одному из этих двух запросов. По запросу «монитор OR принтер » найдутся документы, в которых есть хотя бы одно из слов «монитор » или «принтер » (либо оба эти слова вместе).

Оператор NOT (логическое И-НЕ) образует запрос, которому отвечают документы, удовлетворяющие левой части запроса и не удовлетворяющие правой. Так, результатом поиска по запросу «монитор NOT принтер » будут все документы, в которых есть слово «монитор» и нет слова «принтер ».

Если оператор явно не указан, используется оператор по умолчанию AND: находятся только документы, содержащие все слова запроса. Так, запрос «информация приказы ФСИН » будет истолкован как «информация AND приказы AND ФСИН ». Операторы AND и OR имеют сокращенные обозначения:

Оператор Сокращенное обозначение
AND &
OR |

Запрос из нескольких слов, перемежающихся операторами, будет истолкован в соответствии с их приоритетом. Операторы AND и NOT традиционно имеют более высокий приоритет, поэтому запрос из нескольких слов при обработке сначала группируется по операторам AND и NOT, и лишь потом по операторам OR. Изменить порядок группировки можно использованием скобок.

Кавычки. Для поиска цитат можно использовать двойные кавычки. Слова запроса, заключённого в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они встретились в запросе. Таким образом, двойные кавычки можно использовать и просто для поиска слова в заданной форме (по умолчанию слова находятся во всех формах). Например, запросу «самолёт "заправился" посадка» удовлетворяет документ, содержащий текст «... самолёт совершил посадку и заправился...», и не удовлетворяет документ, содержащий «.. самолет совершил посадку, чтобы заправиться...».

Метасимволы. Рамблер пока не поддерживает поиск строк с использованием метасимволов («*», «?»), которые обычно используются в значении «любая подстрока» и «произвольный одиночный символ» соответственно. Тем не менее, эти операторы зарезервированы для подобного использования в будущем.

Подготовка файлов для web-страницы.

Каждый HTML-документ, отвечающий спецификации HTML какой-либо версии, обязан начинаться со строки декларации версии HTML!DOCTYPE. Эта строка поможет браузеру определить, как правильно интерпретировать данный документ. В данном случае мы говорим браузеру, что HTML соответствует международной спецификации версии 3.2, которая хоть и не отличается новизной, но, в отличие от более поздних версий, является полноценным, широко распространённым стандартом без каких-либо неопределённостей.

После объявления версии и типа документа необходимо обозначить его начало и конец. Это делается с помощью тега-контейнера < HTML >. Необходимо отметить, что любой HTML -документ открывается тегом < HTML > и им же закрывается. Затем, между тегами < HTML > и </ HTML > следует разместить заголовок и тело документа. Вот как должен выглядеть Ваш базовый HTML-файл перед началом работы:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">

<HTML>

<HEAD>

<TITLE> Справочник сотрудника ОВД</TITLE>

</HEAD>

<BODY>

Личная страничка курсанта № уч. группы ФИО

</BODY>

</HTML>

Из приведённого HTML-кода видно, что документ состоит из двух основных блоков – «заголовка » и «тела документа ». Заголовок определяется с помощью элемента HEAD, а тело – элементом BODY.

Заголовок содержит «техническую» информацию о документе, хотя чаще всего используется только для обозначения его названия (элемент TITLE).

В теле документа (в пространстве между тегами < BODY > и </ BODY >) находится всё то, что отображается на странице: текст, картинки, таблицы. Более подробная информация о назначении различных тэгов языка HTML находится в приложении А.

Вопросы и задания для самопроверки

1. В чём различие между локальной и глобальной сетью?

2. Назовите предпосылки создания и развития сети Интернет.

3. Назовите протоколы работы с данными в сети Интеренет.

4. Учитывается ли регистр поисковых слов при выполнении запроса?

5. Какие операторы используются при формировании сложных запросов?

6. Поясните принцип действия оператора AND, приведите примеры.

7. Поясните принцип действия оператора OR, приведите примеры.

8. Поясните принцип действия оператора NOT, приведите примеры.

9. Опишите базовую структуру HTML -файла.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-04-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: