Работа с RSS
Руководитель НИРС | (подпись) | (Н.А. Борсук) |
Исполнитель НИРС, студент группы ЭВМ.Б-61 | (подпись) (подпись) | () () |
Калуга, 2014
Федеральное государственное образовательное учреждение высшего профессионального образования
«Московский государственный технический университет имени Н.Э. Баумана»
(МГТУ им. Н.Э. Баумана)
ЗАДАНИЕ
На выполнение НИРС
Студент_________________________________________________________________________
(фамилия, инициалы, индекс группы)
Руководитель____________________________________________________________________
(фамилия, инициалы)
График выполнения НИРС: 25% к____нед., 50% к____нед., 75% к____нед., 100% к____нед.
Количество проведенных консультаций_____________
1. Тема НИРС
________________________________________________________________________________
________________________________________________________________________________
Оформление НИРС
2.1. Отчет по НИРС на________ листах формата А4.
3. Заключение руководителя НИРС
________________________________________________________________________________
________________________________________________________________________________
________________________________________________________________________________
Дата выдачи задания «_______»_____________20____г.
Руководитель НИРС___________________________(____________________________)
ф.и.о.
Задание получил______________________________(____________________________)
ф.и.о.
«_____»______________20____г.
РЕФЕРАТ
СОДЕРЖАНИЕ
ВВЕДЕНИЕ.. 2
Что такое RSS?. 3
Что такое PHP?. 6
Возможности PHP. 7
Почему именно PHP. 9
Что такое MySQL?. 10
Возможности MySQL.. 10
Функции для работы с базой данных. 12
ЗАКЛЮЧЕНИЕ.. 17
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ.. 18
ПРИЛОЖЕНИЕ.. 19
ВВЕДЕНИЕ
Сегодня, все актуальнее и острее становится проблема качественного отбора информации. Интернет сосредоточил в себе огромное количество информации, и чтобы отобрать необходимые сведения порой приходится затратить большое количество времени. В наше время информация имеет цену, а тот, кто владеет необходимыми данными обладает приемуществом перед конкурентами. Немало важным в этой отрасли является качество и актуальность сведений (новостей). Информированность пользователя – важная состовляющая в современном мире.
|
Существует множество способов донесения информации. RSS технологии позволяют быстро, качественно, и не назойливо доносить необходимые сведения до аудитории. Одним из главных преимуществ RSS является как возможность выборочного отбора аудитории, так и выборочного отбора информации.
Цель данной работы показать принципы работы с RSS технологиями.
Что такое RSS?
RSS – это файл XML формата, в котором содержатся последние изменения на сайте – добавление последних материалов и т.д. RSS (Really Simple Syndication) называется RSS лентой, при помощи RSS ленты владельцы сайтов могут распространять информацию своего сайта, то есть посетители его сайта, которые подписались на чтение его RSS ленты, получают краткое описание последних добавленных материалов и ссылку на полную новость.
Для пользователя, RSS лента – очень удобный инструмент получения информации об изменениях на нескольких сайтах одновременно, и при этом, всё в одном стиле, и не требуется вводить никаких адресов и т.д.
Для владельца сайта, RSS лента поможет максимально быстро донести читателям об изменениях на сайте. Все читатели ленты обязательно узнают, о новых материалах на сайте, а без RSS ленты, они могут просто забыть зайти посмотреть обновления, или не попасть в нужную категорию, где произошло обновление.
|
Большинство современных браузеров, интернет пейджеров и почтовых клиентов могут работать с RSS лентами, и читать RSS можно с их помощью, но есть и специальные программы – RSS - агрегаторы, которые собирают и обрабатывают информацию с нескольких RSS каналов. Также, читать RSS можно при помощи специальных сервисов в сети, которые собирают информацию с ваших лент и представляют вам в удобном виде.
Преимущества RSS ленты:
1) Экономия трафика для пользователей сайта.
2) Информирование пользователей о новых добавлениях.
3) Продвижение сайта с помощью rss каталогов.
4) Приток посетителей с rss-ленты.
Структура RSS ленты.
Ниже предоставлена структура RSS ленты у версии формата RSS 2.0.
<?xml version="1.0"?> <rss version="2.0"> <channel> <title>Название RSS ленты</title> <link>Ссылка на сайт ленты (ваш сайт)</link> <description>Краткое описание ленты (3-4 предложения)</description> <item> <title>Название новости</title> <link>Ссылка на новость в интернете</link> <description>Сокращенный текст (описание) статьи, новости</description> <author>Имя автора</author> <pubDate>Дата публикации новости</pubDate> </item>... <item> <title>Название статьи </title> <link>Ссылка на статью, новость в интернете</link> <description>Описание</description> <author>Имя автора</author> <pubDate>Дата публикации</pubDate> </item> </channel> </rss>
Элементы RSS ленты.
Обязательные элементы канала
title - Имя RSS канала. Оно, например, может совпадать с названием сайта.
|
description - Краткое описание RSS канала.
link - Ссылка на сайт, с которым связан канал.
Необязательные элементы канала (channel)
language - Язык канала (en-us - Английский; ru - Русский).
copyright - Копирайт или сведения об авторстве на RSS ленту.
managingEditor - Email адрес ответственного за контент канала.
webMaster - Email адрес ответственного за техническую часть публикации канала.
pubDate - Дата публикации канала.
lastBuildDate - Время последней модификации канала.
category - Одна или несколько категорий, к которым принадлежит канал.
generator - Название программы, использованной для генерирования RSS канала.
docs - Ссылка на файл документации подвида RSS, который был использован для создания канала.
ttl - Ttl расшифровывается как ‘time to live’. Это число минут, в течение которых канал сохраняет свою актуальность.
image - Используется для подключения графического файла (GIF, JPEG, или PNG), который будет показан вместе с RSS каналом. Имеет следующие параметры:
title - обычно тот же текст, что и в RSS title;
description - описание графического файла, которое будет показано, если файл не доступен;
link - ссылка на страницу, с которой связан канал;
url - URL на файл формата JPEG, GIF или PNG, который связан с RSS каналом;
width - ширина рисунка.
height - высота рисунка.
skipHours - Число часов, в течение которых RSS ридеры могут не проверять канал на обновления.
skipDays - Число дней, в течение которых RSS ридеры могут не проверять канал на обновления.
Обязательные элементы итема (item)
title - Имя итема (новости, сообщения) RSS канала.
description - Краткое описание итема.
link - ссылка на страницу, содержащую полное описание события.
Необязательные элементы итема (item)
author - Email адрес автора сообщения.
category - Категория итема.
comments - Ссылка на страницу с комментариями по итему.
enclosure - Описывает медиа-объект, присоединенный к итему. Имеет следующие параметры:
url - ссылка на файл объекта;
length - размер файла в байтах;
type - тип файла, в соответствии со спецификацией MIME.
guid - Уникальная строка, используемая для идентификации итема.
pubDate - Дата публикации итема.
Что такое PHP?
PHP (Personal HyperText Processor) - язык программирования, используемый на стороне WEB-сервера для динамической генерации HTML-страниц.
PHP - один из немногих языков программирования, созданных специально для разработки веб-приложений. Он включает в себя все функции, необходимые для работы на веб-сервере, и при этом лишен избыточности, свойственной многим его конкурентам.
Команды включаются в обычные HTML-страницы с помощью специальных тегов, которые заставляют PHP-машину выполнять на сервере нужные действия. Программам на PHP не нужны специальные CGI-директории с особыми правами доступа. Более того, на одной странице можно произвольно чередовать HTML и PHP-код.
PHP не зависит от платформы. PHP прекрасно интегрируется во все популярные веб-серверы: Apacce и IIS, Zens и Netscape Enterprise Server, работает под Windows и OS/2, MacOS и практически всеми UNIX-подобными системами. Поэтому PHP работает практически у всех хостеров, разрешающих собственные выполняемые скрипты.
PHP интегрируется практически со всеми современными интернет - технологиями. PHP поддерживает большинство современных веб-протоколов: IMAP, FTP, POP, XML, SNMP и другие. PHP прекрасно работает с базами данных. Трудно найти СУБД, поддержка которой не была бы реализована в PHP (MySQL и MS SQL Server, PostgreSQL и Oracle, Sybase и Interbase и т.д.)
PHP включает в себя огромное количество встроенных функций: обработки строк и массивов, работы с файловой системой и с HTTP, электронной почтой, датой и временем, кириллицей и другими национальными алфавитами.
Современные тенденции развития языков программирования не обошли стороной и PHP. Средства объектно-ориентированного программирования появились еще в PHP3. А в объектной модели PHP4 в полном объеме реализованы классические понятия объектно-ориентированного программирования: наследование, инкапсуляция и полиморфизм.
Возможности PHP
PHP может все. Главная область применения PHP - написание скриптов, работающих на стороне сервера; таким образом, PHP способен выполнять все то, что выполняет любая другая программа CGI, например, обрабатывать данные форм, генерировать динамические страницы или отсылать и принимать cookies. Но PHP способен выполнять намного больше.
Существуют три основных области применения PHP:
Создание скриптов для выполнения на стороне сервера. PHP традиционно и наиболее широко используется именно таким образом.
Создание скриптов для выполнения в командной строке. Вы можете создать PHP-скрипт, способный запускаться без сервера или браузера. Все, что вам потребуется - парсер PHP. Такой способ использования PHP идеально подходит для скриптов, которые должны выполняться регулярно, например, с помощью cron (на платформах *nix или Linux) или с помощью планировщика задач (Task Scheduler) на платформах Windows. Эти скрипты также могут быть использованы в задачах простой обработки текстов.
Создание оконных приложений, выполняющихся на стороне клиента. Возможно, PHP является не самым лучшим языком для создания подобных приложений, но, если вы очень хорошо знаете PHP и хотели бы использовать некоторые его возможности в своих клиентских приложениях.
PHP доступен для большинства операционных систем, включая Linux, многие модификации Unix (такие как HP-UX, Solaris и OpenBSD), Microsoft Windows, Mac OS X, RISC OS, и многие другие. Также в PHP включена поддержка большинства современных веб-серверов, таких как Apache, IIS и многих других. В принципе, подойдет любой веб-сервер, способный использовать бинарный файл FastCGI PHP, например, lighttpd или nginx. PHP может работать в качестве модуля или функционировать в качестве процессора CGI.
Таким образом, выбирая PHP, вы получаете свободу выбора операционной системы и веб-сервера. Более того, у вас появляется выбор между использованием процедурного или объектно-ориентированного программирования (ООП) или их сочетания.
PHP способен генерировать не только HTML. Доступно формирование изображений, файлов PDF и даже роликов Flash (с использованием libswf и Ming), создаваемых «на лету». PHP также способен генерировать любые текстовые данные, такие, как XHTML и другие XML-файлы. PHP может осуществлять автоматическую генерацию таких файлов и сохранять их в файловой системе вашего сервера вместо того, чтобы отдавать клиенту, организуя, таким образом, серверный кэш для вашего динамического контента.
Одним из значительных преимуществ PHP является поддержка широкого круга баз данных. Создать скрипт, использующий базы данных, - невероятно просто. Можно воспользоваться расширением, специфичным для отдельной базы данных (таким как mysql) или использовать уровень абстракции от базы данных или подсоединиться к любой базе данных, поддерживающей Открытый Стандарт Соединения Баз Данных (ODBC)
PHP также поддерживает «общение» с другими сервисами через такие протоколы, как LDAP, IMAP, SNMP, NNTP, POP3, HTTP, COM (на платформах Windows) и многих других. Кроме того, вы получаете возможность работать с сетевыми сокетами напрямую. PHP поддерживает стандарт обмена сложными структурами данных WDDX практически между всеми языками веб-программирования. Обращая внимание на взаимодействие между различными языками, следует упомянуть о поддержке объектов Java и возможности их использования в качестве объектов PHP.
Почему именно PHP
Достойный внимания сайт должен поддерживать некоторый уровень интерактивности с пользователем: поиск информации, продажа продуктов, конференции и т.п. Традиционно все это реализовалось CGI-скриптами, написанными на Perl. Но CGI- скрипты очень плохо масштабируемы. Каждый новый вызов CGI, требует от ядра порождения нового процесса, а это занимает процессорное время и тратит оперативную память. PHP предлагает другой вариант – он работает как часть Web-сервера, и этим самым похож на ASP от Microsoft.
Синтаксис PHP очень похож на синтаксис C или Perl. Люди, знакомые с программированием, очень быстро смогут начать писать программы на PHP. В этом языке нет строгой типизации данных и нет необходимости в действиях по выделению/освобождению памяти.
Программы, написанные на PHP, достаточно легкочитаемы. Написанный PHP – код легко зрительно прочитать и понять, в отличие от Perl-программ.
Что такое MySQL?
MySQL – компактный многопоточный сервер баз данных. MySQL характеризуется большой скоростью, устойчивостью и легкостью в использовании.
MySQL был разработан компанией TcX для внутренних нужд, которые заключались в быстрой обработке очень больших баз данных. Компания утверждает, что использует MySQL с 1996 года на сервере с более чем 40 БД, которые содержат 10,000 таблиц, из которых более чем 500 имеют более 7 миллионов строк.
MySQL является идеальным решением для малых и средних приложений. Исходники сервера компилируются на множестве платформ. Наиболее полно возможности сервера проявляются на Unix-серверах, где есть поддержка многопоточности, что дает значительный прирост производительности.
На текущий момент MySQL все еще в стадии разработки, хотя версии 3.22 полностью работоспособны.
MySQL-сервер является бесплатным для некоммерческого использования.
Возможности MySQL
MySQL поддерживает язык запросов SQL в стандарте ANSI 92, и кроме этого имеет множество расширений к этому стандарту, которых нет ни в одной другой СУБД.
Краткий перечень возможностей MySQL.
Поддерживается неограниченное количество пользователей, одновременно работающих с базой данных.
Количество строк в таблицах может достигать 50 млн.
Быстрое выполнение команд. Возможно MySQL самый быстрый сервер из существующих.
Простая и эффективная система безопасности.
MySQL действительно очень быстрый сервер, но для достижения этого разработчикам пришлось пожертвовать некоторыми требованиями к реляционным СУБД.
В MySQL отсутствуют:
Поддержка вложенных запросов, типа SELECT * FROM table1 WHERE id IN (SELECT id FROM table2).
Не реализована поддержка транзакций. Взамен предлагается использовать LOCK/UNLOCK TABLE.
Нет поддержки триггеров и хранимых процедур.
По словам создателей именно эти пункты дали возможность достичь высокого быстродействия. Их реализация существенно снижает скорость сервера. Эти возможности не являются критичными при создании Web-приложений, что в сочетании с высоким быстродействием и малой ценой позволило серверу приобрести большую популярность.
Функции для работы с базой данных
В PHP реализован набор функций, позволяющих скрипту взаимодействовать с MySQL. Для того чтобы воспользоваться базой данных, необходимо установить соединение между клиентской программой (в данном случае программой, написанной на языке PHP) и сервером MySQL.
Установить соединение можно при помощи функции:
mysql_connect("хост[:порт][сокет]", "имя пользователя", "пароль")
Функция получает три входных параметра: хост, имя пользователя и пароль. Хост – имя сервера, на котором установлена СУБД. В случае, если веб-сервер и сервер базы данных работают на одной машине, значение параметра хост имеет значение "localhost". После имени хоста можно так же указать порт и путь к сокету. Это необходимо в случае, если в настройках используются порт и сокет, отличные от установленных по умолчанию.
Имя пользователя – логин пользователя, которому разрешен доступ к СУБД.
Пароль – пароль пользователя, которому разрешен доступ к СУБД.
Функция возвращает идентификатор соединения в случае успеха и значение "ложь" при неудаче. Идентификатор соединения будет использоваться при вызове всех функций, посылающих запросы серверу MySQL.
Если сделать повторный вызов rnysql_connect с теми же аргументами, новое соединение с сервером не будет установлено; будет возвращен идентификатор уже открытого соединения.
Обычно логин и пароль пользователя устанавливаются системным администратором.
После установки для обращения к MySQL достаточно указать в качестве хоста localhost, а в качестве имени пользователя и пароля использовать пустые строки (создание пользователей и раздача прав доступа осуществляется после установки администратором).
После завершения работы PHP-программы соединение будет автоматически закрыто. Однако если возникает необходимость закрыть соединение в процессе работы программы, можно воспользоваться функцией