WWW через E-Mail, или Мой опыт использования www4mail-серверовНа главную страницу | Интернет | Хостинг | Сервисы Служба www4mail была разработана для пользователей, имеющих только почтовое подключение к Интернет, и дает доступ к веб-ресурсам сети Интернет по электронной почте. Однако эта служба может быть полезна также имеющим полное (IP) подключение к Интернет, позволяя получать те или иные ресурсы в той или иной степени быстрее, чем "прямо так", особенно если Вы имеете почтовый ящик у провайдера, через которого подключены к сети, а интересующий Вас веб-сервер перегружен или медленный. Эта статья не является полной инструкцией по использованию службы www4mail, а описывает основные команды, приемы и опыт работы автора. Она (статья) рассчитана главным образом на имеющих "полное" (IP-) подключение к Интернет. Работа со службами происходит следующим образом: пользователь отсылает по определенному адресу письмо, содержащее список команд. Робот исполняет команды и отправляет ответные письма, содержащее запрашиваемые Вами ресурсы, или сообщение об ошибке. Вот несколько адресов www4mail-служб:
1. www4mail@collaborium.org Одни сервера отвечают достаточно быстро (в пределах нескольких минут), другие - в течение нескольких часов, что, по-видимому, объясняется разной их загрузкой. Также на разных серверах может быть установлено ПО www4mail разных версий, имеющих несколько разные возможности. Так, на момент написания статьи на www4mail@ftp.uni-stuttgart.de стоял www4mail версии 2.0, на www4mail@access.bellanet.org - версии 3.0, а на "родине" www4mail www4mail@wm.ictp.trieste.it - версия 3.22 Большинство описанных здесь команд и возможностей относится ко всем этим версиям. Для получения списка команд, понимаемых службой www4mail (на английском языке), пошлите письмо с одной-единственной командой HELP. Все команды передаются непосредственно в теле письма. Во всех отправляемых сообщениях тема письма не имеет значения и может отсутствовать. Использование служб бесплатное, но имеет ограничения: по количеству запросов в неделю (100, 300 - как где настроено) и по объему запрашиваемого материала. В каждом ответе указывается полная "квота", использованная и оставшаяся. Причем один ответ может быть засчитан как несколько в зависимости от типа ресурса (HTML-страница, графика) и т.п. и объема. В зависимости от команд ресурс может пересылаться либо вложением, либо в теле письма.
Проблема с русским языком.Системы www4mail почему-то часто перекодируют тексты веб-страниц из кодировки KOI-8 в Windows-1251. Поэтому для работы с www4mail надо запастись еще и перекодировщиком текста. Не пугайтесь, если в любой кодировке Вы видите абракадабру - просто перекодируйте такой документ из Windows-1251 в KOI-8. Страницы не перекодируются, если передаются в сжатом виде. Используйте команду GETSIZE, как описано ниже.
Проблема с именами файлов.Все файлы, переданные системой вложением в письмо, имеют имена со структурой наподобие 8:3. Так, ресурс myfirstpage.phtml придет под именем irstpage.pht или page.pht.htm . Поэтому может понадобиться переименовать файл после получения, чтобы открыть его в нужной программе.
"Главная" команда.Для получения ресурсов я пользуюсь командой TSOURCE url которая задает передачу ресурса "как есть" вложением в письмо. В одном письме может быть до 5 команд TSOURCE, все ресурсы придут отдельными письмами. При передаче HTML-файла вложением система передает его "как есть", но записывает в его начало несколько строк, например:
<!-- saved from url=(0022)http://internet.e-mail --> Первые две строчки являются комментарием, третья оказывает реальную пользу: при загрузке документа в браузер все относительные ссылки становятся абсолютными, так что можно загрузить картинки или продолжить исследование веб-сайта уже в on-line. Кроме того, это не даст вам забыть, с какого URL была считана страница (очень удобно, особенно через некоторое время :) ). Однако, в ряде случаев "благодаря" этой строке страница нормально в браузер не загружается, тогда можно ее закомментировать, как две первые.
Особенности ввода URL.1. Если вводимый Вами URL настолько длинный, что почтовая программа разбивает его на несколько строчек, то Вы можете разбить URL на несколько строк, вводя в конце переносимых строк символ '\'. Например, URL: http://angel07.webservis.ru/perl/scripts/ можно ввести как:
http://angel07.webservis.ru/perl/\ или
http://angel07.webservis.ru/pe\
Получение ресурсов в сжатом виде, а также поделенными на фрагменты.По умолчанию, вложение присылается в несжатом виде в одном письме, если объем получившегося письма не превышает некоторого числа (300 кБ). Если же сформированное письмо превышает установленный объем, система пытается сжать его с помощью zip и передать в таком виде. Если же и это не помогает, тогда сжатый ресурс разбивается на несколько фрагментов (не более максимального размера письма), которые передаются вложенными соответственно в несколько писем. "Собирать" такой ресурс предоставляется пользователю. Установленный максимальный объем письма можно изменить следующей командой: GETSIZE xxx где xxx - максимальный объем письма в байтах. Таким образом, зная (примерно или точно) объем запрашиваемого ресурса, можно в команде GETSIZE указать заведомо меньший объем, чтобы получить его в сжатом виде. Или наоборот, если у Вас хорошая связь с Интернет (или выделенное соединение) и Вы не "боитесь" (в смысле возможных обрывов связи) получать большие письма, это число может быть увеличено - в этом случае переданный траффик будет меньше, чем при получении страницы фрагментами. Большинство поисковых машин при выводе результатов поиска показывают и объем найденного ресурса, этим значением удобно руководствоваться для получения ресурса в сжатом виде. Получение отдельных частей веб-ресурса.www4mail позволяет Вам не только получить полный ресурс в поделенном на фрагменты виде, но также получить отдельные такие фрагменты. Для этого совместно с командой GETSIZE можно использовать команду GETPART, скажем:GETPART 1,3-5
Таким образом можно, скажем, получить начало большого документа, чтобы ознакомиться с ним и решить, получать ли его весь. |
(c)Андрей Черный, 2002-2003г. |
На главную страницу | Интернет | Хостинг | Сервисы
|