Сервисы отложенного чтения

Онлайн-сервисы отложенного чтения

6 лет назад 18 декабря 2012 в 0:54 424

Идея сервисов отложенного чтения, или, как их еще иногда называют, сервисов послечтения, состоит в возможности отложить найденный в ходе серфинга материал, отправив его в «облачное» хранилище и на мобильный гаджет для последующего изучения.
Подобные сервисы также пригодятся для удобной подготовки и загрузки на свой гаджет различных сетевых материалов, которые понадобятся в работе, учебе или просто повседневной жизни. Чем плохо, например, посещать магазин во всеоружии заранее сохраненных описаний и обзоров?

Техзадание
А какие требования к «карманному» сервису? Начнем с того, что он должен быть экстремально прост и быстр в использовании, иначе потеряет свою прелесть. Поскольку материалы нам нужны в основном временно, до прочтения, весьма желательно, чтобы там были предусмотрены способы быстрой очистки синхронизируемого архива.

Ведь как только количество ссылок станет слишком большим, а «слишком» в данном случае – это количество, которое уже нельзя охватить одним взглядом или пролистать одним-двумя движениями пальцев, сервисы переходят в другой класс – менеджеров закладок, со своими требованиями и задачами, не лучшим образом совместимыми с отложенным чтением.

Планшеты и особенно ридеры максимально раскрывают свои возможности, если контент был предварительно соответствующим образом подготовлен. Поэтому следующее обязательное требование к сервису послечтения – подготовка материала именно к удобному чтению на относительно небольшом экране. На веб-страницах может быть расположена масса блоков и элементов, нужных только для серфинга и не относящихся напрямую к контенту. Это разнообразные виджеты, декоративные элементы дизайна, сложная верстка и другие подобные вещи, не говоря о рекламе.

Для чтения это как минимум бесполезно, только занимает место на экране. Продвинутые сервисы отложенного чтения, как правило, не просто сохраняют ссылки, но и оптимизируют материал для дальнейшего использования: меняют формат, выкидывают лишние элементы оформления, оставляя только полезное. Такая обработка – нетривиальная задача, поэтому мы протестируем алгоритмы на нескольких типовых веб-страницах: это статьи на крупных сайтах, посты блогов и форумов. Одним из наиболее сложных объектов являются страницы каталогов товаров.

Наконец, весьма важное для нас требование – взаимодействие с разными платформами. Все-таки мы в основном работаем с несколькими компьютерами и гаджетами, поэтому синхронизация в данном случае – очень полезная фишка. Оптимальный вариант – дополнение или букмарклет для «десктопного» браузера и специализированные клиенты для различных мобильных платформ.

В результате получается, что выбрать «карманный» менеджер закладок не такое простое дело, как может показаться на первый взгляд. Давайте познакомимся с палитрой решений, которые предлагает нам рынок. Как обычно, попробуем сэкономить и будем рассматривать только бесплатные предложения.

Pocket
Сервис Pocket (getpocket.com) – давно не новичок на рынке, это развитие известного в свое время ресурса ReadItLater. Это было весьма удобное дополнение, предназначенное для создания быстрых закладок на страницы не для их архивирования, а просто для того, чтобы однажды вернуться к ним в другой обстановке. Важная особенность этого сервиса – его дружественность к сторонним приложениям. Программ-агентов, взаимодействующих с Pocket, не просто много, а очень много.

Счет мобильных приложений, в которых интегрирована поддержка Pocket, идет на сотни: по подсчетам разработчиков Pocket, таких софтин больше трехсот. Есть и официальные клиенты, которые без труда можно найти в Google Play и эппловском App Store.

Добавлять страницы в синхронизируемый архив проще всего с помощью специального браузерного дополнения или букмарклета. Для «Маков» есть настольное приложение-клиент. При сохранении страницы предлагается указать теги, но это необязательно, так что можно не отвлекаться от серфинга. При желании отредактировать теги можно будет с помощью веб-интерфейса. Прочтенные записи можно удалять или архивировать.

Pocket идет в ногу со временем. Сейчас «закладочный» менеджер, способный работать только с текстом, уже постепенно становится анахронизмом. Pocket умеет создавать удобные ссылки на изображения и видеоролики. Такой контент автоматически распознается при попытке сохранить ссылку на страницу фото- или видеохостинга, и вместо малоинформативной текстовой ссылки сохраняется прямой линк на картинку или ролик с миниатюрой. Действует автоматический фильтр на основных медиапроектах в духе Flickr или YouTube. В идеале хотелось бы видеть инструменты ручного добавления подобного контента на неподдерживаемых пока медиасайтах.

В результате действительно получается «карманный» мультимедийный блокнот, удобный не только для синхронизации с гаджетами, но и для отложенного чтения на «большом» компьютере. Стиль взаимодействия с веб-интерфейсом Pocket, как мне кажется, несколько напоминает работу с сервисом Pinterest, однако без необходимости делиться записями со всем миром.

Если говорить о поддержке современных мобильных платформ для чтения, то она вполне хороша. Здесь представлены Android, iOS, Kindle, можно найти необходимые предложения для Windows Phone и BlackBerry. Есть также клиенты для «десктопов» и даже универсальный веб-интерфейс.

Оптимизация сохраненного контента для чтения на гаджетах возлагается на ПО. Если говорить об официальных клиентах для Android, iPhone и iPad, то даже само решение об оптимизации принимается автоматически. Относительно несложные страницы обрабатываются корректно: текст выводится в одну колонку, изображения сохраняются и аккуратно вставляются в нужные места. Если же верстка страницы слишком сложна, клиент переключается в режим Web View и показывает страницу без обработки.

В ходе тестирования такой режим активировался на некоторых форумах, а также страницах из онлайновых каталогов. С одной стороны, подобную осторожность можно отнести к недостаткам – мы лишаемся одного из преимуществ сервисов отложенного чтения. С другой – мы не рискуем увидеть пустую страницу вместо сложного документа, с версткой которого алгоритм сладить не сумел.

Instapaper
Как и Pocket, онлайн-сервис Instapaper (www.instapaper.com) в первую очередь играет роль платформы для сохранения страниц. За чтение собранных материалов на гаджетах отвечают программы-клиенты. И владельцы «яблочной» продукции, и хозяева «андроидов» останутся довольны. Кроме того, не забыты платформы Kindle и Nook. Вот только официальные мобильные клиенты здесь платные. Однако это не беда, можно использовать альтернативные предложения, например довольно функциональный бесплатный клиент InstaFetch Lite для iOS и Android.

Для работы на настольной машине предлагается универсальный букмарклет. Процесс сохранения быстрый, никаких форм заполнять не надо. Особенно отметим умение ресурса взаимодействовать с Google Reader: клик по букмарклету отправит в хранилище сервиса именно открытое в данный момент сообщение, а не всю страницу целиком. Инструментов управления коллекцией в онлайне здесь минимум. Сохраненный материал можно опубликовать на Facebook, Twitter или другом социальном сервисе, подключение которых предусмотрено настройками Instapaper.

В отличие от нашего первого участника, данный сервис самостоятельно проводит обработку поступающих материалов. Надо сказать, справляется он с этой работой качественно. Обычные статьи и ленты форумов для него – семечки. Проблемы возникали со страницами, содержащими фреймы. Instapaper их просто пропускал. Сбоил сервис и на стартовых страницах порталов и других подобных загруженных скриптами ресурсах, хотя вряд ли кто-то в реальности будет сохранять именно такие материалы для отложенного чтения.

Отдельно нужно отметить, что Instapaper достойно показал себя со страницами онлайновых каталогов, корректно обработав достаточно сложную верстку и не потеряв ни одного действительно полезного изображения. Есть панель быстрого выбора тем оформления обработанной версии текста. Сохраненные материалы можно скачать в форматах ePUB, MOBI, а также сгенерировать страницу для распечатки, правда, последняя опция является экспериментальной, о чем нас честно и предупреждают.

Readability
Собирать контент для сервиса Readability (www.readability.com) предлагается с помощью браузерных дополнений для Firefox, Chrome и Safari. После установки рядом с адресной строкой обозревателя появляется несколько новых кнопок. Кнопка Read Now запускает конвертирование страницы, благодаря чему можно сразу же посмотреть активную страницу, освобожденную от излишних дизайнерских выкрутасов. Кнопка Read Later обрабатывает и сохраняет страницу в онлайновом хранилище, не мешая серфингу. Поскольку все происходит в фоновом режиме, желательно использовать данную опцию только на сайтах, в качестве обработки которых алгоритмами Readability вы достаточно уверены.

Получается в целом неплохо. Блоги и отдельные статьи обрабатываются даже очень хорошо. Проблемы возникали, если на одной странице было несколько разделов, серьезно отличавшихся оформлением, – Readability периодически оставлял для чтения только первый раздел, ошибочно отрезая остальные как балласт. Еще одно неудобство связано с чтением многостраничных статей. Каждую страницу нужно сохранять отдельно, «склеить» их инструментами сервиса в единый материал нельзя – приходится обращаться к другим решениям.

С лентами форумов Readability справляется достойно: сообщения очищены и качественно структурированы, корректно выделяются цитаты, сохраняются внешние ссылки. Спотыкается Readability на форумах с древовидной структурой. Кроме того, он не умеет обрабатывать фреймы. Со сложными случаями сервис вообще справляется через раз. В частности, на странице каталога с описанием товара Readability оставил только небольшой блок текста, проигнорировав таблицу описания характеристик и блок иллюстраций, что лишило сохраненную версию страницы какой-либо практической пользы.

Параметрами преобразования можно управлять на страницах опций онлайнового аккаунта. Можно поменять общую тему оформления текста, которая содержит цвета и параметры шрифтов, поиграть с шириной боковых полей страницы и размером букв. Не так много возможностей, но они полезны.

Мобильные приложения Readability бесплатны. Поддерживаются платформы iOS и Android, сервис также работает с гаджетами Kindle. Функциональные возможности этих клиентов сопоставимы, немного отличается только их вид. Читалка позволяет менять шрифты, выбирать дневной и ночной режим отображения. При обнаружении сетевого подключения происходит синхронизация с онлайновым архивом, после чего можно спокойно читать загруженные материалы в офлайне.

SendtoReader
Сервис SendtoReader (sendtoreader.com) оптимизирован для работы с устройствами Kindle и обладает собственной уникальной функцией – наполнять архив контентом можно не только с помощью полноценного «настольного» браузера, но и непосредственно в ходе серфинга с мобильных гаджетов. Организован процесс довольно оригинально. Для отправки материала достаточно просто поставить перед адресом целевой страницы блок s2r.me/. Другими словами, в адресной строке браузера должна получиться вот такая конструкция: http://s2r.me/www..ru.

При переходе по такому составному адресу произойдет автоматическое копирование страницы в онлайновый архив SendtoReader и, соответственно, отправка обработанного текста на указанный в настройках девайс. Для использования этой опции не требуется установки каких-либо дополнений или букмарклетов. В то же время могут быть и сбои на больших или сложных документах. Поскольку какого-либо предпросмотра в этом случае нет, о неудаче вы узнаете, уже только попытавшись прочитать на своем гаджете полученный документ.

Собственно синхронизация идет штатным для любого Kindle способом. SendtoReader отправляет страницы на Kindle не напрямую, а через серверы Amazon. Это позволяет получать нужные документы на любом вашем экземпляре Kindle. В целом данный процесс может занять несколько минут.

В онлайновом хранилище SendtoReader есть собственный редактор, причем позволяющий как править текст в визуальном режиме, так и работать напрямую с HTML-кодом. Поддерживается импорт содержимого веб-страниц по ссылкам, указанным в поле Import Text from URL. После редактирования документ можно отправить на свой Kindle.

Некоторые юзеры, не желающие тратиться на премиум-аккаунты, используют возможности этого редактора для ручной «склейки» многостраничных онлайновых документов в одну книжку. Смысл состоит в ручном добавлении ссылок на все страницы большого документа. По ссылкам загружается содержимое указанных страниц, после чего остается только получить на свое устройство один большой документ, который уже можно читать, как говорится, со всем удобством.

Простые статьи и блоги обрабатываются хорошо, иллюстрации сохраняются достаточно аккуратно, комментарии, как правило, вырезаются. Содержимое лент форумов переносится корректно, правда, за счет радикального избавления от оформления, а также отсутствия настраиваемых тем читать сплошной текст, в котором находятся и ответы, и цитаты, несколько неудобно.

Зато SendtoReader, как и Instapaper, смог справиться с импортом страниц онлайновых каталогов. Конечно, некоторые иллюстрации и все скрипты были вырезаны, однако характеристики товаров остались на месте, так что пользоваться полученным документом можно.

Если вы захотите работать с данным сервисом с помощью устройства на Android, имеет смысл поставить приложение Kindle for Android. Оно умеет синхронизироваться с сервисами Amazon, так что со стороны SendtoReader никаких радикальных изменений не происходит, просто на втором этапе материал приходит на другое устройство. Есть аналогичное по возможностям приложение Kindle for iPad.

Evernote Clearly
Еще один вариант решения поставленных нами выше задач – использование браузерного дополнения Evernote Clearly (evernote.com/intl/ru/clearly), расширяющего возможности известного менеджера заметок Evernote. Это самый настоящий мультиплатформенный комбайн с большим количеством функций. Для того чтобы приспособить его для отложенного чтения, нужно научить Evernote автоматической очистке всех сохраняемых материалов. Этим и занимается Evernote Clearly.

Поддерживается сохранение как целых веб-страниц, так и отдельных фрагментов. Сохранение статей проходит удачно, равно как и работа с блогами, количество ошибок незначительно. Есть проблемы при взаимодействии с форумами – на некоторых движках сохраняется только первое сообщение темы.

Хотя в целом результаты удовлетворительные: отдельные посты тем хорошо читаются, корректно добавляются иллюстрации. На страницах с фреймами Clearly может вообще отказаться работать. Мультимедиа и скрипты не обрабатываются.

Предлагаются три готовые встроенные темы оформления, применяемые к очищаемым материалам. Кроме того, можно настроить собственную. Доступные опции – начертания и цвета шрифтов основных элементов (заголовки, текст), цвет фона и параметры строк, в частности расстояние между элементами. В расширенных настройках при желании можно написать собственный CSS-код.

У данного сервиса, пожалуй, самые продвинутые опции сортировки записей – сказывается родство с «большим» Evernote. Это инструменты «Похожие заметки» и «Умная каталогизация». В первом случае Evernote будет искать в вашем архиве похожие по содержанию заметки и выводить ссылки на них вместе с сохраненным контентом. Второй инструмент предназначен для автоматического тегирования сохраняемых заметок и автоматического же распределения контента по блокнотам.

Итоги
Применять вышеперечисленные службы можно как для оптовой загрузки новостей с последующим чтением, так и для знакомства со случайными материалами, на которые не хочется отвлекаться в данный момент. Их можно сохранить и посмотреть при наличии свободного времени.

Палитра инструментов отложенного чтения широка, несмотря на одинаковые стратегические цели, различные сервисы идут собственными путями в их достижении. Особняком стоит Pocket – это в первую очередь платформа хранения страниц. Он вполне комфортен при работе в «настольном» браузере, а вот подготовка контента к чтению на гаджетах отдана многочисленным программам-клиентам. При этом качество такой обработки будет полностью зависеть от них – сам Pocket этим не занимается.

Среди сервисов «полного профиля», с честной предварительной обработкой сохраняемых страниц ее лучшее качество обеспечивают Instapaper и специализирующийся на взаимодействии с Kindle SendtoReader. Они лучше других справились с большинством тестовых заданий, хотя идеального результата не показал ни один участник.

Недостаток Instapaper – платные мобильные клиенты – частично компенсируется наличием бесплатных альтернативных решений. Readability, несколько уступив Instapaper в качестве подготовки статей, предлагает изначально некоммерческое программное обеспечение.

Если вы уже используете Evernote, то инструмент Clearly может стать для вас хорошим выбором. Все-таки удобнее решать схожие задачи с помощью одного пакета, а не нескольких программ. Это в первую очередь ценно, если вы ориентированы на более-менее длительное сохранение материалов в общем архиве.

Основной недостаток такого способа – затрудненная очистка временного архива. Все-таки замусоривать рабочие блокноты Evernote материалами-однодневками может быть неудобно. Кроме того, у Clearly есть проблемы с обработкой некоторых типов страниц. UP

Рекомендуем почитать:

Xakep #242. Фаззинг

  • Подписка на «Хакер»

Решение Mozilla внедрить Pocket во все версии Firefox в свое время вызвало критику у специалистов по безопасности и обычных пользователей. Расширение не отключается и не удаляется никаким способом. Проблему даже оформили как тикет в баг-трекере Bugzilla, но разработчики из Mozilla не пошли на уступки и оставили Pocket в составе Firefox.

Теперь у критиков появился еще один аргумент. В Pocket найдено множество уязвимостей. И хотя разработчики выпустили патчи для них, но это ещё раз доказывает, что от расширения может быть больше вреда, чем пользы.

Pocket предназначен для сохранения веб-страниц и последующего чтения на компьютере или мобильном устройстве. Достаточно указать ему URL — и документ сохраняется на потом.

Специалист по безопасности Клинт Руохо (Clint Ruoho) попробовал «скормить» Pocket нестандартные ссылки.

  • file:///etc/passwd
  • ssh://localhost
  • telnet://localhost:25

Безуспешно. Зато повезло с другой ссылкой.

  • http://127.0.0.1/server-status

Сервер Pocket принял запрос и прислал ответ.

Apache Server Status for 127.0.0.1 Server Version: Apache/2.2.29 (Unix) DAV/2 Server Built: Mar 12 2015 03:50:17 Current Time: Tuesday, 28-Jul-2015 10:07:45 CDT Restart Time: Tuesday, 28-Jul-2015 03:20:12 CDT Parent Server Generation: 12 Server uptime: 6 hours 47 minutes 32 seconds Total accesses: 241913 — Total Traffic: 4.1 GB CPU Usage: u1209.24 s110.06 cu0 cs0 — 5.4% CPU load 9.89 requests/sec — 177.5 kB/second — 17.9 kB/request 40 requests currently being processed, 14 idle workers …

Дальше — больше. Оказалось, что Pocket использует в своей работе Amazon EC2. В сервисе EC2 есть служебная функция Instance Metadata and User Data, доступ к которой осуществляется локально без аутентификации. Но если отправить правильный URL «на сохранение» в Pocket, то как раз такой запрос и выполнится локально, выдав хакеру служебные метаданные о виртуальной машине: зона, тип инстанса, тип сети, MAC-адрес, сведения о подключенном устройстве хранения.

Пожалуй, самая опасная уязвимость связана с обработкой редиректов краулером Pocket. Если отправить ссылку, которая указывает редирект на file:///etc/passwd, то Pocket скачает-таки file:///etc/passwd с сервера.

HTTP/1.1 301 Moved Permanently Location: file:///etc/passwd Content-Length: 52 Date: Tue, 28 Jul 2015 18:42:58 GMT Connection: keep-alive Moved Permanently. Redirecting to file:///etc/passwd

Та же история с файлом file:///proc/self/status, который дает информацию о запущенных процессах.

У пользователей Firefox возникает вопрос: нужно ли такое «дырявое» расширение в браузере?