20080109

Просмотр вложений *.doc в виде простого текста

Не знаю кому как, а мне приходится получать пустые письма, к которым приложен файл DOC, PDF или, чего доброго, PPT, с двумя абзацами текста. Запускать OpenOffice всякий раз только для того, чтобы взглянуть про что письмо или скопипастить оттуда два слова — долго и неудобно.

Пользуюсь я почтовиком Claws Mail. К нему прилагается скриптик textviewer.pl, готовый работать универсальным просмотрщиком (точнее вызывать подходящий конвертер что-нибудь—в—просто-текст и показывать содержимое файла в стандартный вывод). Так, файлы Word он обрабатывает antiword-ом, файлы RTF — unrtf-ом, файлы PowerPoint — ppthtml (не всегда удачно), PDF — pdftotext, OpenOffice — ooo2txt (а вот этого у меня нет). Получается быстро и удобно.

Соответственно в настройках Claws Mail в качестве универсального просмотрщика нужно указать textviewer.pl -v '%s'.

Однако я думаю, такой скриптик может быть полезен и пользователям других почтовых клиентов. В Debian его можно найти внутри пакета claws-mail-tools или взять прямо из CVS репозитория. Сами конвертеры «хитрый формат в plain text» в Debian находятся в пакетах antiword, unrtf, ppthtml, xpdf-utils.

Дополнение: Вначале обрадовался. Узнал, что в Debian просматривать файлы OpenOffice.org без установки можно с помощью o3read (o3read, o3totxt). Потом огорчился. Ни один из моих файлов *.odt прочитать с помощью o3read не вышло.