Часто бывает так - есть файл Word с содержимым, которое нужно срочно-быстро-решительно выложить на сайт. Можно конечно верстать страничку руками, копируя из ворда только текст. Но это долго. Можно поступить как продвинутый подован и выбрать "Файл - Сохранить как... - html". Но это некрасиво и тяжело. Код получается черте какой.
В этом посте я расскажу о том, как лично я решил для себя эту задачу и заодно всякие подобные.
Раньше я делал так:
Я перепробовал всякие сервисы и программы конвертации и чистки html. Но никакая меня особо не устраивала до конца. Так что я решил написать свою.
Конечно это было веб-приложение. Я назвал его незамысловато: Чистильщик html. Конечно оно использовало регулярные выражения и написано было на Perl. Конечно оно развивалось по мере эксплуатации.
Как же этим пользоваться? Очень просто. Вы можете вставить имеющийся html-код в окно в режиме "Код" и нажать на кнопку "чистить".
Это простейший способ использования этого сервиса. В большинстве случаев, код получающийся на выходе устраивает лично меня. Не знаю как вас:)
В скором времени мне надоело сохранять документ Word или Excel как html и чистить уже его. Я знал что веб-редакторы умеют принимать код, скопированный прямо из Word. Но моя textarea так не умела. Я задался вопросом - как сделать возможным вставки в textarea не кода, не простого текста, а визуального представления документа?
Ответ оказался прост: нужно вставлять не в textarea а в iframe, который содержит документ, у которого <body> имеет атрибут contenteditable="true".
Дело в том, что если этот атрибут установлен у контейнерного тега, то для клиента становится возможным его редактировать прямо в браузере. Не во всех браузерах генерируемый код одинаков, но во всех он генерируется.
Если установить курсор в такой блок и нажать Ctrl+V, то есть, выполнить Paste, то содержимое буфера перенесется как сможет. А содержимое буфера помнит форматирование текста Word, которое мы переносим на сайт.
Таким же образом можно вставлять содержимое любых программ, где есть текст. Например, такая штука работает с Excel. Выделяем ячейки, вставляем в режиме html, получаем таблицу.
Код, который генерирует браузер, можно увидеть переключившись обратно во вкладку "Код". И наоборот, код, набранный в этой вкладке, можно посмотреть на вкладке "HTML".
Для работы чистильщика не обязательно переключаться в какой-то режим. Он умный и сам понимает откуда брать код для чистки.
Вот такой получился у меня инструмент. На мой скромный взгляд, это единственный в своем роде инструмент в рунете. Ссылка на похожий инструмент для буржуйнета приложена у меня на страничке чистильщика под знаком вопроса. Этот сайт не очень подходит для текстов на русском - он заменяет все наши буквы на коды, что делает текст нередактируемым при помощи простого редактора.
Если вам нравится этот инструмент - пользуйтесь. Если вы нашли баги или хотите новых возможностей - милости просим в комментарии или обратную связь. Кстати, я могу сделать какой-нибудь инструмент для вас.