Ответ сложный. Если вы допетрили до него самостоятельно, вы поняли регулярные выражения.
s/(\d)(?=((\d{3})+)(\D|$))/$1_/g
На php решение выглядит так:
$var = preg_replace('/(\d)(?=((\d{3})+)(\D|$))/', '$1 ', $var);
Я уже писал о том, как правильно грабить сайты. В качестве примера информации, которую нужно грабить с других сайтов, я приводил погоду. Вот, решил написать статью, где расскажу как можно получить погоду с сайта gismeteo.ru.
Я буду грабить RSS с этого сайта. Это просто и быстро.
Сегодня займемся парсингом html-страниц. Я хочу показать, как при помощи Perl можно легко и быстро разобрать страницу, найти на ней частовстречающиеся слова (посчитав их количество) и получить интересную статистику о любой странице в интернете. Кроме того, предлагаю уделить внимание словам, находящимся в тексте заголовков.
В этой статье расскажу о моем методе решения этой задачи и продемонстрирую готовый рабочий код, который разбирает страничку и выводит частовстречающиеся слова, отсортированными по количеству вхождений в текст.
В BB-code есть несколько тегов, которые очень капризны, потому что могут быть написаны по-разному. Один из них - тег [url]ссылка[/url]. Попробуем разобраться с ним двумя способами и, конечно, проверим, какой быстрее.
Займемся парсингом bb-code вплотную.
В процессе программирования, перед программистом встают задачи, которые можно решать разными методами. Регулярные выражения - это миниязык, предназначенный для решения части этих задач. Причем, часть эта довольна увесистая. Недаром язык регулярных выражений в том виде, в котором он распространен больше всего, вышел из Perl и был настолько тесно с ним интегрирован, что некоторые считают его полноценной частью.
Однако, язык регулярных выражений настолько необычен, насколько полезен. Его изучение дается нелегко, но усилия оправдываются. Эта статья посвящена регулярным выражениям. В ней нет ни самоучителя, ни перечисления бестий регулярных выражений, лишь некоторые рассуждения и бонус - несколько RegExp-ов, выполняющих частовстречающиеся задачи.