Ошибки при установке http расширения для php
2012-10-04 16:27:52
Прогаю парсер, для этого использую классное расширение http для php, там много полезных функции, ...
+ развернуть текст сохранённая копия
Прогаю парсер, для этого использую классное расширение http для php, там много полезных функции, типа http_parse_headers http_parse_params Чтобы установить без проблем под debian, нужно: apt-get install php5-curl php5-dev libcurl3 libcurl4-gnutls-dev … Читать дальше →
Тэги:
curl,
debian,
php,
парсинг,
рубрика
Вывести структуру элементов в DOM-модели
2012-08-10 01:13:29
Писал тут на php один парсер, получал html-код, а его парсил через domdocument. Чтобы не запутаться, ...
+ развернуть текст сохранённая копия
Писал тут на php один парсер, получал html-код, а его парсил через domdocument. Чтобы не запутаться, и всё было наглядно, написал себе функцию, которая выводит структуру в удобном виде. Функция сырая, но работает как надо. Передаём ей один аргумент – $element типа DOMNode, чью структуру мы хотим получить. Возвращается html-код (просто текст с для следующей [...]
Тэги:
dom,
domdocument,
domnode,
php,
парсинг,
структура
Веб-разработка / [Из песочницы] Использование vkontakte js api для полуавтоматической публикации сообщений из rss лент
2012-01-31 12:57:23
Введение
Данный пост я решил написать после прочтения Автоматическое оповещение ...
+ развернуть текст сохранённая копия
Введение
Данный пост я решил написать после прочтения Автоматическое оповещение читателей о новостях с помощью ВКонтакте. Часть 4, и решить в нем проблему с «access token», путем использования iframe приложений и js api.
После прочтения данной статьи, любой желающий сможет
ходить по воде, ловить пули зубами создать iframe приложение, которое умеет публиковать записи на стене группы или пользователя из rss ленты.
Код и буквы
Тэги:
api,
javascript,
rss,
vkontakte,
парсинг
curl в php практическое применение
2011-12-21 18:53:48
Я уже публиковал несколько статей про работу c curl в php. Сегодня я продолжаю эту тему и покажу на ...
+ развернуть текст сохранённая копия
Я уже публиковал несколько статей про работу c curl в php. Сегодня я продолжаю эту тему и покажу на примере одного из сайтов как можно практически применять это инструмент.
Вымышленной задачей на сегодня я будет получения погоды для г. Евпатории, с этим городом у меня много воспоминаний, поэтому выбрал именно его. «Донором» будет сайт METEOPROG.UA:Погода в [...]
Тэги:
curl,
php,
инструкция,
парсинг,
программирование
Веб-разработка / [Из песочницы] LXML — проблемы с кодировкой при парсинге HTML
2011-09-14 11:03:01
Данный пост посвящен извечной проблеме всех питонистов — кодировкам. Недавно я получил письмо, в ...
+ развернуть текст сохранённая копия
Данный пост посвящен извечной проблеме всех питонистов — кодировкам. Недавно я получил письмо, в котором мой знакомый жаловался на то, что у него в программе получаются строчки вида::
u'\xd0\x9a\xd1\x83\xd1\x80\xd1\x83\xd0\xbc\xd0\xbe\xd1\x87'
Вы заметили что что-то не так? И я вот. Строчки как бы уникодные, но внутри них закодированные utf-8 байты. Что-то здесь не так. Разбираясь дальше и потребовав скрипт, которые такое генерирует, становится понятно, что данные берутся из веба. Вполне обычным способом через
urllib
и потом скармливаются в
lxml.html
для разбора. Поскольку
urllib
оперирует только байтовыми строками, то он не мог их так превратить в уникод, а значит во всем виноват
lxml
.
Читать дальше →
Тэги:
html,
lxml,
кодировка,
парсинг