Задачи для решения

Часть 1

Дана страница: перейдите по ссылке.

С помощью file_get_contents получите HTML код страницы по ссылке выше и для этой страницы с помощью регулярных выражений решите следующие задачи:

Получите содержимое head, title и body.

Получите массив href всех ссылок.

Получите массив текстов всех ссылок.

Часть 2

Дана страница: перейдите по ссылке.

С помощью file_get_contents получите HTML код страницы по ссылке выше и для этой страницы с помощью регулярных выражений решите следующие задачи:

Получите содержимое body.

Получите кодировку документа (нового и старого типа).

Получите содержимое #content.

Получите все ссылки из #content.

Получите содержимое всех абзацев.

Получите содержимое всех абзацев из #content.

Получите все абзацы с классом www.

Получите все ссылки с классом www (их href и анкоры).

Получите все ссылки с классом www из #content.

Получите все ссылки из пагинации .pag.

Получите активную ссылку из пагинации .pag.

Получите содержимое абзаца с классом .eee из #footer.

Часть 3

Дана страница: перейдите по ссылке.

С помощью file_get_contents получите HTML код страницы по ссылке выше и для этой страницы с помощью регулярных выражений решите следующие задачи:

Получите массив ссылок из меню.

Получите массив всех картинок.

Получите содержимое контента.

Получите картинки контента.

Удалите скрипты из полученного контента.

Удалите картинки из полученного контента.

Удалите абзацы с классом "more" из полученного контента.

Теги h2 из контента сделайте просто текстом, а не ссылками.

Удалите все атрибуты абзацев из полученного контента.

Удалите все теги span из полученного контента.