Решил накидать своих собственных примеров регулярок.
Ссылки на изображения
Выбирает все пути к картинкам с неограниченной вложенностью директорий, будут выбраны все пути, подобные указанным ниже.
http://img04.taobaocdn.com/m_pic.jpg
//img04.taobaocdn.com/m_pic.jpg
/img04.taobaocdn.com/m_pic.jpg
img04.taobaocdn.com/m_pic.jpg
/img01.taobaocdn.com/bao/u/p/l/o/a/d/e/d/Tc.jpg
img01.taobaocdn.com/bao/u/p/l/o/a/d/e/d/Tc.jpg
Без http в начале строки.
С http в начале строки.
Можно немного модифицировать и извлекать все, что имеет ссылку: изображения, файлы, скрипты и прочее.
Домен
Извлекает доменные имена из текста.
Таблица
Извлекает таблицу из html кода
Скрипты
Извлекает скрипты между тегов <script></script>
Если модифицировать, то можно извлекать например стили <style></style>
Статья будет дополняться.