Método de extração de hiperligações de páginas da web usando Python

Aqui está a maneira mais simples de implementar, primeiro capturar a página alvo, então usar o ajuste de expressão regular para obter o hiperlink no atributo href da tag a

O código a seguir é:

import urllib2
import re
url = 'http://www.sunbloger.com/'
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\./]+)\"', doc)
for a in links:
  print a

Resumo

Este é o conteúdo completo deste artigo, esperamos que o conteúdo deste artigo ajude vocês a aprenderem ou a trabalhar. Se tiverem alguma dúvida, podem deixar um comentário para trocar.

Tutorial Básico

Tutorial Básico HTML
HTML5Tutorial Básico
Manual de Referência HTML
Tutorial SVG
Tutorial CSS
Manual de Referência CSS
CSS3Tutorial
Bootstrap3 Tutorial
Bootstrap4 Tutorial
Ícones Font Awesome
Tutorial JavaScript
Manual de Referência JavaScript
Tutorial jQuery
Tutorial AJAX
Tutorial JSON
Tutorial AngularJS
Tutorial ReactJS
Tutorial NodeJS
Tutorial Python
C++ Tutorial
Tutorial Golang
Tutorial C
Tutorial PHP
Tutorial C#
Tutorial LINQ
Tutorial Lua
Tutorial Ruby
Tutorial Rust
Tutorial Linux
Tutorial R
Tutorial Docker
Tutorial do Scala
Tutorial do MatLab
Tutorial do Erlang
Tutorial do Pandas
Tutorial do Numpy
Tutorial do Matplotlib
Tutorial do Flask
Tutorial do Java
Tutorial do SpringBoot
Tutorial do JDBC
Tutorial do JSP
Tutorial do Servlet
Tutorial do Maven
Tutorial do Spring
Tutorial do Django
Tutorial do Swift
Tutorial do Kotlin
Tutorial do SQL
Tutorial do MongoDB
Tutorial do SQLite
Tutorial do PostgreSQL
Tutorial do MySql
Tutorial do Redis
Tutorial do Elasticsearch

Você pode gostar

Resumo das métodos comuns de formatação de strings no Python [porcentagem e método format]
Exemplo de código de menu de estrutura de árvore (ztree) no AngularJS
Implementação de cascata usando jQuery3Tipos de casos
Python3Resumo das funções comuns da urllib.parse (urlencode, quote, quote_plus, unquote, unquote_plus, etc.)
Método de percorrer os pais e antepassados dos elementos usando JQuery
Método de verificação da integridade da imagem usando pillow em Python
Detalhamento do evento de toque no dispositivo móvel
Resumo das diferenças entre $scope e $rootScope no AnjularJS
Detalhamento e código de exemplo da tecnologia de reconhecimento de voz no Android
Exemplo de uso da função de retorno de dados json no Django
ASP.NET MVC4 Efeito de paginação simples no template Razor
Método simples de percorrer os pais usando jQuery
Detalhamento e código de exemplo da versão Android do reconhecimento de voz do Baidu (Baidu Voice)
Detalhamento e código de exemplo de reconhecimento de voz fácil no Android
Exemplo de inicialização de lista em Python
Método de extração de hiperligações de páginas da web usando Python
Método de manipulação do banco de dados mysqli usando php
Dois métodos de citação de strings em php (obrigatório ler)
Os primeiros cinco buracos no desenvolvimento do WeChat Official Account usando php (parte 1)
Modifique o conjunto de caracteres padrão para utf no mysql através do my.cnf-8Métodos e Considerações
Método de obter o valor de índice de elemento usando jQuery
Breve discussão sobre referência e cópia em JavaScript (passagem por valor e por referência)
Desenvolvimento Android com OpenGL ES3D Detalhamento do Exemplo Gráfico
Método de resolver o problema de caracteres chineses confusos ao descomprimir zip no Fedora usando python
jQuery realiza o efeito de realçar ao passar o mouse, enquanto outros elementos de mesmo nível ficam escuros