Detecção simples de tipo de texto em Python2Métodos [Baseado no cabeçalho do arquivo e na biblioteca cchardet]

Este exemplo mostra como detectar o tipo de texto simples do Python. Compartilho com todos para referência, conforme abaixo:

1、com base no cabeçalho do arquivo.

#É UTF com cabeçalho BOM?8arquivo
def IsUtf8
  if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)):
    return True
  return False

2、usando a biblioteca cchardet.

>>> import cchardet
>>> cchardet.detect(open(pathfile, 'rb').read())
{'encoding': 'UTF-8', 'confiança': 0.9900000095367432}

Leitores interessados em mais conteúdo sobre Python podem consultar as seções especiais do site: 'Coletânea de dicas de operação de arquivos e diretórios do Python', 'Coletânea de dicas de operação de arquivos de texto do Python', 'Resumo de dicas de operação de URL do Python', 'Resumo de dicas de operação de imagens do Python', 'Tutorial de estruturas de dados e algoritmos do Python', 'Resumo de dicas de programação de Socket do Python', 'Resumo de dicas de uso de funções do Python', 'Coletânea de dicas de operação de strings do Python' e 'Tutorial clássico de entrada e avançamento do Python'.

Espero que o conteúdo deste artigo ajude a todos a programar em Python.

Declaração: O conteúdo deste artigo é extraído da internet, pertence ao respectivo proprietário, foi carregado voluntariamente pelos usuários da internet e o site não possui direitos autorais, não foi editado manualmente e não assume responsabilidade por eventuais responsabilidades legais. Se você encontrar conteúdo suspeito de violação de direitos autorais, por favor, envie e-mail para: notice#oldtoolbag.com (ao enviar e-mail, substitua # por @ para denunciar e forneça provas relevantes. Caso seja confirmado, o site deletará imediatamente o conteúdo suspeito de violação de direitos autorais.)

Tutorial básico