Ler todo conteúdo definindo charset

Consome um arquivo previamente aberto para leitura a fim de ler todo seu conteúdo definido com uma determinada codificação de caracteres.

Parâmetros

NomeTipoDoc
Parâmetro 1ObjetoObjeto que faz referência a um arquivo aberto para leitura
Parâmetro 2StringTipo de codificação

O tipo de objeto esperado é o mesmo retornado pela função "Abrir arquivo para leitura"

Retorno

Retorna o conteúdo do arquivo no formato string.

Compatibilidade

 Servidor

Exemplo 1

A função abaixo em destaque lê todo o conteúdo do arquivo definido com uma codificação de caracteres específica.

Sobre charset

Charset significa “conjunto de caracteres” (character set). Os charsets foram feitos como uma biblioteca de caratecteres que podem ser utilizados com propósitos gerais em computadores, softwares, browsers etc. Os charsets mais conhecidos são os da série ISO-8859 (ISO-8859-1, …, ISO-8859-10) e os da família Unicode (UTF-8, UTF-16). O charset indica o formato de codificação de caracteres utilizado em um documento.

Charset

 

Sobre o bloco

A função utilizada para ler todo o arquivo contém cinco opções de codificação de caracteres:

UTF-8: (8-bit Unicode Transformation Format) é um tipo de codificação binária pertencente a familia Unicode com comprimento variável. Pode representar qualquer caracter universal padrão do Unicode, sendo também compatível com o ASCII;

UTF-16: Semelhante ao UTF-8 com a diferença de que, enquanto este pode codificar caracteres de forma minima utilizando 1 byte (8bits) o UTF-16 utiliza o dobro 2 bytes (16bits);

US-ASCII: ASCII ("Código Padrão Americano para o Intercâmbio de Informação") é um código binário (cadeias de bits: 0s e 1s) que codifica um conjunto de 128 sinais: 95 sinais gráficos (letras do alfabeto latino, sinais de pontuação e sinais matemáticos) e 33 sinais de controle, utilizando portanto apenas 7 bits para representar todos os seus símbolos;

ISO-8859-1: É uma família de esquemas de codificação de um único byte usados para representar, nesse caso, o alfabeto latino n. ° 1 que faz parte da série ISO / IEC 8859 de codificações padrão de caracteres ASCII. O ISO 8859-1 codifica o que se refere como "alfabeto latino n. ° 1", consistindo de 191 caracteres.

ISO-8859-2: Faz parte da mesma família de esquemas de codificação da ISO-8859-1, servindo basicamente para a maiora das línguas eslavas e centro-européias de escrita latina, tais como: croata, tcheco, alemão, húngaro, polonês, romeno, eslovaco e esloveno.