A extração e limpeza de dados são a primeira e mais importante tarefa de qualquer projeto de análise de dados. Em meus cinco anos de experiência, recebi dados que pareciam lixo, mas usando as funções RIGHT e LEFT do excel, fui capaz de transformá-los em relatórios significativos.
A limpeza de dados no Excel é fácil. Aqui vou explicar como você pode extrair texto específico no Excel 2016 de uma célula e deixar para trás dados inúteis.
Na imagem acima, os dados são fornecidos em Excel. Tem Nome, Era, e se a pessoa tem algum seguro ou não (S / N). Para usar esses dados, preciso extrair dados em colunas diferentes. Cada coluna deve conter apenas um tipo de valor. Uma vez feito isso, podemos fazer relatórios dinâmicos no Excel que nos informarão melhor sobre os dados. Então vamos começar.
Função RIGHT do Excel para extrair dados à direita do texto
Vamos começar com o mais fácil. Neste exemplo, temos “Tem seguro?” dados no final da string. E esse é apenas um caractere (Y ou N). Para extrair esses dados, usaremos a Fórmula CERTA que o Excel fornece. A função RIGHT está disponível no Excel 2016, Excel 2013, Excel 2010 e versões anteriores do Excel.
A função RIGHT no Excel leva apenas dois argumentos. Primeiro o TEXTO, e depois o NÚMERO DE PERSONAGENS que você deseja extrair da direita no Excel.
Fórmula Genérica:
= DIREITO (texto, número_de_Caracteres)
Aqui, nós temos nosso texto na cela B3 e o número de caracteres que queremos extrair é 1. Basta escrever esta fórmula no excel no celular D3 ou onde você quiser ter esses dados.
= DIREITO (B3,1)
Você terá seu resultado na célula D3. apenas copie ou arraste para baixo esta fórmula nas células abaixo.
Função ESQUERDA do Excel para extrair dados da esquerda do texto
Agora vamos pegar nossa idade. Antes de explicar, deixe-me mostrar a fórmula. Copie esta fórmula nas células desejadas.
= ESQUERDA (DIREITA (B3,4), 2)
Na fórmula acima, combinamos as funções LEFT e RIGHT para obter nosso texto específico da string. Isto é o que parece.
Agora vamos entender essa fórmula insignificante.
Cada função funciona de dentro para fora. Então, vamos começar com:
DIREITO (B3,4): Ele simplesmente extrai 4 caracteres de um determinado texto. Isso nos dá 30_Y. Por que 4? Como sabemos que a idade é apenas um de dois caracteres, temos 1 “_” e 1 Y ou N.
ESQUERDA (DIREITA (B3,4), 2): Agora temos nosso texto que começa com a idade de 2 caracteres. Aí vem a função ESQUERDA em ação. Leva DIREITO (B3,4) como seu argumento de texto e extrai 2 caracteres disso. Isso nos dá 30 para a primeira célula. Copie a fórmula nas células abaixo e você obterá o restante dos dados conforme mostrado na imagem acima.
Fórmula genérica para ESQUERDA:
= ESQUERDA (texto, Numero_de caracteres)
Assim como a função RIGHT no excel, a função LEFT do Excel também leva os mesmos argumentos. Ele apenas extrai os dados à esquerda da string fornecida.
Função ESQUERDA e Direita do Excel para extrair comprimento desconhecido de texto de uma string
Basta colar esta fórmula nas células desejadas para extrair o nome do texto no excel.
= ESQUERDA (B3, LEN (B3) -5)
Nos exemplos acima, sabíamos o número exato de textos a extrair do texto fornecido. Mas agora, não sabemos a extensão de um nome. O que pode ser feito?
Sabemos que o nome é seguido por 5 caracteres exatos. 1 para espaço, 2 para idade, 1 para sublinhado “_” e um para Y.
Se pudermos obter todo o número de texto e depois subtrair 5 disso, teremos o número exato de texto para o nome.
Para encontrar o comprimento de um texto no Excel, podemos usar a função LEN. A função LEN do Excel retorna o número de caracteres envolvidos.
Sintaxe:
= LEN (texto)
Então LEN (B3) retorna 20.
LEN (B3) -5 retorna 15. E este é o comprimento do nome na célula B3
Afinal ESQUERDA (B3, LEN (B3) -5) nos dá Georgina Schalk como resultado. Ao copiar a fórmula nas células abaixo, você obtém todos os nomes.
Agora você pode preparar relatórios como este com base em dados extraídos usando tabelas dinâmicas. Isso nos diz que metade de nossos sujeitos tem seguro e a outra metade não.
A FUNÇÃO ESQUERDA e DIREITA do Excel é muito poderosa e útil para limpeza de dados. Quando combinadas com a função LEN, função FIND e função SUBSTITUTE do excel, elas podem extrair qualquer substring dentro de uma string no excel.
No futuro, veremos extrações de dados mais complexas no Excel. Por enquanto tchau. E sim, deixe sua opinião na seção de comentários abaixo. Terei todo o gosto em ajudá-lo.