Todos os anos, o Data Every Minute (DOMO) cria um infográfico onde apresenta o quanto de dados são gerados a cada minuto do dia pelas pessoas na internet. Em 2018, a internet recebeu 3.138.420 GB de tráfego a cada minuto (DOMO, 2018). No entanto, “90% desses dados são definidos como dados não estruturados” (Marr, 2019). A expectativa é que o volume de dados não estruturados aumente entre 55% e 65% a cada ano (Marr, 2019) e “em 2020, haverá 40x mais bytes de dados do que estrelas no universo observável” (Marr, 2019).

A maioria dos dados não estruturados são comunicações de mídia social, fotos digitais, serviços e Internet das Coisas (IoT), (Marr, 2019). Além disso, segundo o DOMO, em apenas um minuto de 2018 foram enviados 12.986.111 textos, 159.362.760 e-mails e 176.220 ligações via Skype – mais sobre os números em torno do DOMO podem ser consultados na imagem abaixo. Todos esses dados brutos podem conter informações valiosas para as empresas quando transformados em dados estruturados.

Uma das aplicações de dados não estruturados está na área de análise de clientes. Transcrições de call center, avaliações on-line de produtos, conversas de chatbot e mídias sociais podem ser extraídas e analisadas usando inteligência artificial para detectar padrões nas informações dessas fontes. Com os dados estruturados, as empresas têm informações disponíveis para tomar decisões de forma mais rápida e que podem melhorar o relacionamento com os clientes (Marr, 2019).

DOMO

Figura  1  :  Dados Nunca Dorme 7.0, DOMO

A importância de analisar dados não estruturados brutos é de conhecimento comum, mas continua sendo um grande problema hoje para empresas em todo o mundo. A Revista Wired listou quatro barreiras que impedem as empresas de gerenciar com sucesso dados não estruturados:

  1. A falta de ferramentas que gerenciem facilmente dados não estruturados. As ferramentas precisam fornecer análises e análises eficientes de texto, taxonomia e metadados.
  2. Dificuldade em integrar dados não estruturados com sistemas de informação existentes. Ambos  são frequentemente vistos como maçãs e laranjas quando se trata de análise e tomada de decisão.
  3. Escassez de habilidades em tratar dados não estruturados na equipe existente.
  4. Falta de senso de urgência para gerenciar dados não estruturados (Taylor, 2018).

Por outro lado, para extrair informações úteis de dados não estruturados, as empresas devem aprimorar suas abordagens estruturadas de gerenciamento de dados existentes para acomodar análises semânticas de texto e fluxo de conteúdo (Loshin, 2013). Para resolver o problema da análise desses dados, empresas utilizam ferramentas como Hadoop para processar, minerar, integrar, armazenar, rastrear, indexar e relatar insights de negócios a partir de dados não estruturados brutos. Sem ferramentas como essa, seria impossível para os Cientistas de Dados gerenciar eficientemente dados não estruturados (Marr, 2019).

O que pode ser observado até agora é que o crescimento do volume de dados não estruturados aumentará a cada ano. O número de pessoas com acesso à Internet aumenta ano a ano. Desde janeiro de 2019, a internet atingiu 56% da população mundial, representando um crescimento de 9% em relação ao ano passado. Quanto mais pessoas na internet, mais informações serão compartilhadas. A análise de dados não estruturada – hoje – é um desafio difícil para o negócio, mas será fundamental no curto prazo.

Escrito por Ligia Galvão

Referências

Loshin, D. (2013). Big Data Analytics: From Strategic Planning to Enterprise Integration with Tools, Techniques, NoSQL, and Graph. Waltham, MA: Elsevier.

Marr, B (2019). How Much Data Do We Create Every Day? The Mind-Blowing Stats Everyone Should Read. Forbes. Retrieved on February 11, 2020. Retrieved from https://www.forbes.com/sites/bernardmarr/2018/05/21/how-much-data-do-we-create-every-day-the-mind-blowing-stats-everyone-should-read/#5b4c512260ba

Marr, B (2019). What is Unstructured Data and Why is it so Important to Businesses an Easy Explanation for Anyone. Forbes. Retrieved on February 11, 2020. Retrieved from https://www.forbes.com/sites/bernardmarr/2019/10/16/what-is-unstructured-data-and-why-is-it-so-important-to-businesses-an-easy-explanation-for-anyone/#66a3d71615f6

Taylor, C (2018). What’s the Big Deal With Unstructured Data? Wired. Retrieved on February 11, 2020. Retrieved from https://www.wired.com/insights/2013/09/whats-the-big-deal-with-unstructured-data/

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s