Análise e probas

Tortura de auga: unha analoxía analítica vai demasiado lonxe

Os datos, como a auga, teñen moitas formas. A mente humana evolucionou para filtrar a maioría dos datos que nos chegan porque hai moito.

Cando abres os ollos e os oídos, os datos están en todas partes. A cor da parede, o son do aire acondicionado e o cheiro do café do teu veciño trátanse como humidade. A auga está no aire todo o tempo pero non é útil prestarlle moita atención.

Cando a auga se condensa en néboa, obrígache a vela e dificulta a comprensión do mundo que te rodea. Os conxuntos de datos incompletos, os datos corrompidos, a mala ciencia, as conclusións falsas e o sesgo cognitivo fan que perdas o camiño entre a néboa.

Os datos caen como a choiva. Cando só hai un pouco, é moi insatisfactorio, o suficiente para ensuciar o coche e confundir a conversa. Atópase limpando a mancha das lentes mentres alguén saca algún dato aleatorio, obtido dunha fonte escura.

  • Auga rancia nun estanque pouco profundo é perigoso. Os datos, recollidos dun abastecemento pouco fiable, nin limpos nin normalizados e deixados para crecer, poden levar facilmente a conclusións erróneas.
  • A goteo constante de auga pode ser o suficiente para encher unha cantina ou manter un ecosistema forestal. Só tres puntos de datos (o número de correos electrónicos enviados, fronte a abertos, fronte aos clics) poden sustentar un programa de mercadotecnia.
  • A fluxo máis saudable de datos en forma de pequeno regato pódese utilizar para o baño. Un fluxo de datos continuo permite o benchmarking e a comparación histórica. A optimización da páxina de destino pódese conseguir con datos de conversión constantes.
    A río modesto pode alimentar un muíño para serrar madeira ou moer trigo. Un motor de recomendación só precisa da contribución fiable dun puñado de afluentes para aumentar o valor dos carros da compra.
  • A fervenza de pode impulsar unha enorme noria e unha afluencia suficiente de información pode impulsar un sistema de contido dinámico e en tempo real.
  • A río que é o suficientemente ancho e profundo pode soportar toda unha industria do transporte. Os datos suficientes poden flotar en barcazas e buques de carga en forma de colección de cookies de redes de publicidade, agregadores de datos de programas de tarxetas de fidelidade e intermediarios de datos.

Cando os datos chegan en cantidades esperadas en momentos previstos, pódense capturar, canalizar e poñer en uso. Os sistemas de rega, presas e encoros proporcionan unha sensación de control e permiten a construción dunha infraestrutura cada vez máis amplia con canles, esclusas e presas. Os almacéns de datos creáronse con fluxos menos fiables.

A limpeza está ao lado da divindade

A auga limpa é vital para o éxito da vida, o rego, o funcionamento das centrais eléctricas, etc. A definición de "limpa" pode cambiar para o propósito; Está ben se hai algas na auga que arrefrían unha central eléctrica e non é aceptable se hai máis de 10 partes por mil millóns de arsénico na auga potable.

Os datos son os mesmos. Nunha solicitude de correo directo, se ten o título dunha persoa (Sr., Sra., Sra.) é intrascendente... a menos que estea enviando un correo aos médicos. Pero os datos sucios farán caerche cada vez.

Como científico de datos xefe dos Estados Unidos, DJ Patil, expúxoo nun Cumio CTO da Primeira Rolda: "Se non estás a pensar en como manter limpos os teus datos desde o principio, estás f^¢&ed. Garántoo. Intentar limpalo despois do feito levará polo menos meses".

Se quentas auga ata o punto de ebulición, pode impulsar toda unha Revolución Industrial. Os datos parecen facer o mesmo. Desde o momento en que os ordenadores puideron almacenar e calcular, os datos recolléronse tan rápido como se puido crear o equipo de almacenamento para facelo.

O lago de datos

Mentres os datos destes afluentes escorren polos motores dos muíños, todo acaba no lago, detrás do encoro. Como os datos son liberados de forma controlada, alimentan as turbinas da industria de datos; eses motores xigantes de procesamento de datos con nomes como Google e Facebook. Aquí non haberá seca.

E, finalmente, hai unha piscina profunda de auga, á espera de que o analista se mergulle. Equipo de mergullo e arma de lanza na man, o analista investiga as profundidades, mapea novos terreos e descobre novas especies. É un momento moi emocionante para ser un explorador de datos.

É por iso que tantos deles estiveron presentando ao Cumio eMetrics desde 2002. A próxima oportunidade é en Boston, do 27 de setembro ao 1 de outubro de 2015.

Rexistro eMetrics Summit

Unha Ponte Lonxe De máis

E que dicir do poder dos datos para esculpir o próximo Gran Canón? Que pasa coa fusión glacial dos datos estruturados? Como tratamos as augas residuais nun mundo cada vez máis consciente da privacidade?

Esas son preguntas para outro tempo e auga debaixo da ponte.

Jim Sterne

Jim Sterne é un consultor internacional que se centra en medir o valor creando e fortalecendo as relacións cos clientes. Sterne escribiu oito libros sobre mercadotecnia interactiva, é o presidente fundador e actual presidente da Asociación de Analítica Dixital e produce o Cumio eMetrics eo Cumio Media Analytics.

artigos relacionados

Botón de volta ao principio
preto

Adblock detectado

Martech Zone pode fornecerche este contido sen ningún custo porque monetizamos o noso sitio mediante ingresos publicitarios, ligazóns de afiliados e patrocinios. Agradeceríamos que elimines o teu bloqueador de anuncios mentres visitas o noso sitio.