WOT

Saturday, October 15, 2016

Como crear en 5 pasos un equipo de ciencia de datos

Nota: Este artículo es una traducción del original que aparece en el sitio de LinkedIn 


  • Publicado el 29 de junio de 2016
endadoNo recomendar5 steps to build a data science team




Innovador incesante tanto en la reflexión como en la acción | LION

La presentación de ANA en Nueva York fue el 9 de diciembre de 2015

Resumen ejecutivo
Para cualquier empresa que desee utilizar los datos con el objetivo de optimizar las estrategias de negocio y mantenerse al día en los cambios del mercado, es esencial disponer de un buen equipo de análisis. A continuación, en este artículo, expongo los cinco pasos a seguir para mejorar un programa de análisis ya operativo o para crear uno desde cero.

Ideas
Tener un equipo de análisis sólido es esencial para las empresas que deseen utilizar los datos para mejorar sus estrategias de marketing y lograr sus objetivos de negocio a largo plazo. Pero la tarea de crear un equipo puede ser todo un reto. ¿Cómo reunir un equipo que pueda comenzar a trabajar inmediatamente? ¿Qué herramientas se necesitan para extraer y medir los datos? ¿Cómo presentar los resultados para poder influir en la toma de decisiones? Hay cinco pasos que las empresas pueden llevar a cabo para crear un equilibrado equipo de analítica que tenga éxito desde el principio, o para mejorar uno ya existente.

Número 1: Elegir la estructura adecuada
Dependiendo de las necesidades de su empresa y cómo está estructurada, hay tres tipos de modelos operativos diferentes  que se pueden utilizar para estructurar un nuevo programa de análisis:
  • Un enfoque federal: Con este enfoquelos analistas de datos informan desde las diferentes áreas de la organización. La ventaja de esta estructura es que los analistas son expertos en estos conocimientos y están totalmente inmersos en las actividades del día a día en sus departamentos. Sin embargo, debido a que se encuentran dispersos por la empresa, a menudo hay muy poca comunicación entre ellos, y como resultado, hay en general una falta de coherencia (especialmente en lo que respecta a los métodos y definiciones).
  • El enfoque centralizado: En este procedimiento, hay un grupo de analistas que informan desde un único departamento. La ventaja de este modelo es que los analistas son capaces de aprovechar sus distintas experiencias, de realizar más de un trabajo específico, y utilizar los más altos niveles de coherencia en toda la organización. La desventaja es que este grupo está a menudo aislado de otros departamentos y no está involucrado en lo que sucede  en el día a día.
  • El enfoque centro - periferia: Este enfoque es esencialmente una fusión de los dos primeros en el que los analistas informan desde diferentes departamentos, pero también desde un grupo central. Esto puede ayudar a las organizaciones a analizar eficientemente los datos de una manera coherente y a romper la comunicación en silos.
Número 2: Crear el mejor equipo
Después de implementar una estructura en la que los analistas puedan trabajar, es importante identificar los papeles que se necesitan cubrir y formar un equipo con analistas que sean capaces de gestionar todas las áreas clave. Cuando llegue el momento de contratar a su equipo, necesitará encontrar gente para cubrir las siguientes funciones:
  • Liderazgo: Las responsabilidades del líder son supervisar el proceso, capacitar al personal, dar prioridad a los proyectos, y presentar los resultados a la alta dirección. Un nuevo equipo de analítica necesita de forma imperiosa un líder que posea una gran competencia en modelización matemática. La razón es sencilla: Las competencias en modelización matemática son difíciles de aprender y requieren años de experiencia trabajando bajo la supervisión de expertos. Aunque las competencias en minería de datos y en inteligencia empresarial son sin duda valiosas, en última instancia, éstas deberían considerarse en segundo lugar, ya que son competencias que se pueden aprender con facilidad. El hecho de que actuarios ocupen puestos de dirección puede ser beneficioso ya que estos profesionales están capacitados para analizar las consecuencias del riesgo y utilizan las matemáticas, la estadística y la teoría financiera para estudiar acontecimientos futuros inciertos y hacer pronósticos sobre el futuro.
  • Analista estadístico: Esta persona examina la importancia de los cambios en KPI, pone en marcha grupos objetivos de ensayo / control, y se encarga de todo lo relacionado con la modelización y la predicción. Un candidato cualificado debería tener hasta tres años de experiencia práctica, con un grado de maestría en estadística aplicada. Si una empresa quiere crear un programa desde cero, debería fomentar las relaciones con las universidades locales y contratar a candidatos con aptitudes directamente de los programas de posgrado.
  • Analista financiero: El trabajo más importante de esta persona consiste en incorporar al análisis toda la información relevante del negocio (como la rentabilidad y la teoría sobre las tasas de interés). Idealmente, los candidatos deberían tener como mínimo de tres a cinco años de experiencia, con muchas horas dedicadas a trabajos relacionados con la materia en sus currícula.
  • Analista de datos: Esta persona se dedica a extraer y a depurar los datos que utilizarán el resto del equipo. Es importante contar en su equipo con una persona dedicada exclusivamente a esta tarea, ya que los analistas en general pueden pasar hasta 90 por ciento de su tiempo depurando y validando datos, en lugar de dedicarse a hacer un análisis adecuado de los mismos.
Número 3: Medir para triunfar
No se pueden analizar los datos sin medir algo. Pero el modo en el que sus equipos de análisis recién formados empiecen a medir los datos depende en gran medida de la forma en que éstos están organizados en su empresa. Muy probablemente, el departamento de Sistemas de Información de su empresa ya lo está rastreando todo, y almacenando los datos en tablas en un servidor SQL con el departamento de TI. Al conjunto de estas tablas se le llama almacén de datos.
El almacén de datos, sin embargo, suele ser de difícil acceso, estar mal etiquetado, y no está estructurado, por lo que es esencial crear un diccionario de datos. Un diccionario de datos etiqueta los datos almacenados en el almacén de una manera efectiva e identifica las relaciones entre los datos. Cuando por primera vez consigue despegar, su equipo de análisis puede empezar a definir los datos y sus asociaciones por partes, ya sea con tablas de Excel o Word, y perfeccionar el enfoque basado en las necesidades de la empresa.
Sólo con un diccionario de datos claramente definido pueden sus equipos de TI o de SI elaborar los data marts. Los data marts son versiones más pequeñas del almacén de datos con datos y relaciones claramente etiquetados. Sin un data mart, su equipo de análisis no será capaz de utilizar herramientas de inteligencia de negocio (como Tableau) para recuperar, analizar, transformar y presentar datos. (En lugar de ello, tendrían que aprender SQL para acceder a los datos.)

Número 4: Convertir la información en acciones
Una vez que el equipo de análisis ha identificado la información después de analizar los datos, ¿cuáles son los siguientes pasos a seguir? En primer lugar, el equipo tendrá que hacer un análisis de pre-lanzamiento para asegurar que la información es causal y que se volverá a repetir. La forma más fácil de comprobar esto es mediante el muestreo y la retención. Esencialmente, esto significa que los analistas podrían retener una parte de los datos en el proceso de modelado y construir un modelo sin tener en cuenta ese conjunto parcial de datos. Una vez que se disponga del modelo final, utilizarían los datos retenidos para realizar la última prueba.
Después de que el equipo ha modelado la información, puede avanzar a la fase de prueba y aprendizaje, que consta de tres partes diferenciadas:
1.    La prueba disruptiva: El equipo comenzaría seleccionando un grupo de localidades o regiones y probaría los cambios. Trabajaría con los equipos implicados para aprender cómo esta información funciona y haría los ajustes necesarios.
2.    La prueba piloto: A continuación, el equipo extendería la campaña adaptada a un grupo de muestra importante desde el punto de vista estadístico. (Asegúrese de antemano de establecer unos objetivos KPI definidos, y que el analista estadístico encuentre grupos de control y de prueba objetivos). Una vez finalizada la prueba, hay que analizar los resultados experimentales para segmentar los ganadores de los perdedores.
3.    Despliegue inteligente: Utilizando la información de la prueba piloto, se extiende la nueva campaña al segmento ganador (si es posible). Hay que asegurarse de establecer las medidas en relación con la información sobre las labores de seguimiento antes del despliegue.

Para un equipo con apenas tiene experiencia, algunos de los primeros análisis y pruebas deben centrarse en la segmentación y la estacionalidad. La segmentación es exclusiva en cada industria, y el equipo de análisis puede utilizar el valor del tiempo de vida del cliente para examinar el comportamiento de los consumidores en diferentes segmentos e idear estrategias a partir de los resultados de los datos. En función de la estacionalidad, las estrategias de promoción pueden ayudar a la comprensión de cómo se comportan los diferentes segmentos de consumidores con el tiempo. Por ejemplo, algunos clientes se dan de alta de forma más destacada en diferentes momentos, sabiendo que de antemano puede ayudar al plan de la compañía sobre la forma de asignar los recursos.

Número 5: Aprovechar el éxito
Con cualquier nueva empresa, es a menudo un desafío  ganar credibilidad de forma inmediata. Las empresas tienen que tomar medidas para crear una cultura en su organización que se tome en serio el análisis:
  • Gobernanza: Si es posible, que sea el director financiero el encargado de informar en lugar del director de marketing, con el fin de tener mayor oportunidad de que se le tome en serio y una mayor influencia en las decisiones a nivel ejecutivo.
  • La consistencia y la capacidad de repetición: Asegúrese de que cada departamento (así como cualquier vendedor o agencia) define constantemente la métrica de la misma manera.
  • Compartir información: Comience con victorias fáciles encontrando datos que respalden una idea que la dirección ya ha asumido. Ser capaz de ratificar lo que ya ha asumido el equipo de gestión y proporcionarle información útil para tomar decisiones es una de las maneras más fáciles de empezar a construir la credibilidad de su equipo.
Preguntas y respuestas
1.    ¿Por qué sugiere que informe el director financiero en lugar del director de marketing?Aunque el departamento de marketing es nuestro primer cliente, prefiero mantenerlo alejado. En el departamento de marketing todo se tiene que hacer de forma muy rápida, por lo que mantener una cierta distancia entre ellos y el equipo de análisis permite a los analistas gestionar un flujo de trabajo más eficiente.
2.    ¿Puede hablar un poco más sobre quién comparte los resultados de su departamento de análisis en la organización y cómo lo hace?       En este momento, yo me encargo de presentar todos los resultados. Para una gran mayoría de científicos de datos, es algo que sin duda se necesita aprender, y siempre implica una transición. Se trata de familiarizarse con la audiencia y encontrar la forma de comunicar los detalles más relevantes de la manera más sencilla posible. Y usted puede entrenar a su equipo de análisis para adquirir esas habilidades, y es algo cuyo entrenamiento es mucho más fácil que el de las habilidades cuantitativas. Al principio, siempre se puede tener a alguien que no es del departamento de análisis para presentar los resultados, pero algunos de los detalles se pueden perder en la interpretación.
3.    ¿Cuál es su opinión sobre el modelado externo frente al interno?  El problema de usar modeladores externos es que ellos no tienen una comprensión a fondo o los detalles sobre los clientes que sus equipos internos pueden tener. La modelización interna le proporciona un acceso mucho más amplio a una base de conocimientos más rica con la que trabajar.
4.    ¿Cómo realiza la investigación de antecedentes?                                El departamento de marketing se centra en las pruebas, de las que nuestro equipo extrae los resultados. Todo el modelado que hace nuestro equipo utiliza  datos internos. Empleamos proveedores de datos externos para recopilar datos cuando estudian a clientes potenciales.
5.    ¿Qué opina de las herramientas de inteligencia de negocio?          Algunos encuentran muy valiosas las herramientas de inteligencia de negocio, ya que no tienen la formación para crear algo a partir de cero. A mí personalmente no me gustan y prefiero crear mis propias herramientas de informes internos. Sin embargo, no hay una respuesta totalmente correcta. Todo depende de la estructura y las necesidades de la organización.
CompartirCompartir 5 steps to build a data science team


2 comments:

  1. Thank you Francisco for translating my article. Now more people will be able to build an effective data science team. Awesome job!

    ReplyDelete
  2. Thank you very much Chrstopher for allowing me to translate the article. It is a very interesting job. Congratulations!!!

    ReplyDelete