12 consejos clave para aprender ciencia de datos

Autor: Laura McKinney
Fecha De Creación: 3 Abril 2021
Fecha De Actualización: 1 Mes De Julio 2024
Anonim
La ruta para aprender CIENCIA DE DATOS profesional
Video: La ruta para aprender CIENCIA DE DATOS profesional

Contenido


Fuente: Artinspiring / Dreamstime.com

Para llevar:

Los científicos de datos obviamente necesitan fuertes habilidades de matemática y codificación, pero la comunicación y otras habilidades blandas también son esenciales para el éxito.

El científico de datos se clasifica como el mejor trabajo para 2019 en Estados Unidos en Glassdoor. Con un salario base promedio de $ 108,000 y un rango de satisfacción laboral de 4.3 de 5, más un buen número de vacantes previstas, eso no es sorprendente. La pregunta es: ¿Qué tiene que hacer uno para encaminarse para calificar para este trabajo?

Para averiguarlo, buscamos los consejos que se brindan a quienes buscan ingresar a esta carrera. Mucho se reduce a las habilidades difíciles en codificación y matemáticas. Pero ese cálculo fuerte por sí solo no lo corta. Los científicos de datos exitosos también deben poder hablar con la gente de negocios en sus propios términos, lo que exige las capacidades asociadas con las habilidades blandas y el liderazgo. (Para obtener más información sobre los deberes de un científico de datos, consulte Job Role: Data Scientist).


Construyendo la base educativa: tres consejos principales

Drace Zhan, científico de datos de la Academia de Ciencias de Datos de Nueva York, enfatiza la necesidad de una base educativa que incluya lo esencial de la codificación y la habilidad matemática:

  1. R / Python + SQL. Si no tiene las habilidades de codificación, necesita mucha potencia de redes y otras áreas para reforzar este déficit. He visto científicos de datos con matemática débil y poca experiencia en el dominio, pero siempre han sido llevados por una gran capacidad de codificación. Python es ideal, pero R es una gran herramienta alternativa. Es mejor tener ambos en tu arsenal. SQL también es extremadamente importante para un analista de datos.

  2. Fuertes habilidades matemáticas. Tener una buena comprensión de algunos de los métodos comúnmente utilizados: modelos lineales generalizados, árbol de decisión, medias K y pruebas estadísticas es mejor que tener una imagen amplia de varios modelos o especializaciones como RNN.

Esas son habilidades centrales para desarrollar, aunque algunos expertos las agregan. Por ejemplo, una lista de KDnuggets incluye los componentes de codificación que Zhan mencionó y agrega algunas otras cosas útiles para saber en el aspecto técnico, incluida la plataforma Hadoop Apache Spark, visualización de datos, datos no estructurados, aprendizaje automático e inteligencia artificial.


Pero si tomamos nuestras pistas de una encuesta sobre las herramientas más utilizadas identificadas para su uso en la vida real por una encuesta de Kaggle, obtenemos resultados algo diferentes. Como puede ver en el gráfico de las 15 opciones principales a continuación, Python, R y SQL se ubican fácilmente entre las tres primeras, pero la cuarta son las computadoras portátiles Jupyter, seguidas de TensorFlow, Amazon Web Services, Unix shell, Tableau, C / C ++, NoSQL , MATLAB / Octave y Java, todos por delante de Hadoop y Spark. Una adición más que puede sorprender a las personas es la minería de datos de Excel de Microsoft.

Imagen cortesía de Kaggle.

La lista de KDnuggets también incluye un consejo sobre educación formal. La mayoría de los científicos de datos poseen títulos avanzados: el 46 por ciento tiene doctorados, y el 88 por ciento posee al menos un título de maestría. Los títulos universitarios que poseen generalmente se dividen entre áreas relacionadas. Alrededor de un tercio está en matemáticas y estadísticas, que es el más popular para esta carrera. El siguiente más popular es un título en informática, con un 19 por ciento, e ingeniería, la elección del 16 por ciento. Por supuesto, las herramientas técnicas particulares de la ciencia de datos a menudo no se estudian en los programas de grado sino en campamentos especializados o mediante cursos en línea.

Más que cursos: dos consejos más

Hank Yun, un asistente de investigación en el Departamento Pulmonar de Weill Cornell Medicine y estudiante de la Academia de Ciencias de Datos de Nueva York, aconseja a los aspirantes a científicos de datos a planificar en qué trabajarán y encontrar un mentor. Él dijo:

Sin errores, sin estrés: su guía paso a paso para crear software que cambie su vida sin destruir su vida

No puede mejorar sus habilidades de programación cuando a nadie le importa la calidad del software.

No cometas el error que cometí diciéndote que conoces la ciencia de datos porque tomaste un curso y recibiste un certificado. Es un gran comienzo, pero cuando comiences a estudiar, ve con un proyecto en mente. ¡Entonces encuentre un mentor en el campo y comience un proyecto de pasión de inmediato! Cuando estás fresco, no sabes lo que no sabes, por lo que ayuda cuando alguien está allí para guiarte a lo que es importante para ti y lo que no. ¡No querrás pasar mucho tiempo estudiando sin nada que mostrar!

Saber qué herramienta sacar de su caja de herramientas: Consejo para mantenerse a la vanguardia de la curva

Dada la disparidad en la clasificación de las herramientas de ciencia de datos, algunos pueden sentirse desconcertados sobre en qué centrarse. Celeste Fralick, científica de datos en jefe de la compañía de software de seguridad McAfee, aborda el tema en un artículo del CIO que analiza las habilidades esenciales para un científico de datos y declara: "Un científico de datos debe mantenerse al frente de la curva en la investigación, así como entienda qué tecnología aplicar cuando ”. Eso significa no ser atraído por lo“ sexy ”y lo nuevo, cuando el problema real” requiere algo mucho más corriente. "Conocer el costo computacional para el ecosistema, la capacidad de interpretación, la latencia, el ancho de banda y otras condiciones límite del sistema, así como la madurez del cliente, ayuda al científico de datos a comprender qué tecnología aplicar".

Habilidades blandas esenciales: otros seis consejos

El punto que Fralick plantea se relaciona con las habilidades no técnicas que requiere el trabajo de científico de datos. Es por eso que la lista de KDnuggets incluye estos cuatro: curiosidad intelectual, trabajo en equipo, habilidades de comunicación y visión para los negocios. Zhan también incluyó habilidades blandas clave en sus consejos para científicos de datos, identificando "habilidades de comunicación" como KDnuggets, pero usando "experiencia de dominio" en lugar de "perspicacia comercial". Como quiera que se llame, se refiere a la aplicación práctica de la ciencia de datos al negocio. (Para obtener más información sobre las habilidades de comunicación, consulte La importancia de las habilidades de comunicación para los profesionales técnicos).

Olivia Parr-Rud ofreció su propio giro en esto, agregando dos habilidades más suaves, con énfasis en el papel de la creatividad, afirmando: "Pienso en la ciencia de datos como un arte tanto como una ciencia", algo que requiere dibujar Las fortalezas de ambos lados del cerebro. “Muchas personas hablan de la ciencia de datos como una carrera que utiliza principalmente el cerebro izquierdo. He descubierto que para tener éxito, los científicos de datos deben usar todo su cerebro ".

Explicó que avanzar en el campo requiere no solo competencia técnica sino creatividad y la visión necesaria para el liderazgo:

La mayoría de las tareas del cerebro izquierdo / lineales pueden ser automatizadas o subcontratadas. Para ofrecer una ventaja competitiva como científicos de datos, debemos ser capaces de reconocer patrones y sintetizar grandes cantidades de información utilizando ambos lados de nuestro cerebro. Y debemos ser pensadores innovadores. Muchos de los mejores resultados son el resultado de la integración del cerebro izquierdo y derecho.

También enfatizó por qué comunicar una visión claramente es esencial:

Como científicos de datos, nuestro objetivo es utilizar los datos para ayudar a nuestros clientes a aumentar sus ganancias. La mayoría de los ejecutivos no entienden lo que hacemos o cómo lo hacemos. Por lo tanto, debemos pensar como líderes y comunicar nuestros hallazgos y recomendaciones en un lenguaje que nuestros interesados ​​entiendan y confíen.

La docena de datos

Los consejos clave incorporan una mayor cantidad de herramientas técnicas, habilidades y capacidades, así como cualidades menos cuantificables como la aptitud para la creatividad y el liderazgo. En definitiva, no es solo un juego de números. Como la ciencia de datos no se trata solo de crear modelos en el vacío, sino de crear aplicaciones prácticas para resolver problemas de la vida real de las empresas, aquellos que tendrán éxito en el campo no solo necesitan dominar la tecnología, sino conocer su dominio comercial y comprender las necesidades de Los distintos miembros del equipo en el trabajo.