Rol laboral: Científico de datos

Autor: Roger Morrison
Fecha De Creación: 28 Septiembre 2021
Fecha De Actualización: 11 Mayo 2024
Anonim
Rol laboral: Científico de datos - Tecnología
Rol laboral: Científico de datos - Tecnología

Contenido


Fuente: Sergey Khakimullin / iStockphoto

Para llevar:

Los científicos de datos tienen trabajos de gran alcance que varían considerablemente según la aplicación. Pero una cosa que todos tienen en común es el impulso de hacer un buen uso de los datos.

¿Qué hace un científico de datos en el trabajo de inteligencia artificial y aprendizaje automático? Muchos profesionales que se ocupan de este tipo de proyectos todos los días dirían que la pregunta es difícil de responder simplemente. Una mejor pregunta sería: ¿qué NO hacen los científicos de datos?

Un científico de datos es parte integral de un proceso de IA o ML, en el sentido de que todos estos proyectos dependen de grandes datos o entradas complejas. El científico de datos es el profesional esencial que sabe cómo trabajar con datos para producir resultados.

Sin embargo, hay algunas maneras de hablar sobre lo que hace un científico de datos, qué calificaciones necesita y cuál es su papel en el proceso.


Leer: 6 conceptos clave de ciencia de datos que puede dominar a través del aprendizaje en línea

Definiciones Variadas, Deberes Variados

Muchos expertos que describen el trabajo de un científico de datos lo hablan en términos generales.

"En pequeñas empresas o cuando se trabaja en un nuevo mercado, el papel de un científico de datos es convertir fuentes de datos relativamente novedosas (pero obvias) en cosas que resuelvan un problema para un usuario final, lo que anteriormente no hubiera sido posible, donde las tecnologías empleadas no existían ", dice Antonio Hicks, gerente de cuentas de Mercury Global Partners. "El candidato ideal es alguien que es en parte matemático, en parte ingeniero de software y en parte emprendedor".

Otros se hacen eco de esta idea básica, mencionando qué datos necesitan los científicos para abordar proyectos de modelado.


"El atributo más importante que necesita un científico de datos es una profunda curiosidad sobre el mundo que lo rodea: ya sea que estén respondiendo preguntas o construyendo modelos, el deseo de comprender el problema frente a ellos es clave", dice Erin Akinci, gerente de científicos de datos. en Asana "A partir de ahí, la mayoría de las personas requerirán habilidades en matemática y programación para encontrar soluciones, pero los tipos específicos de matemática y programación varían ampliamente dependiendo del área de experiencia dentro de la ciencia de datos".

Sin errores, sin estrés: su guía paso a paso para crear software que cambie su vida sin destruir su vida

No puede mejorar sus habilidades de programación cuando a nadie le importa la calidad del software.

"El excelente trabajo científico tiene más que ver con la forma en que un científico piensa acerca de un problema, que con las herramientas que utiliza para resolverlo", agrega Charlie Burgoyne, fundador y CEO de Valkyrie Intelligence. Valkyrie es una empresa de consultoría de ciencias aplicadas con proyectos impresionantes bajo su ala como Mark I, un dispositivo de red dedicado que impulsa la capacitación y las pruebas de redes neuronales, mejorando lo que es posible con las plataformas de aprendizaje automático basadas en la nube anteriores.

"El mercado exige científicos que sean competentes en el desarrollo de Python, el diseño de redes neuronales y la capacidad de remodelar un repositorio de datos en la última arquitectura de base de datos", dice Burgoyne. “Sin embargo, esas capacidades son apuestas para un científico con talento. Lo que es menos obvio es la aptitud de un científico para la curiosidad intrépida, el ingenio agresivo y la adhesión al método científico ".

Las habilidades de un científico de datos

Entonces, en lo que respecta a las habilidades prácticas, los científicos de datos necesitan cierta cantidad de creatividad y conocimiento en lo que respecta al modelado. También pueden beneficiarse bastante de tener "habilidades difíciles", como la experiencia de codificación en Python, C ++ u otros lenguajes comunes aplicados a proyectos de ML.

"Python y C ++ son esenciales y poder combinar las habilidades de codificación con el análisis y procesamiento de datos y las estadísticas son habilidades básicas que harán que un científico de datos se destaque como un fuerte candidato o empleado", dice Val Streif en Pramp, una plataforma de entrevistas simuladas en línea para ingenieros de software, desarrolladores y científicos de datos. "Si bien algunas de las habilidades de programación podrían solucionarse combinando un científico de datos con un desarrollador, es mucho más fácil si se combinan ambas habilidades en una sola, desde la perspectiva de una empresa".

Otros expertos agregan R, Hadoop, Spark, Sas y Java a la lista, así como tecnologías como Tableau, Hive y MATLAB.

Todos ellos hacen un currículum impresionante, pero algunos de los que tienen experiencia en el reclutamiento de científicos de datos dicen que el otro lado "humano" también es importante. (Un tipo de científico de datos es el científico de datos ciudadanos. Obtenga más información en The Role of Citizen Data Scientists in the Big Data World).

"Tradicionalmente, las personas con una educación diversa en artes liberales son excelentes científicos de datos", dice Burgoyne, haciendo una distinción entre ingenieros, que están en el lado de la construcción, y científicos de datos, cuyo trabajo puede ser mucho más conceptual. Él continúa:

La experiencia en un campo STEM tradicional con un enfoque complementario en los dominios de humanidades, artes o negocios produce esas cualidades que hacen un excelente científico orientado a la industria. Hay que decir que es tan importante para la capacidad de la organización aprovechar esas cualidades y dar forma a su fervor y métodos de manera productiva. He observado que cuando una iniciativa de ciencia de datos no tiene éxito, es probable que la organización sea tan culpable como los científicos. Los científicos no son ingenieros. No están motivados para ejecutar y construir. Son impulsados ​​a descubrir y comprender. Las organizaciones que captan esta diferencia son bien recompensadas por el cultivo de ambos campos.

En cuanto a lo que los científicos de datos suelen aplicar, eso tiene que ver con los objetivos centrales de la empresa. Algunas empresas persiguen un internet descentralizado, algunas están jugando con IoT o SaaS. Otros están tratando de ser pioneros en la IA "amigable para el usuario" o "ética" o "transparente".

En cualquier caso, es probable que los científicos de datos estén reduciendo la brecha entre las métricas estrictas de los datos que usan, en cualquier pila de tecnología que esté en juego, y el trabajo libre de conceptualizar la funcionalidad AI / ML.

"Contratamos científicos de datos para gestionar la recolección y limpieza de datos, así como para traducir esos datos en información significativa", dice Michael Hupp, Gerente de Ciencia y Análisis de Datos en G2 Crowd. El elabora:

Por lo general, eso significa administrar cualquier algoritmo importante que impulse el motor de datos de una empresa y dominar las herramientas de análisis e idiomas clave, pero en los últimos años también ha incluido campos emergentes como el procesamiento del lenguaje natural, el aprendizaje automático y otras formas de análisis habilitados para IA. Los científicos de datos más exitosos son aquellos que combinan sus habilidades difíciles con la capacidad de aprender rápidamente y la capacidad de comunicar de manera efectiva los conocimientos que descubren para que sean significativos para su negocio.

Con este tipo de información, es más fácil para los jóvenes profesionales o estudiantes determinar si los científicos de datos serían un buen papel para ellos y cómo adquirir habilidades. El aprendizaje STEM se está volviendo más accesible en las escuelas de todo el país, pero no hay sustituto para la pasión por la codificación y la tecnología, y la capacidad de aprender sobre la marcha.