¿Ciencia de datos o aprendizaje automático? Aquí está cómo detectar la diferencia

Autor: Laura McKinney
Fecha De Creación: 3 Abril 2021
Fecha De Actualización: 1 Mes De Julio 2024
Anonim
¿Ciencia de datos o aprendizaje automático? Aquí está cómo detectar la diferencia - Tecnología
¿Ciencia de datos o aprendizaje automático? Aquí está cómo detectar la diferencia - Tecnología

Contenido


Fuente: Elnur / Dreamstime.com

Para llevar:

La ciencia de datos y el aprendizaje automático son diferentes en formas clave. De alguna manera, uno puede ser visto como un subconjunto del otro. Ambos son importantes en el progreso actual de TI.

En este nuevo mundo de inteligencia artificial y gestión de datos, es fácil confundirse con algunos de los términos más utilizados en el mundo de TI.

Por ejemplo, la ciencia de datos y el aprendizaje automático tienen mucho que ver entre sí. No es sorprendente que muchas personas con un conocimiento pasajero de estas disciplinas tengan problemas para descubrir cómo difieren entre sí.

Aquí está la mejor manera de separar la ciencia de datos del aprendizaje automático, como principio y como enfoque tecnológico.

Ciencia de datos y aprendizaje automático: terminología amplia y estrecha

En primer lugar, la ciencia de datos es realmente una categoría de tecnología amplia y general que abarca muchos tipos diferentes de proyectos y creaciones. (Para obtener más información sobre qué implica un trabajo de ciencia de datos, consulte Job Role: Data Scientist).


La ciencia de datos es esencialmente la práctica de trabajar con big data. Surgió como la ley de Moore y la proliferación de dispositivos de almacenamiento más eficientes llevó a la recopilación de enormes cantidades de datos por parte de las empresas y otras partes. Luego, las plataformas y herramientas de big data como Hadoop comenzaron a redefinir la informática cambiando la forma en que funciona la gestión de datos. Ahora, con la nube y la contenedorización, así como los nuevos modelos, el big data se ha convertido en un importante impulsor de la forma en que trabajamos y vivimos.

En su forma más simple, la ciencia de datos es la forma en que manejamos esos datos, desde limpiarlos y refinarlos hasta ponerlos en uso en forma de información.

La definición de aprendizaje automático es mucho más estrecha. En el aprendizaje automático, las tecnologías toman los datos y los ponen a través de algoritmos, para simular procesos cognitivos humanos descritos como "aprendizaje". En otras palabras, al tomar los datos y entrenarse en ellos, la computadora puede proporcionar sus propios resultados , donde la tecnología parece haber aprendido de los procesos que implementan los programadores.


Conjuntos de habilidades de ciencia de datos y aprendizaje automático

Otra forma de contrastar la ciencia de datos y el aprendizaje automático es observar las diferentes habilidades que son más valiosas para los profesionales en cualquiera de estos campos.

Sin errores, sin estrés: su guía paso a paso para crear software que cambie su vida sin destruir su vida

No puede mejorar sus habilidades de programación cuando a nadie le importa la calidad del software.

Existe un consenso general de que los científicos de datos se benefician de profundas habilidades analíticas y matemáticas, experiencia práctica con tecnologías de bases de datos y conocimiento de lenguajes de programación como Python u otros paquetes que se utilizan para analizar grandes datos.

"Cualquiera que esté interesado en desarrollar una carrera sólida en (ciencia de datos) debería adquirir habilidades clave en tres departamentos: análisis, programación y conocimiento del dominio", escribe Srihari Sasikumar en Simplilearn. “Yendo un nivel más profundo, las siguientes habilidades lo ayudarán a hacerse un hueco como científico de datos: un sólido conocimiento de Python, SAS, R (y) Scala, experiencia práctica en codificación de bases de datos SQL, capacidad para trabajar con datos no estructurados diversas fuentes, como el video y las redes sociales, comprenden múltiples funciones analíticas (y) conocimiento del aprendizaje automático ".

En el lado del aprendizaje automático, los expertos a menudo citan habilidades de modelado de datos, conocimiento de probabilidad y estadísticas, y habilidades de programación más amplias como herramientas útiles en el conjunto de herramientas del ingeniero de aprendizaje automático.

Cómo detectar el aprendizaje automático

La clave aquí es que todo tipo de cosas comprende el trabajo de ciencia de datos, pero no es aprendizaje automático a menos que tenga un régimen muy estricto configurado para ayudar a la computadora a aprender de sus entradas.

Cuando eso está en su lugar, crea algunos sistemas sorprendentemente capaces que pueden tener efectos de amplio alcance en nuestras vidas.

"Gran parte de lo que hacemos con el aprendizaje automático ocurre debajo de la superficie", según los informes, el fundador de Amazon, Jeff Bezos, señaló algunas de las aplicaciones de este tipo de sistemas. “El aprendizaje automático impulsa nuestros algoritmos para el pronóstico de la demanda, la clasificación de búsqueda de productos, recomendaciones de productos y ofertas, ubicaciones de comercialización, detección de fraudes, traducciones y mucho más. Aunque menos visible, gran parte del impacto del aprendizaje automático será de este tipo, mejorando de manera silenciosa pero significativa las operaciones centrales ".

Uno de los ejemplos más útiles aquí es el surgimiento de la red neuronal: es un método común y popular para configurar procesos de aprendizaje automático.

En su forma más básica, la red neuronal está compuesta de capas de neuronas artificiales. Cada neurona artificial individual tiene una funcionalidad equivalente a una neurona biológica, pero en lugar de sinapsis y dendritas, tiene entradas, una función de activación y salidas eventuales.

La red neuronal está hecha para actuar como un cerebro humano, y los profesionales del aprendizaje automático a menudo utilizan este modelo para crear resultados de aprendizaje automático.

Sin embargo, esa no es la única forma de hacer aprendizaje automático. Algunos proyectos de aprendizaje automático más rudimentarios simplemente incluyen mostrarle a la computadora una amplia gama de fotografías (o proporcionarle otros datos sin procesar), ingresar ideas a través del proceso de uso de aprendizaje automático supervisado y etiquetar datos, y hacer que la computadora eventualmente pueda discriminar entre varias formas o elementos en un campo visual. (Para los conceptos básicos sobre aprendizaje automático, consulte Machine Learning 101.)

Dos disciplinas de vanguardia

En conclusión, el aprendizaje automático es una parte valiosa de la ciencia de datos. Pero la ciencia de datos representa la frontera más vasta y la estafa en la que tiene lugar el aprendizaje automático.

En cierto modo, se podría decir que el aprendizaje automático nunca sucedería sin big data. Sin embargo, los grandes datos en sí no crearon aprendizaje automático; en cambio, después de haber agregado colectivamente tantos datos que casi no sabíamos qué hacer con ellos, las mentes más importantes idearon estos procesos de bio-simulación como una forma sobrealimentada de proporcionar ideas.

Otra cosa buena a tener en cuenta aquí es que la ciencia de datos se puede aplicar de dos maneras principales: podemos adoptar el aprendizaje automático y la inteligencia artificial, dejando que las computadoras piensen por nosotros, o podemos llevar la ciencia de datos a un enfoque más centrado en el ser humano donde la computadora simplemente presenta resultados y nosotros, como humanos, tomamos las decisiones.

Eso está llevando a algunos expertos, incluidos algunos de los principales innovadores de la actualidad, a pedir una contabilidad más dinámica de las formas en que usamos estas tecnologías.

"(AI) es capaz de hacer mucho más de lo que casi nadie sabe y la tasa de mejora es exponencial", dijo Elon Musk, al tiempo que advirtió que el aprendizaje automático y los programas de IA requieren supervisión.

En cualquier caso, tanto la ciencia de datos como el aprendizaje automático son partes centrales del progreso que nosotros, como sociedades, estamos haciendo hoy en tecnología.