Data Science: La potencia sin control no sirve de nada

16 de Diciembre de 2019 · 2 min de lectura

Logo APSL

Como los sistemas de Machine Learning están destinados al fracaso si no van ligados a la algoritmia

En 1994 Pirelli lanzaba un anuncio con el eslogan que da el título a este artículo y una impresionante foto del medallista olímpico Carl Lewis. El mensaje detrás de la foto era que sin unos buenos neumáticos hasta el mejor de los coches puede convertirse en el peor de los peligros. Aunque mucho ha llovido desde entonces, este ejemplo nos sirve a día de hoy para la orientación actual de los sistemas de Machine Learning, destinados al fracaso si no van ligados a la algoritmia.

El maravilloso mundo del cloud y la fuerza bruta

En los últimos años hemos pasado de tener algoritmos de Machine Learning que requerían de un ordenador último modelo, a subirlos a un cluster en la nube y poder poner toda la potencia que deseáramos en unos pocos clics. Para facilitar el servicio las empresas de servidores han comenzado a ofrecer algoritmos ya “empaquetados” donde solo haga falta tocar unos pocos parámetros.

Como muchas cosas en esta vida esto ha acabado degenerando en la idea de que como probar algoritmos es menos caro, podemos probar todos los algoritmos populares de golpe y quedarnos con el mejor. Si bien es una estrategia de empresa que algunas usan, no es Data Science y ni una estrategia óptima a a medio plazo.

Probar diferentes métodos de ML siempre es mejor que probar uno solo, basarse solo en estas herramientas que (a falta de una mejor expresión) buscan soluciones por fuerza bruta, implica que nos encontraremos en la misma situación que cualquiera de nuestra competencia, seremos uno más usando estas herramientas, y no podremos comprobar que el sistema resulve de forma óptima.

Algoritmia: lo difícil es el camino

En APSL no nos enfrentamos a un problema sin entender cada una de sus partes. Mediante nuestra experiencia en gestión de proyectos dentro y fuera de Data Science comprendemos que el problema siempre es más complejo de lo que inicialmente se plantea y es vital recoger diferentes puntos de vista de los implicados para entender la situación, a riesgo de convertirnos en los ciegos de la famosa parábola india.

Una vez definido el algoritmo que necesitamos, entonces es cuando buscamos cuál es la mejor herramienta para aplicarlo. Y es que ML debe ser una pieza del algoritmo, no la base del mismo, sino:

  • No es factible la verificación para que el proceso de un resultado óptimo.
  • Perderemos competitividad al estar usando una solución no específica.
  • Estaremos igual o peor que la competencia ya que no estaremos utilizando nada diferente a lo que ellos ya tengan acceso.

Es el estudio de todos los elementos implicados, junto con el entendimiento de la empresa y el mercado el que nos permite definir las instrucciones y reglas que se convierten en los algoritmos que aplicamos al final.

Fuentes de las imágenes link1, link2, link3

Si crees que tienes un problema en el que nuestro departamento de Data Science pueda ayudarte no dudes en enviarnos un correo a data@apsl.net

Comparte este artículo
Etiquetas
Artículos recientes