|  |  |  | 

Articulos Ciencia y Tecnología Opinión

Integrándose al mundo digital: El uso de “Machine Learning” en los negocios

Por: Carlos León.
Escuela de Economía USAT

Recolectar datos de clientes dispersos, de forma estructurada o no estructurada; a lo largo del ámbito de influencia de un negocio de formato físico, es algo común en estos tiempos. Más sofisticada es la colección y uso de los datos por parte de negocios absolutamente digitales, cuya total orientación u objetivo de negocios: es encontrar una forma de monetizar esa información, sea mediante mayor ticket de venta o porque es un espacio de mensajería publicitaria; son por lo menos referencias de nuevas ventas o una base para conocer mejor al cliente.

En ambos casos, negocios grandes o pequeños, se enfrentan a lo mismo, tomar decisiones a partir de datos, transformándolos en información útil para tomar decisiones empresariales. Dichos datos base, son cada vez más abundantes. Algunos negocios quizás quieran predecir su flujo de ventas, con al menos algún grado de fiabilidad, de modo que sus cadenas logísticas se optimicen en materia de tiempos, costos o simplemente ajustar oferta y demanda.

Otros negocios desean más bien tener una clara idea de los clientes que tienen, buscando criterios más finos de satisfacerlos a todos, pero haciendo diferencias de atención o foco entre ellos.

Lo anterior es algo que la estadística de otros tiempos ha ayudado y mucho, los modelos de programación de inventarios sean dinámicos o no, han contribuido en reducir las probabilidades de falla o variabilidad en los cambios de demanda. De igual modo, los modelos de datos no paramétricos o simplemente algoritmos multivariantes han ayudado a entender las técnicas de segmentación de mercados.

Sin embargo, estas técnicas se movían en un mundo básicamente dentro de muestra y con una fiabilidad dominada por la bondad de ajuste o el intervalo de confianza, en muestras que juzgábamos representativas, cuando no pequeñas, muy estructuradas (previamente diseñadas), de poca frecuencia y por ende caras de obtener, pero con buena calidad.

No obstante en estos tiempos, la abundancia de datos (millones de ellos en muchos casos), trae consigo nuevas posibilidades de tratamiento de los mismos (a bajo costo), las muestras pueden ser realmente grandes, totalmente aleatorizadas, inclusive con o sin reemplazo y no perder tanta potencia de información. Claro está, que siempre la abundancia de datos puede no llevar a una mayor calidad de los mismos, millones de datos no garantizan que el siguiente millón de muestra sea mejor, pero pueden al menos garantizar probar lo que hallamos, es lo que ahora se conoce como pruebas o test fuera de muestra.

Entonces si tenemos claro el objetivo de negocios, el siguiente paso es tratar los datos para lograr ese objetivo, con decisiones mejor informadas. Ese puente entre las decisiones y los datos, se podría denominar como el uso de herramientas de “Machine Learning”.

Ya no suena a ciencia ficción, con la llegada del internet a alta velocidad, el uso de nubes para grabar datos e incluso el uso de algoritmos de computación que no requieren mucha memoria de procesamiento (incluso existe el procesamiento en servidores en línea, fuera de la empresa, hasta gratuitos o muy baratos), han permitido que negocios en general, puedan tener algún mecanismo propio o asistido de Machine Learning.

En el pasado por ejemplo, se hablaba de redes neurales, sonaba sofisticado y alejado del mundo de los negocios más locales o latinoamericanos. Sin embargo hoy con la gran cantidad de datos existente, es posible simular estos procesos mediante funciones de activación (expresiones matemáticas funcionales) para separar grupos de clientes por ejemplo. También se pueden usar máquinas de soporte vectorial, proceso que puede subdividir datos en dos o tres planos dimensionales, de modo que podamos conocer mejor a los clientes, la clasificación de los datos es la idea que subyace dentro de estas técnicas de Machine Learning.

Datos no limpios, montados en distintas distribuciones, mezclados entre potenciales grupos de interés o no, pueden ser claramente clasificados en datos limpios, donde puedan notarse los clientes efectivamente interesados en el producto o cualquier otro desafío de negocios, como clientes riesgosos o no, clientes con capacidad de pago o no, etc. Es un mundo nuevo de oportunidades estratégicas del uso de datos a bajo costo, con cierta exigencia de personal entrenado, pero igual al alcance de la mano, incluso asociando al pequeño negocio con proveedores financieros, por ejemplo, muy entrenados en Machine Learning, y que buscan ampliar sus ecosistemas de negocios.

Estas técnicas también pueden llenarse de robustez, por ejemplo, el uso de matrices de confusión, que arrojen claramente aquello datos positivos y no falso positivos, incluso si esto no es suficiente, podemos probar diversidad de modelos, usando criterios como curvas ROC, que claramente permiten validar si la distribución de los grupos de interés para el negocio, han sido separados correctamente, usando alguno de los muchos modelos que pueden probarse.

Otras formas de validación de estas técnicas, es la predicción con testeo fuera de muestra, por ejemplo, si le acertamos o no a submuestras aleatorias creadas a partir de la gran cantidad de datos, ello nos da una idea clara de lo bueno que fue el modelo predictivo (claro está que el futuro no se puede adivinar, pero podemos tener una senda de escenarios bastante probables o esperables y pasibles de generar estrategias en el presente).

Pensemos negocios que enfrentan riesgos cambiarios altos, importadores o portafolios líquidos de comerciantes que venden en dólares, pues ahora disponen de mejores posibilidades de predecir el tipo de cambio. Incluso se pueden probar en simultáneo diversidad de modelos predictivos (desde regresiones penalizadas, componentes principales e incluso grupos de árboles de decisiones o regresión), bajo la jerga de “entrenarlos” dentro de muestra y validarlos con la realidad, extrayendo para ello, muestras diversas sin reemplazo de dicho mundo real, que no se usaron en el entrenamiento, la cual es una técnica denominada validación cruzada. De este modo podemos tener mejor referencia del valor predictivo, una técnica que puede extenderse a predicción de demanda con diversidad de características, lo cual ayuda en la logística de cualquier negocio.

Los modelos de Machine Learning, no sólo van ganando popularidad, sino que es posible entrenarlos directamente desde internet, el hecho de que las bases de datos puedan ser textos o imágenes, permite que los algoritmos de Machine Learning puedan extraer directamente los datos de la web, clasificarlos o predecirlos.

Si bien es cierto, el uso de datos desde internet, requieren mecanismos de privacidad “diferencial” entre los sesgos que el investigador (analista empresarial) puede darles y la limpieza de los mismos para evitar discriminaciones a priori sobre grupos humanos. Es innegable que el uso de los datos directos desde la web, permite tener un mejor mapeo de los clientes, bajo los criterios de preferencia que tengan al usar la web de la empresa u otras webs de interés para la empresa, por ende esta técnica de web scraping se comienza a popularizar entre los negocios.

Finalmente sea que se quiera predecir o clasificar (al menos al denominado estilo supervisado), con criterios estadísticos fiables, los negocios ya no tienen limitaciones a la hora de tratar la abundancia de datos existentes, sólo hace falta tener un objetivo claro, una buena estrategia de negocios y que su instrumento de Machine Learning lo guíe en la mejor toma de decisiones posibles, sobre todo en un mundo de cambios muy rápidos, tanto en los clientes como en los datos que aportan, ya no solo por día, sino por segundo.

Comments

comments

PUBLICACIONES RELACIONADAS

Logo USAT blanco
CONTÁCTANOS
Av. San Josemaría Escrivá de Balaguer Nº 855 Chiclayo - Perú

¿Tienes alguna consulta?
Contáctanos

Política de Privacidad
Do NOT follow this link or you will be banned from the site!
X