web-scraping_jacagudelo

 

 

El Web Scraping es una técnica muy poderosa que actualmente no es muy utilizada como fuente de datos, gracias a su funcionalidad podría ayudarte a extraer datos, cifras, valores que te ayuden en tus procesos de carga diaria. Gracias a distintas técnicas de desarrollo que yo aplico puedo ayudarte a integrar y crear indicadores o presupuestos valiéndonos de información que existe en la web que sea relevante para tu organización y que realmente aporte a tu conocimiento.

Te explico con un ejemplo cómo funciona ésta técnica:

Problema

Supongamos que en uno de tus proyectos de la plataforma BI debes calcular las ventas reales en moneda extranjera (USD) durante cada día valiéndote del valor del dólar que hubo en cada día.

Solución convencional

La primera solución que podemos usar es sencilla, una persona se encargará todos los días de cargar en un archivo plano el valor del dólar correspondiente para que al otro día en el proceso de carga diaria éste se encuentre.

Solución efectiva

El valor del dólar puedes encontrarlo en muchas páginas web disponibles para ti, en nuestro caso podríamos ubicar una página confiable como la siguiente:

cargar_dolar_automaticamente

Aquí podremos encontrar tanto históricos como el valor que nos interesa, el dólar por el día actual.

Gracias al Web Scraping mediante codificación podemos extraer automáticamente el valor del dólar actual (2,851.98) cada día sin necesidad de un proceso manual. Una vez copiado el valor lo podremos almacenar en distintos destinos como directamente en nuestro ambiente de Staging, en un archivo plano para realizar el proceso de carga normalmente o en donde desee.

Al igual que el ejemplo mostrado anteriormente, existen muchas soluciones a problemas que actualmente su organización tenga actualmente o por el contrario sea el caso de automatizar procesos diarios manuales, con soluciones de éste tipo tu organización podría extraer muchísima información valiosas(Una vez se identifiquen páginas web como fuentes confiables) y a su vez automatizar dichas cargas de datos maximizando tus fuentes de entrada y a su vez generando más confianza al permitir una toma de decisiones más acertada.

¿Crees que tu organización desearía obtener datos de la web automáticamente para la carga de datos diaria?

 

Si tú o tú organización desean conocer con más detalle cómo se podría llevar a cabo una implementación de éste tipo, escríbeme al formulario de contacto o directamente al correo john.carvajal@jacagudelo.com donde te contactare y realizaremos una reunión vía Skype, nos conoceremos y explicaré lo que desees con una duración de 30 a 60 minutos donde dejaré en claro tus dudas y sin ningún costo.