Web Scraping: usos, herramientas, ejemplos y legalidad vigente
Desde Araba Enpresa Digitala nos llega:
JORNADA• gratuita • 23 de abril • Parque Tecnológico de Álava, Vitoria-Gasteiz
El recurso más valioso del mundo ya no es el petróleo, son los datos. Así arranca el artículo «The world’s most valuable resource is no longer oil, but data» de «The Economist», basándose en afirmar que es el principal activo, de las cinco firmas más potentes del mundo, han pasado a ser los datos. No se puede concebir de otro modo en esta era digital.
Si nos atenemos a lo que dice la wikipedia, entendemos por web scraping como una técnica utilizada mediante programas de software para extraer información de sitios web. Obtener datos, información y contenido es relativamente fácil con la tecnología actual que tenemos.
Hay muchas más fuentes de datos relevantes: documentos, emails y open data. Combinando y agregando estas fuentes, con la información extraída de sitios webs, se pueden obtener conjuntos de datos más valiosos.
Entre los usos habituales de web scraping se encuentran: detección de cambios en sitios web, obtención de precios para comparadores, aplicaciones para business intelligence, generación de leads/contactos de venta, periodismo de investigación y un largo etcétera. Haremos un repaso de las empresas que, actualmente, se basan en esta técnica como su principal motor de negocio. Absolutamente cualquier vertical está afectada: retail, real estate, etc.
Veremos, superficialmente, las técnicas actuales de web scraping y las implicaciones éticas que surgen a diario.
Pero ¿es legal? ¿Podemos recopilar contenido de cualquier web que se encuentra accesible sin problemas? ¿nos podemos oponer a que otros extraigan el contenido de nuestros sitios? Haremos un repaso a la normativa que puede afectar a esta técnica.
Programa completo e inscripciones en spri.eus/euskadinnova.