Web Scraping: usos, herramientas, ejemplos y legalidad vigente

Desde Araba Enpresa Digitala nos llega:

JORNADA•  gratuita  •  23 de abril  •  Parque Tecnológico de Álava, Vitoria-Gasteiz

El recurso más valioso del mundo ya no es el petróleo, son los datos. Así arranca el artículo «The world’s most valuable resource is no longer oil, but data» de «The Economist», basándose en afirmar que es el principal activo, de las cinco firmas más potentes del mundo, han pasado a ser los datos. No se puede concebir de otro modo en esta era digital.

Si nos atenemos a lo que dice la wikipedia, entendemos por web scraping como una técnica utilizada mediante programas de software para extraer información de sitios web. Obtener datos, información y contenido es relativamente fácil con la tecnología actual que tenemos.

Hay muchas más fuentes de datos relevantes: documentos, emails y open data. Combinando y agregando estas fuentes, con la información extraída de sitios webs, se pueden obtener conjuntos de datos más valiosos.

Entre los usos habituales de web scraping se encuentran: detección de cambios en sitios web, obtención de precios para comparadores, aplicaciones para business intelligence, generación de leads/contactos de venta, periodismo de investigación y un largo etcétera. Haremos un repaso de las empresas que, actualmente, se basan en esta técnica como su principal motor de negocio. Absolutamente cualquier vertical está afectada: retail, real estate, etc.

Veremos, superficialmente, las técnicas actuales de web scraping y las implicaciones éticas que surgen a diario.

Pero ¿es legal? ¿Podemos recopilar contenido de cualquier web que se encuentra accesible sin problemas? ¿nos podemos oponer a que otros extraigan el contenido de nuestros sitios? Haremos un repaso a la normativa que puede afectar a esta técnica.

Programa completo e inscripciones en spri.eus/euskadinnova.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

En cumplimiento de lo dispuesto en el Reglamento General de Protección de Datos (RGPD), así como en el resto de normativa en materia de protección de datos, te informamos de lo siguiente:
Responsable del tratamiento: COLEGIO OFICIAL DE INGENIEROS EN INFORMÁTICA DEL PAÍS VASCO (COIIE)
Finalidad: Publicar su comentario.
Derechos: Tienes derecho al acceso, rectificación, supresión, oposición, limitación y portabilidad de tus datos, así como el resto de derechos reconocidos en la normativa de protección de datos. Para más información puedes contactar con nuestro delegado de protección de datos en la dirección secretaria@coiie.org y en nuestra política de privacidad.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.