Uso de técnicas de web scraping para el análisis de datos de jugadores profesionales del futbol peruano para el periodo 2021
View/ Open
Download
(application/pdf: 7.743Mb)
(application/pdf: 7.743Mb)
Date
2023Author(s)
Monzón Laiza, Reynaldierri Freud y Eudes
Vargas Ulloa, Italo Noel
Metadata
Show full item recordAbstract
El poder recurrir a una fuente confiable y detallada de todos los encuentros
deportivos de los clubes peruanos de la Liga 1; y poder consultar en el
tiempo, información como resultado de los encuentros deportivos por
temporada, jugadores destacados, clubes con más campeonatos, faltas
deportivas, edad de los jugadores, nivel económico de los equipos, entre
otras métricas, es sumamente escasa y generalmente la información no
está relacionada, ni tiene una homogeneidad. Ese interés en poder
consultar todo en una sola interfaz general, se trazó como objetivo del
proyecto de esta tesis, la creación de un Dashboard en Power BI, y que
como fuente de datos se utilizaría unas páginas online futbolísticas, que,
aunque no contiene todas las métricas con respecto a otros países, se usó
para la creación de dicho dashboard mencionado anteriormente. Para ello
se recurrió en la fase de recolección de datos, el uso de una técnica de web
scraping, mediante una extensión de Google Chrome, por ser de fácil uso y
conveniencia del proyecto. En el desarrollo de este proyecto se usó la
metodología SCRUM, basado en 2 fases: una fase de planificación y la otra
fase de desarrollo para el desarrollo del Dashboard. Paso seguido se
publicó de manera online, para que cualquier persona interesada, pueda
interactuar de manera remota siempre que tenga un acceso privilegiado. Al
término del desarrollo del proyecto se evaluó mediante un cuestionario
dirigido a un grupo experto, la valoración de dashboard, y se concluyó que,
a pesar del reto de la poca información detallada, se pudo generar un
reporte general con diferentes vistas, siendo este una base para análisis
más interesantes en el futuro. Being able to resort to a reliable and detailed source of all the sporting events of
the Peruvian clubs of League 1; and to be able to consult in time, information as
a result of seasonal sports matches, featured players, clubs with the most
championships, sports fouls, age of the players, economic level of the teams,
among other metrics, it is extremely scarce and generally the information is not
related, nor is it homogeneity. That interest in being able to consult everything in
a single general interface, was outlined as the objective of the project of this
thesis, the creation of a Dashboard in Power BI, and that online soccer pages
would be used as a data source, which, although it does not contain all the
metrics like other countries, was used for the creation of said dashboard
mentioned above. For this, the use of a web scraping technique was used in the
data collection phase, using an extension of Google Chrome, for being easy to
use and convenient to the project. In the development of this project, the
SCRUM methodology was used, based on 2 phases: one planning phase and
the other development phase for the development of the Dashboard. Step by
step it was published online, so that anyone interested can interact remotely
whenever they have privileged access. At the end of the development of the
project, the evaluation of dashboard was evaluated through a questionnaire
addressed to an expert group, and it was concluded that, despite the challenge
of little detailed information, a general report could be generated with different
views, this being a basis for more interesting analyzes in the future