Este es el primero de una serie de publicaciones sobre Python,
Jupyter Notebook, Mapbox y Keplergl una combinación de herramientas con
Python que todo científico de datos o analista de datos debe de
conocer. Esta publicación introductoria sobre los diferentes
herramientas a utilizar, en segunda parte instalaremos cada una de las
herramientas para luego en la tercera parte hacer un ejercicio práctico.
Python:
Es
un lenguaje de programación creado por Guido
van Rossum a finales de los 80’s y su
aparición a inicios de los 90’s y que actualmente el lenguaje màs
popular en este 2019 según información recabada en el sitio de
https://stackoverflow.com/,
su versatilidad y robustez han permitido posicionarse en este puesto.
Python a tenido un empuje considerable luego de la aparición de
técnicas para el aprendizaje automático, inteligencia de negocios,
ciencia de datos entre otros temas; con el objetivo de obtener
conocimientos a partir de patrones en un determinado grupo, realizar
predicciones, analizar una gran cantidad de datos que un ser humano
le fuera imposible analizar, ect. Todo esto ha sido posible por la
llegada de la Cuarta Revolución Industrial llamada del
“Conocimiento” y la llegada de IOT (Internet of Things) por
contener una gran cantidad de información útil para ser analizada.
Jupyter Notebook:
Es
un entorno de desarrollo interactivo basado en la web, orientado a
diferentes flujos de trabajo como: limpieza y transformación de
datos, aprendizaje automático, ciencia de datos, modelos
estadísticos, visualización de datos, entre otros temas. Su
versatilidad para agregar comentarios, formulas matemáticas y
código, lo hace muy popular para ser utilizado por profesionales o
estudiantes en el ámbito científico.
Es
una librería escrita de Python muy utilizada para el manejo y
análisis de datos. Es muy útil para la obtención de datos de
diferentes fuentes, como dataframe, archivos en formato json,
archivos csv, etc. A continuacion se puede apreciar un ejemplo de
como obtener los datos con la librería Pandas en el entorno de
JupyterLab.
Keplergl:
Es
una herramienta web para el análisis de datos geoespaciales para la toda de decisiones basada
en tecnologías como deck.gl, WebGL, React y Redux. Uber lo libero
este año y se puede encontrar en GitHub en su pagina oficial para
que cualquier persona pueda contribuir a crear nuevas funcionalidades
o utilizarlo para proyectos internos con la licencia MIT.
En la próxima publicación se trabajará en la instalación de las
herramientas para luego realizar un ejercicio práctico con datos
públicos.
Referencias:
0 comentarios:
Publicar un comentario