Cordiales Saludos
Recopilación de Datos de una hoja de excel
Podemos importar los datos de una hoja de excel para trabajar, con ellos, en nuestro cuaderno de jupyter notebooks. Hasta ahora realizábamos los ejercicios creando nosotros las variables para las Series y Dicionarios que luego tratábamos con los Data Frame. Ahora comenzaremos a "recopilar los datos", traerlos desde un archivo externo a nuetra área de trabajo.
Para la extracción de datos de una tabla de excel, tomé como referencia: La Tabla final de la Temporada N14 del Torneo de Ajedrez que organiza el amigo @schamangerbert
Season 14: 17 July to 18 September 2021 / Standings after Round 9 (Final):
Fuente
Conectando nuestro DRIVE
Debemos activar nuestro DRIVE dentro de nuestro cuaderno de trabajo para poder accesar a los archivos que nos interesan.
Importante: Previamente debemos cargar el archivo de excel a la carpera de Colab Notebooks
Para activar el DRIVE, click a la carpeta de exploración de archivos (Flecha roja)
Luego click en la carpeta con es símbolo del DRIVE (Flecha roja)
Luego aparecerá este mensaje y le damos click a [Conectar con Google Drive]
Aparecerá nuestro DRIVE en el explorador de archivos (Recuadro azul)
Entramos a Colab Notebooks y luego a nuestra carpeta de trabajo del curso. En el recuadro verde vemos los dos archivos con los que trabajaremos en esta publicación.
Para comenzar a trabajar escribiremos el siguiente código
import pandas as pd
from google.colab import drive
.
A continuación copiamos la ruta de acceso al archivo de excel. Primero click con el botón derecho a Season14.slsx (flecha azul) para desplegar el menú contextual.
Luego agregamos la ruta de acceso al archivo a la siguiente instrucción(Ctrl + V), dentro de las comillas (Flecha roja)
pd.read_excel(' ')
Y listo!
Recopilación de Datos de un archivo .csv
Trabajaremos con los datos utilizados en nuestra publicación anterior: Tabla final 7ma Temporada Hivechess Tournament, organizado por @stayoutoftherz, pero ahora guardada en nuestro DRIVE con la extensión .csv
Importante: Que son los archivos .csv
Todo el proceso para recopilar los datos en este formato, es igual a lo que acabamos de hacer para traer los datos de una hoja de cálculo, cambiaríamos solamente la instrucción que sigue:
pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Data_Science/Tabla_jugadores.csv')
Todo lo tratado en esta publicación está en este link: 004_DataFrame2.ipynb
Aquí mi DRIVE de esta serie, si deseas descargar los archivos utilizados en esta publicación y todos los ejercicios que vamos realizando.
Publicaciones de esta serie:
Data Science N000. Preparando todo!
Data Science N001. Series
Data Science N002. Series a partir de Diccionarios
Data Science N003
Lo bonito de la informática es que podemos hacer algunos procesos de diferentes formas, el siguiente código es otra manera para activar El DRIVE en nuestra área de trabajo. Esto lo revisaremos en otra publicación
from google.colab import drive
drive.mount('/content/drive')