No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Selección de bases de datos confiables

4/14
Recursos

Aportes 33

Preguntas 5

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

LOS DATOS DEL PROFESOR NO SON LOS MISMOS AUNQUE SIGA SUS PASOS Hola me di cuenta de que algunos pasos no los menciona explícitamente el profesor. 1. Después de importar los datos, lo que hace es CTRL + A para seleccionar todos los datos y después clic en “Agregar Filtro”. 2. Al crear la columna de regiones y pasar los años 2000 y 2002 a la nueva hoja de calculo quita los valores “vacíos”; es decir, en las tres columnas solo deja países y con información de ese año. Se los comparto porque a mi me costo trabajo entender por qué no me salía igual el ejercicio. Saludos!!!
Fuentes de Trabajo: * Our World in Data * World Bank (Banco Mundial) Preguntas sobre fuentes: * ¿Es confiable? * ¿Proviene de alguna Organización Gubernamental o Universidad? * ¿Los datos son actuales/vigentes? * ¿Hay transparencia sobre la recopilación y metodología? Recomendación: Trabajar en Google Sheets. <3
La función si usan Google Sheets en español la encuentran como `BUSCARV()` y asegúrense de seleccionar los metadatos de **CountryCode** y **Region.**
El profesor Eduardo usa Google Sheets en inglés, por lo que es **VLOOKUP()**. Si cambiamos el idioma a Español sería **BUSCARV()**. **CUIDADO:** En algunas regiones (como España) se usan las fórmulas con punto y coma ( ; ) en lugar de coma ( , ) para separar los parámetros. Es importante configurar bien las hojas (en archivo >> configuración).
## **ENCONTRANDO FUENTES DE DATOS PARA EL CURSO** ### **FUENTES RECOMENDADAS** #### **Our World in Data** Una de nuestras fuentes favoritas es la página web "Our World in Data". Ofrece una amplia gama de temas con datos disponibles para explorar. Podemos acceder a recursos y gráficos en la sección "Resources/Charts and Explorers". Por ejemplo, podemos explorar la producción global de alimentos y seleccionar un alimento específico, como los aguacates, para ver la producción mundial a lo largo del tiempo. Los datos pueden descargarse en formato CSV para su uso posterior. #### **Banco Mundial (World Bank)** Otra fuente valiosa es la página web del Banco Mundial. Ofrece una amplia variedad de datos económicos, como el Producto Interno Bruto (PIB). Podemos buscar y descargar datos sobre el PIB bruto a nivel país. Los datos están disponibles para su descarga en varios formatos, como CSV o Excel. ### **CONSIDERACIONES AL UTILIZAR FUENTES DE DATOS** Es importante realizar una investigación al utilizar fuentes públicas de datos. Algunas preguntas importantes a considerar incluyen la confiabilidad de la fuente, la actualización de los datos, la transparencia en la metodología de recopilación de datos y la credibilidad de las fuentes citadas. Siempre debes usar tu mejor criterio al trabajar con datos. ### **UTILIZANDO GOOGLE SHEETS PARA MANIPULAR DATOS** En esta clase, utilizaremos Google Sheets como nuestra herramienta principal para manipular datos. Google Sheets es fácil de usar, compartir y actualizar en tiempo real. Recomendamos su uso, especialmente para trabajo en equipo. Podemos importar los datos descargados del Banco Mundial a Google Sheets para su análisis. ### **PREPARANDO Y SIMPLIFICANDO LOS DATOS** Antes de comenzar el análisis, es útil preparar y simplificar los datos. Podemos agregar información adicional, como la región de cada país, utilizando fórmulas como VLOOKUP en Google Sheets. También podemos simplificar los datos seleccionando un rango de años específico para nuestro análisis.
Algo muy importante esque no todos los datos que encontramos en internet son reales
No entiendo, ¿Cómo apareció rellena la región de Aruba si en los datos originales la información estaba en blanco? Gracias <3
Quiero agregar que una pregunta fundamentas para la verificación de la fuente de datos es “¿Quién está pagando estos datos? ¿Quién financio la investigación?” Es importante tratar en la medida de lo posible eliminar los conflictos de interés de nuestros datos.
Yo estoy realizando un proyecto con abejas, y estaré tomando datos, como puedo hacer que sean bastantes confiables si al principio solo la universidad tendrá la información ?
Pésimo que en algo tan simple fallen. Ni siquiera el archivo que pone el profesor en los recursos, coincide 100% con el trabaja durante la grabación.
Es muy importante saber excel antes de seguir con el curso.
¿Qué atajos del teclado usa el profesor para la selección de columnas y para el autocompletado? ¿Cambian para Windows?
La fórmula que usas, `=VLOOKUP(B5,'Metadata - Countries'!$A:$B,2,FALSE)`, busca un valor en la columna A del rango 'Metadata - Countries' y devuelve el valor correspondiente de la columna B. Si algunas celdas no muestran la región, puede ser por varias razones: 1. **Valor no encontrado**: Si el valor en B5 no coincide exactamente con ningún valor en la columna A, VLOOKUP retorna un error. 2. **Espacios o diferencias de formato**: Asegúrate de que no haya espacios adicionales o diferentes formatos en las celdas. Verifica estos puntos para resolver el problema.
Para obtener datos de Our World in Data, visita su sitio web y selecciona el tema que te interese. Puedes explorar diferentes exploradores de datos, como el de producción de comida. Una vez que encuentres el conjunto de datos deseado, asegúrate de descargarlo en formato CSV, lo cual te permitirá utilizar los datos fácilmente en herramientas como Google Sheets o Excel. Esto te permitirá manipular y analizar los datos de manera efectiva para tus proyectos de visualización.
En la clase se abordó la importancia de seleccionar bases de datos confiables para análisis de datos. Se presentaron dos fuentes destacadas: Our World in Data y el Banco Mundial, que ofrecen datos en formatos descargables como CSV y Excel. Se enfatizó la necesidad de investigar la credibilidad de las fuentes y verificar la actualización y metodología de los datos. Además, se explicó cómo trabajar con Google Sheets para importar, limpiar y estructurar los datos antes de analizarlos, utilizando fórmulas como VLOOKUP y simplificando los años de datos. ### Fuentes de datos Our World in Data: Contiene una amplia diversidad de temas. Permite explorar datos de producción de alimentos a nivel global. Ofrece la opción de descargar datos en formato CSV.World Bank (Banco Mundial): Proporciona datos sobre el Producto Interno Bruto (PIB) de los países. Permite traducir su contenido al español. Ofrece descargas en formatos CSV, XML o Excel. Ambas son reconocidas por su fiabilidad y transparencia en la recopilación de datos. ### Producto Interno Bruto El PIB, o Producto Interno Bruto, es una métrica que mide el tamaño de las economías de los países. Se trata de un indicador económico crucial que refleja el valor total de todos los bienes y servicios producidos en un país durante un período determinado. En la clase, se mencionó que el PIB puede ser descargado de fuentes como el Banco Mundial, donde se pueden obtener datos en formato Excel, lo que facilita su análisis y visualización en herramientas como Google Sheets.
Excel también se pude usar desde el navegador sin instalar nada. Siempre y cuando tengas licencia, obviamente. Para trabajar en equipos también se actualiza en el momento, siempre y cuando el archivo este almacenado en Sharepoint, de esa manera pueden estar viendolo mas de un usuario y actualizando en simultaneo, si lo almacenan en OnDrive no es posible modificarlo en simultaneo al estilo de Google Sheets.
**Tips de esta clase:** **Cuestionate si las fuentes de datos que estas usando son confiables.** Si tus datos no son fiables no impoorta el análisis. World in data y World bank son ampliamente reconocidas. En google sheets: Para extender la formula hacia abajo, consultado con chatgpt: Escribe la fórmula en la primera celda de la columna donde desees extenderla. * Haz clic en esa celda para seleccionarla. * **Mantén presionadas** las teclas:* **Ctrl + Shift + ↓** (Windows / Linux) * **⌘ + Shift + ↓** (Mac) Esto seleccionará desde la celda actual **hasta la última fila con datos** en la hoja (o hasta el final si está todo en blanco). * Finalmente, presiona **Ctrl + D** (Windows / Linux) o **⌘ + D** (Mac) para **copiar** la fórmula hacia todas las filas seleccionadas.
# Selección de bases de datos confiables En esta clase, se profundiza en la importancia de seleccionar fuentes de datos confiables para el análisis y visualización de datos. El objetivo es proporcionar herramientas y criterios para asegurar la calidad de la información que se utilizará en proyectos. ## Conceptos clave - **Fuentes de datos confiables**: Our World in Data y el Banco Mundial. - **Métodos de verificación**: Evaluar la citación de la fuente, su origen y la transparencia de los datos. ## Ideas principales 1. Se presentan dos fuentes de datos confiables: Our World in Data y el Banco Mundial. 2. Descripción de las características de ambas fuentes. 3. Importancia de verificar la confiabilidad de las fuentes de datos. 4. Proceso de descarga de datos en formatos CSV o Excel. 5. Uso de Google Sheets para limpiar y estructurar los datos. ## Ejemplos y casos de estudio - Ejemplo de búsqueda y descarga de datos sobre la producción de aguacates a nivel mundial. - Análisis del PIB a través de datos del Banco Mundial. ## Metodología - Proceso de investigación para evaluar la confiabilidad de fuentes. - Uso de fórmulas como VLOOKUP en Google Sheets para enriquecer los datos. ## Puntos de aprendizaje - La importancia de trabajar con datos confiables. - Cómo limpiar y preparar datos para análisis. ## Recursos adicionales - Our World in Data - Banco Mundial ## Preguntas de comprensión 1. ¿Qué criterios se deben considerar para evaluar la confiabilidad de una fuente de datos? 2. ¿Cuáles son las ventajas de utilizar Google Sheets en lugar de Excel? 3. ¿Cómo se puede enriquecer un conjunto de datos utilizando VLOOKUP? Nota: Resumido por la IA ADA.
Para lo que descargaron la información directamente del BM la formula queda así: =VLOOKUP(B5;'Metadata - Countries'!B:C;2;FALSE)
Cuando pones falso, en googlesheet a mi me pide que ponga un valor como puedo cambiar eso?
Ojo: El profe uso el link de los datos en Ingles para la explicacion.
Hay un truco para crear un sheet nuevo sin necesidad de abrir drive o el panel de sheets directamente. Es solo escribir en el navegador sheets.new y enter. :D tienes un nuevo sheet.
todo estudiante de platzi, debería ver este curso
Se abrevia PIB , la buscamos en el buscador donde podemos ver muchos otros datos. Hay un PIB percapita , pero lo queremos a nivel de país. Estamos en el Dashboard del PIB y muestra cual es el PIB del mundo entero. Deja descargar los datos en CSV, XML o Excel. Se cargan en excel y luego se pasan a Google Sheets y ya se tienen los datos. Google Sheets es una herramienta para manipular datos y dejarlos estructurados Es muy fácil de compartir. Fácil de usar. Se actualiza en tiempo real, no se necesita instalar nada y es gratis Estamos en Google Drive , vamos a crear un Google Sheet para importar los datos del Banco Mundial. Se hace clic en File, Import Upload. Vamos a la carpeta donde tenemos los datos y los importamos a Import Files. Ya listos se puede hacer una pequeña alteracion para agregarle un poco de mas valor. Nos va ayudar a segmentar y a filtrar. Otra cosa que se puede hacer es simplificar. Es importante mantener siempre la version original de los datos por si necesitamos usarlos de nuevo
Fuentes de Datos que utiliza Latinometrics * Our Word in Data: Tiene una cantidad diversa en temas que se pueden abordar con datos. Se puede ir a exploradores de muchos temas como el de Global Food o el de producción de comida a nivel global. Es uno de los más usados. Se puede seleccionar casi cualquier tipo de alimento que se produce en el mundo y ver cuál es la producción a nivel global en cada país. Podemos seleccionar los países que queremos ver y los podemos descargar para verlos como queremos. Se descargan y se debe asegurar que se descarguen los datos con formato CSV y no descargar la imagen * Word Bank o Banco Mundial : Una de las ventajas es que se puede traducir todo su contenido en su plataforma español. Vamos a utilizar una metrica muy comun que se llama el Producto Interno Bruto (PIB). Que mide los tamaños de las economias de los paises
Selección de Bases de Datos Confiables Datos Confiables: Una fuente de información confiable es una fuente que se considera creíble, confiable y precisa para obtener información Cómo saber si una base de datos es confiable? La confiabilidad de los datos se centra en la sistematicidad y repetibilidad de los datos en diferentes observaciones o mediciones. Los datos confiables deben producir los mismos resultados o unos muy similares cada vez que se repite una medición u observación en particular Característica que debe tener una base de datos confiable: • Rapidez al utilizar estructuras ordenadas y bien diseñadas • Menor redundancia • Seguridad y chequeo de errores Fuentes de obtención de datos: Es un lugar donde se recoge la información. Puede ser de una base de, un archivo, un documento XML o cualquier otro formato Dónde y cómo podemos encontrar datos confiables? • Oficinas Nacionales de Estadísticas • Bancos Centrales • Programas de Agencias de Naciones Unidas • Organismos regionales e internacionales
### Fuentes de Datos Confiables por Categoría # Datos Demográficos y Sociales **United Nations Data**: [UN Data](https://data.un.org/) **World Bank Open Data**: [World Bank](https://data.worldbank.org/) **OECD Data**: [OECD Data]() # Datos de Salud * **World Health Organization (WHO) Global Health Observatory**: [WHO GHO](https://www.who.int/data/gho) * **Centers for Disease Control and Prevention (CDC)**: [CDC](https://www.cdc.gov/datastatistics/) # Datos Económicos * **International Monetary Fund (IMF) Data**: [IMF Data]() * **Federal Reserve Economic Data (FRED)**: [FRED]() #### Datos Ambientales y de Energía * **Environmental Protection Agency (EPA)**: [EPA Data](https://www.epa.gov/data) * **International Energy Agency (IEA) Data and Statistics**: [IEA]() #### Datos de Ciencia y Tecnología * **NASA Open Data**: [NASA Data](https://data.nasa.gov/) * **European Space Agency (ESA) Open Data**: [ESA Data]() #### Datos de Investigación Académica * **Google Scholar**: [Google Scholar](https://scholar.google.com/) * **ResearchGate**: [ResearchGate](https://www.researchgate.net/) ###
Se puede en Google sheets es hacer un importante para manipular los datos de la fuente cosa que si cambia no toca volver a copiar
La sabiduría de lo simple. En análisis de datos se suele utilizar el acrónimo KISS (Keep It Simple, Stupid) para hacer nuestras visualizaciones sencillas pero efectivas.
Hola! como andan? Alguien me puede ayudar? Intente hacer la funcion pero me sale error, vlookup no me aparece y si hago con buscar() igual me sale error. :(
vlookup esa formula me es imposible no sale
Gracias por los recursos
Con una gran disposición para aprender, siempre he usado excel para limpieza de datos.