7 conjuntos de datos públicos que puedes analizar gratis ahora mismo
Oye, los datos están en todas partes. Probablemente ya lo sabías, ya que es un poco difícil pasarlo por alto cuando está constantemente en las noticias, es un campo profesional en crecimiento y las habilidades de datos son cada vez más valiosas en todos los mercados de trabajo. Sin embargo, los datos no son sólo para las grandes empresas y no tienes que recopilar tus propios datos para analizarlos. Si quieres aprender a analizar datos, crear visualizaciones de datos o simplemente mejorar tus conocimientos de datos, los conjuntos de datos públicos son el lugar perfecto para empezar. Aquí hay algunos grandes conjuntos de datos públicos que puedes analizar de forma gratuita ahora mismo. Si necesitas ayuda para plasmar tus hallazgos, también tenemos escritos sobre blogs de visualización de datos que puedes seguir y los mejores ejemplos de visualización de datos para inspirarte.
Google Trends
Curados por: Google
Ejemplo de conjunto de datos: «Cupcake» resultados de búsqueda
Este es uno de los conjuntos de datos públicos más amplios e interesantes para analizar. El vasto motor de búsqueda de Google rastrea los datos de los términos de búsqueda para mostrarnos qué busca la gente y cuándo. Puedes explorar las estadísticas sobre el volumen de búsqueda para casi cualquier término de búsqueda desde 2004. Introduce cualquier término de búsqueda, o un puñado de términos de búsqueda, y haz clic en el botón de descarga para analizar los datos fuera del sitio web de Tendencias.
Hay una gran variedad de filtros para acotar las tendencias según la ubicación (en todo el mundo o por país), varios rangos de tiempo, categorías o incluso tipos de búsqueda específicos (resultados de búsqueda en la web frente a imágenes frente a YouTube). En la página de inicio de Tendencias puedes ver fácilmente qué temas son populares en este momento y qué es lo que está de moda. Google también destaca varios ejemplos interesantes de tendencias con datos visuales en esa página de inicio.
Si estás interesado en más datos de Google, echa un vistazo a Google Finance, Google Public Data y Google Scholar.
Centro Nacional de Datos Climáticos
Curados por: National Centers for Environmental Information (antes NOAA)
Ejemplo de conjunto de datos: Datos Climatológicos Locales (LCD)
Si la ciencia del tiempo y del clima es lo tuyo, no puedes conseguir mucho más detalle que el Centro Nacional de Datos Climáticos. Han hecho un pequeño cambio de marca, fusionando los centros de datos de la Administración Nacional Oceánica y Atmosférica (NOAA) para convertirse en los Centros Nacionales de Información Medioambiental (NCEI).
Aquí puedes encontrar un archivo de conjuntos de datos climáticos y meteorológicos de todo Estados Unidos, el mayor archivo de datos medioambientales del mundo. Es un enorme recurso para todo tipo de datos meteorológicos, incluyendo datos meteorológicos, oceánicos, climáticos, atmosféricos y geofísicos.
Datos del Observatorio Mundial de la Salud
Curados por: Organización Mundial de la Salud (OMS)
Ejemplo de conjunto de datos: Acceso universal a la salud reproductiva
Como parte de su objetivo principal de mejorar la información sanitaria en todo el mundo, la Organización Mundial de la Salud pone a disposición del público sus datos sobre la salud mundial a través del Observatorio Mundial de la Salud (OMS). El GHO actúa como un portal con el que se puede acceder y analizar situaciones sanitarias y temas importantes.
Los distintos conjuntos de datos están organizados por temas, como la mortalidad, los sistemas sanitarios, las enfermedades transmisibles y no transmisibles, los medicamentos y las vacunas, los riesgos sanitarios, etc. Las estadísticas sanitarias de la OMS son la fuente principal de información sanitaria mundial y también se utilizan en la labor de los Centros de Control y Prevención de Enfermedades de los Estados Unidos.
Data.gov.sg
Curados por: Gobierno de Singapur
Ejemplo de conjunto de datos: Residentes de Singapur por grupo de edad, grupo étnico y género, finales de junio, anual (2017)
En realidad, hay un montón de grandes sitios web de datos gubernamentales en Internet. La mayoría de ellos son increíbles riquezas de datos e información. Estados Unidos tiene uno de los más conocidos en data.gov, y el Reino Unido y Australia también tienen grandes sitios correspondientes. Con todos ellos, y con grandes muestras de población, tenemos muchos datos a los que acceder. Entonces, ¿por qué Singapur?
Francamente, el sitio web de datos del gobierno de Singapur es simplemente muy accesible visualmente. La página de inicio está llena de pequeñas visualizaciones que cuentan historias sobre cada conjunto de datos. Parte de la visualización de datos consiste en asegurarse de que no sólo se muestre la información en un formato preciso y relevante, sino que también resulte atractiva para captar el interés. La mayoría de los sitios de datos gubernamentales son utilitarios y sencillos, lo suficiente para transmitir los datos de forma fácil de entender. Singapur, sin embargo, lo anima con coloridas visualizaciones, salpicaduras de color en los gráficos y una sección de «Conjuntos de datos similares» en la parte inferior de cada conjunto de datos para animar a los lectores a explorar.
Earthdata
Curados por: NASA
Ejemplo de conjunto de datos: Electricidad atmosférica (rayos)
Earthdata forma parte del Programa de Sistemas de Datos de Ciencias de la Tierra de la NASA, concretamente del Sistema de Datos e Información del Sistema de Observación de la Tierra (EOSDIS). EOSDIS actúa como medio para procesar y distribuir los datos de las ciencias de la Tierra procedentes de los satélites de observación de la Tierra, las aeronaves y las mediciones de campo.
A través de Earthdata, el público puede acceder a los datos, las noticias y la información de eventos de la NASA. Abarca datos de la atmósfera terrestre, la radiación solar, la criosfera (zonas árticas/congeladas), el océano, la superficie terrestre (gravedad, geomagnetismo, tectónica) y los entornos humanos.
Registro de datos abiertos de Amazon Web Services
Curados por: Amazon
Ejemplo de conjunto de datos: 1000 Genomes Project
A medida que más organizaciones ponen sus datos a disposición del público, Amazon ha creado un registro para encontrar y compartir esos diversos conjuntos de datos. Hay más de 50 conjuntos de datos públicos admitidos a través del registro de Amazon, que van desde las declaraciones de Hacienda hasta las imágenes por satélite de la NASA, pasando por la secuenciación del ADN o el rastreo de la web. Los conjuntos de datos también incluyen ejemplos de uso, mostrando lo que otras organizaciones y grupos han hecho con los datos.
Pew Internet
Curados por: Pew Research Center
Ejemplo de conjunto de datos: Teens, Social Media & Tecnología 2018
La misión del Pew Research Center es recopilar y analizar datos de todo el mundo. Cubren todo tipo de temas como la política, las redes sociales, el periodismo, la economía, la privacidad online, la religión y las tendencias demográficas. Aunque realizan su propia investigación y análisis, no partidista y no partidista, también ofrecen sus datos brutos para el acceso público. El acceso simplemente requiere un breve registro en el sitio y acreditar al Pew Research Center como la fuente de los datos, con una renuncia a que Pew no es responsable de las conclusiones de los datos alternativos.
En cierto modo, hacer que los datos sean accesibles es también otro proyecto de investigación para Pew. Ya tienen toda la información sobre cómo utilizan los datos en sus investigaciones y están interesados en saber cómo otros utilizan también sus datos. Tienen una petición: ponerse en contacto con ellos por correo electrónico si se publica algo como resultado de los datos adquiridos.