Tema 04 - Análisis Exploratorio de Datos
Ejercicio Práctico 1
Contexto del Ejercicio
Una firma de capital riesgo está evaluando startups fintech europeas para identificar oportunidades de inversión. Los datos contienen información financiera, operativa y de riesgo de 350 startups fundadas entre 2014-2023.
Los datos están disponibles en el archivo startups_fintech.csv; una descripción detallada de las variables en diccionario_startups.csv
IMPORTANTE:
Muestra tu análisis manual (aunque uses herramientas automatizadas como punto de partida), justificando tus decisiones.
No basta con mostrar gráficos o tablas, explica qué significan y por qué son relevantes.
Pregunta 1. Cargar, Explorar y Limpiar los Datos
Apartado 1.a.
- Identifica problemas de calidad.
Apartado 1.b.
- Identifica qué variables tienen tipos incorrectos y corrígelos. Justifica por qué necesitan ser convertidas
Apartado 1.c.
Detecta y elimina filas duplicadas.
Detecta y elimina variables redundantes.
Apartado 1.d.
- ¿Qué variables tienen valores ausentes y cuántos en cada variable?
Pregunta 2: Análisis Exploratorio de Datos
Apartado 2.a. Distribución de las variables principales
Muestra tablas y/o gráficos de las variables que consideres más relevantes.
- Pista: en otras, presta atención a
subsector,etapa,pais,financiacion_total,valoracion,ltv_cac_ratio,rating_riesgo,tasa_retencion, probabilidad de éxito yempleados.
- Pista: en otras, presta atención a
Comenta brevemente las características principales de las variables que se derivan de dichas tablas y/o gráficos.
Entre otras cosas,
¿Detectas inconsistencias en las categorías de alguna variable? En caso afirmativo, ¿cómo las corriges?
¿Consideras que se pueden agrupar ciertas categorías para mejorar la interpretación?
¿Algunas variables tienen distribuciones sesgadas o asimétricas?
¿Algunas variables tienen valores extremos o “atípicos”?
Discute la información útil que se puede extraer de las variables analizadas a través de sus distribuciones o principales estadísticos.
Apartado 2.b. Relación entre variables
Estudia las relaciones que consideres más relevantes usando estadísticos y visualizaciones.
Discute brevemente cómo es la relación.
- Por ejemplo, si es lineal o no, fuerte o débil, positiva o negativa, etc.
Entre otras, tu análisis debería abordar las siguientes cuestiones:
Financiación por subsector.
Relación financiación-valoración.
¿Qué características están relacionadas con el riesgo de las startups?
Relación entre
tasa_retenciony probabilidad de éxito.Comparar indicadores clave (financiación, valoración, probabilidad de éxito) entre los principales países.
Patrones de madurez: ¿cómo cambian (o no) las características de las startups con la
etapa?
Pregunta 3
Apartado 3.a
- Comenta brevemente los 5 principales hallazgos (según tu opinión) de tu análisis
Apartado 3.b
Basándote en tu análisis, ¿qué recomendarías a la firma de capital riesgo?
- Dónde buscar oportunidades
- Qué evitar
- Señales de alerta
- Métricas críticas
Entrega del ejercicio
Rellenad este FORMULARIO con vuestros datos y subid
vuestro archivo de .qmd
el resultado de renderizarlo: bien un archivo autocontenido .html (o .pdf o .docx) o bien un archivo .html y el directorio relacionado con el mismo nombre; en ambos casos, se recomienda comprimir todo para enviarlo.
IMPORTANTE: el nombre de los ficheros que subáis DEBE seguir el siguiente formato que incluye vuestro número de DNI: ej.,
Tema04ej1_123456789.qmd
Tema04ej1_123456789.html
Tema04ej1_123456789.zip