2.1 Conocimientos deseables
Antes de adentrarte en el desarrollo de modelos es util contar con algunos conocimientos previos. No son estrictamente obligatorios, pero facilitan la asimilacion de conceptos y el analisis de resultados.
- Fundamentos de programacion en Python como variables, estructuras de control y funciones. tutorial recomendado
- Nociones basicas de estadistica descriptiva e inferencial para interpretar distribuciones, dispersion y significancia.
- Algebra lineal elemental (vectores, matrices) y familiaridad con operaciones matriciales simples.
- Uso basico de la linea de comandos en tu sistema operativo para ejecutar scripts y administrar paquetes.
2.2 Instalacion de Python
El punto de partida es disponer de una version moderna de Python. Se recomienda trabajar con la rama estable mas reciente (3.13 o superior) para aprovechar las mejoras del lenguaje y la compatibilidad con los paquetes cientificos.
- Descarga el instalador correspondiente a tu sistema operativo desde el sitio oficial.
- En Windows, marca la opcion Add Python to PATH antes de iniciar la instalacion para evitar configuraciones manuales posteriores.
- En macOS y Linux puedes usar los instaladores nativos o un gestor de paquetes como Homebrew o apt.
Verifica que la instalacion sea correcta ejecutando el comando siguiente en una terminal.
python --version
Si tu sistema diferencia entre python y python3, utiliza la segunda opcion. Deberias ver una salida similar a Python 3.13.7.
2.3 Instalacion de las librerias esenciales
Con el interprete listo es momento de instalar el conjunto de librerias base para procesar datos y entrenar modelos.
- scikit-learn: algoritmos y utilidades para aprendizaje supervisado y no supervisado.
- NumPy: soporte para arreglos multidimensionales y operaciones vectorizadas de alto rendimiento.
- Pandas: estructuras de datos tabulares y herramientas para limpieza y transformacion.
- Matplotlib y Seaborn: graficos personalizables para explorar y comunicar resultados.
Instala todo el conjunto con pip.
pip install --upgrade pip
pip install scikit-learn numpy pandas matplotlib seaborn
Tras la instalacion puedes confirmar que los paquetes estan disponibles ejecutando python -m pip show scikit-learn.
2.4 Instalacion de Visual Studio Code
Da soporte al desarrollo instalando Visual Studio Code, un editor ligero con un ecosistema amplio de extensiones para ciencia de datos.
- Descarga el instalador para tu sistema operativo desde el sitio oficial y sigue los pasos guiados.
- Al iniciar VS Code por primera vez, instala la extension Python de Microsoft para habilitar autocompletado, depuracion y ejecucion interactiva.
- Configura la carpeta del proyecto como espacio de trabajo y selecciona el interprete correspondiente a tu entorno virtual desde la paleta de comandos.
Con esta configuracion podras editar notebooks, scripts y ejecutar tareas directamente desde el editor, manteniendo un flujo de trabajo coherente.