Proyecto Final 2025-1: Predictor de Subida o Bajada de Acciones

CS2013 Programación III · Informe Final

Descripción

Implementación de un algoritmo de predicción binaria usando redes neuronales en C++ para determinar si una acción subirá o bajará basándose en datos históricos y análisis técnico.

Contenidos

Datos generales
Requisitos e instalación
Investigación teórica
Diseño e implementación
Ejecución
Análisis del rendimiento
Trabajo en equipo
Conclusiones
Bibliografía
Licencia

Datos generales

Tema: Uso de redes neuronales para predecir el movimiento de acciones en la bolsa.
Grupo: grun
Integrantes:
- Cristhian Jaimes Gamboa - 202120670

Requisitos e instalación

Compilador: GCC con soporte para C++17 o superior
Dependencias:
- CMake 3.18+
- Biblioteca estándar de C++ (STL)

Instalación:

git clone https://github.com/CS1103/proyecto-final-2025-2-grun.git
cd proyecto-final-2025-2-grun
mkdir build && cd build
cmake ..
make

Ejecutables generados:
- model_validator: Validador del modelo de predicción de acciones

1. Investigación teórica

Evolución de las redes neuronales

El desarrollo de las redes neuronales se originó con los primeros estudios dedicados a descifrar el funcionamiento del sistema nervioso. Esta inspiración biológica permitió la creación de sistemas artificiales, conocidos hoy como Redes Neuronales Artificiales (RNA), las cuales han alcanzado un grado de sofisticación que les permite abordar y solucionar eficientemente problemas prácticos y reales. [1]

Optimización Inicial y Computación Evolutiva El campo experimentó un avance significativo en sus etapas iniciales, especialmente desde finales de la década de 1980, con la introducción de la computación evolutiva. Este enfoque permitió la optimización de elementos cruciales de las redes, como sus arquitecturas, los pesos de conexión y las reglas de aprendizaje. La capacidad de utilizar métodos de búsqueda metaheurística facilitó que las RNA superaran las limitaciones de los diseños sencillos y comenzaran a abordar problemas de mayor complejidad. [2], [3]
La Revolución del Deep Learning El hito más transformador fue el auge del Deep Learning. Las Redes Neuronales Profundas (DNNs) lograron un éxito sin precedentes en áreas como el reconocimiento de patrones y el aprendizaje automático, en gran medida impulsadas por el perfeccionamiento de algoritmos de entrenamiento como la retropropagación (backpropagation). Este avance metodológico permitió entrenar eficazmente redes con múltiples capas ocultas, desbloqueando capacidades que definen el panorama de la Inteligencia Artificial moderna. [4]
Automatización del Diseño (Neuroevolución) La tendencia evolutiva más reciente se centra en la Neuroevolución (el uso de algoritmos evolutivos para el diseño de RNA) [5], [6]. Esta metodología ha ganado importancia al proporcionar un mecanismo eficiente para la Búsqueda Automatizada de Arquitecturas Neuronales (NAS) [7], [8]. La neuroevolución ofrece una alternativa poderosa a los métodos tradicionales basados en gradientes, permitiendo la exploración de arquitecturas, hiperparámetros y algoritmos de aprendizaje de manera paralela y a gran escala, lo que impulsa la eficiencia y el diseño de sistemas de Deep Learning de última generación.

Algoritmos de entrenamiento: backpropagation y optimizadores

Backpropagation (Propagación Inversa) - El backpropagation (propagación inversa) es el algoritmo fundamental y núcleo para entrenar redes neuronales. Su objetivo es ajustar los pesos de la red utilizando el método de descenso de gradiente para minimizar el error entre la salida predicha y la salida real. Se utiliza ampliamente en áreas como el reconocimiento de imágenes y el procesamiento del lenguaje natural. [9]
Desafíos y Optimizadores Tradicionales - Los optimizadores tradicionales, como el Descenso de Gradiente Estocástico (SGD), a menudo presentan inconvenientes, incluyendo una convergencia lenta y una alta sensibilidad a la elección de hiperparámetros [10].
Optimizadores Avanzados (Adaptativos e Híbridos) - Para superar estos desafíos y mejorar la eficiencia del entrenamiento, se han desarrollado métodos de optimización avanzados:

Algoritmos Adaptativos: Optimizadores como el Gradiente Conjugado Estocástico Adaptativo (ASCG) mejoran la eficiencia al ajustar dinámicamente las tasas de aprendizaje y las direcciones de búsqueda. Esto conduce a una convergencia más rápida y una mejor capacidad de generalización. [10]
Enfoques Híbridos: Estos combinan el backpropagation con métodos de computación evolutiva o basados en enjambres, como la Optimización por Enjambre de Partículas (PSO) y los Algoritmos Genéticos (GA). Estos híbridos han demostrado una mayor precisión y una convergencia más rápida en comparación con optimizadores estándar como Adam o SGD. [11], [12]

Innovaciones Recientes Las innovaciones recientes buscan mejorar aún más las propiedades de convergencia y la eficiencia, incluso bajo restricciones de recursos. Esto incluye métodos como el descenso de gradiente de orden fraccional y el backpropagation espectral dinámico [13], [14].

2. Diseño e implementación

2.1 Arquitectura de la solución

Patrones de diseño implementados

Strategy Pattern (Patrón Estrategia):
- Optimizadores: La interfaz IOptimizer<T> permite intercambiar algoritmos de optimización (SGD, Adam) sin modificar el código de las capas o la red neuronal.
- Funciones de pérdida: La interfaz ILoss<T, DIMS> permite cambiar entre diferentes funciones de pérdida (MSELoss, BCELoss) de manera transparente.
- Capas de activación: La interfaz ILayer<T> unifica el comportamiento de diferentes capas (Dense, ReLU, Sigmoid, Softmax), permitiendo que la red neuronal las trate de forma polimórfica.
Template Method Pattern (Patrón Método Plantilla):
- La clase NeuralNetwork define el flujo de entrenamiento (train) que siempre sigue los mismos pasos (forward → loss → backward → update), pero delega la implementación específica a las capas individuales.
Composite Pattern (Patrón Compuesto):
- NeuralNetwork actúa como contenedor de capas (ILayer), permitiendo construir arquitecturas complejas mediante composición de capas más simples.

Estructura del proyecto

proyecto-final-2025-2-grun/
├── include/utec/
│   ├── algebra/
│   │   └── tensor.h                    # Implementación de Tensor N-dimensional
│   ├── nn/
│   │   ├── nn_interfaces.h             # Interfaces: ILayer, IOptimizer, ILoss
│   │   ├── nn_dense.h                  # Capa Dense (fully connected)
│   │   ├── nn_activation.h             # Activaciones: ReLU, Sigmoid, Softmax
│   │   ├── nn_loss.h                   # Funciones de pérdida: MSE, BCE
│   │   ├── nn_optimizer.h              # Optimizadores: SGD, Adam
│   │   └── neural_network.h            # Clase principal NeuralNetwork
│   └── apps/
│       ├── data_loader.h               # Carga de datos desde CSV
│       └── stock_predictor.h           # Predictor de acciones
├── src/utec/apps/
│   ├── data_loader.cpp                 # Implementación del cargador de datos
│   ├── stock_predictor.cpp             # Extracción de features técnicas
│   └── model_validator.cpp             # Ejecutable de validación
├── tests/
│   ├── relu/test_[1-4]/                # Tests de función de activación ReLU
│   ├── dense/test_[1-4]/               # Tests de capa Dense
│   └── convergence/test_[1-4]/         # Tests de convergencia (XOR)
├── data/
│   ├── stocks/                         # Datos históricos de acciones (AAPL, GOOGL, JPM, JNJ, MSFT)
│   └── etfs/                           # Datos históricos de ETFs (SPY, VTI, QQQ, GLD, BND)
├── scripts/
│   └── prepare_data_simple.py          # Script de procesamiento de datos
├── build/                              # Directorio de compilación (generado)
├── stock_data_training.csv             # Dataset de entrenamiento (generado)
├── stock_data_test.csv                 # Dataset de prueba (generado)
├── CMakeLists.txt                      # Configuración de CMake
└── docs/
    └── README.md                       # Este documento

Componentes principales

Capa de Álgebra:
- Tensor<T, DIMS>: Contenedor genérico N-dimensional que soporta operaciones matriciales fundamentales.
Capa de Red Neuronal (include/utec/nn/):
- Interfaces: Define contratos para capas, optimizadores y funciones de pérdida.
- Dense Layer: Implementa capa completamente conectada con inicializaciones He y Xavier.
- Activaciones: ReLU, Sigmoid y Softmax con forward y backward pass.
- Funciones de pérdida: MSE (regresión) y BCE (clasificación binaria).
- Optimizadores: SGD básico y Adam con momentos adaptativos.
Capa de Aplicación (include/utec/apps/):
- DataLoader: Parsea archivos CSV con datos de mercado (fecha, apertura, cierre, volumen).
- StockPredictor: Extrae 10 características técnicas (SMA, RSI, volatilidad, momentum) y entrena modelo de clasificación binaria para predecir subida/bajada de acciones.
Scripts de Procesamiento (scripts/):
- prepare_data_simple.py: Script Python independiente (sin dependencias externas) que:
  - Carga datos históricos desde data/stocks/ (5 acciones: AAPL, GOOGL, JPM, JNJ, MSFT)
  - Calcula características técnicas: cambios de precio (1d, 3d, 5d), medias móviles (SMA 5, 10, 20), RSI, volatilidad, momentum, ratio de volumen
  - Genera labels binarios (1=sube, 0=baja) según el precio del día siguiente
  - Normaliza features usando z-score (media=0, desviación estándar=1)
  - Aplica muestreo temporal (cada 5 días) y limita a 500 muestras por acción para reducir el dataset
  - Divide datos en entrenamiento (80%) y prueba (20%)
  - Genera stock_data_training.csv y stock_data_test.csv

Características técnicas extraídas

El predictor calcula las siguientes 10 features por ventana temporal:

price_change_1d, price_change_3d, price_change_5d: Cambios de precio a corto plazo
sma_5, sma_10, sma_20: Medias móviles simples
rsi: Índice de Fuerza Relativa (overbought/oversold)
volume_ratio: Ratio del volumen vs promedio histórico
volatility: Desviación estándar de retornos (10 días)
momentum: Tasa de cambio de precio (10 días)

2.2 Manual de uso y casos de prueba

Cómo ejecutar: ./build/model_validator

Tests Unitarios

El proyecto incluye 12 tests unitarios organizados en 3 categorías que validan el correcto funcionamiento de los componentes de la red neuronal:

Compilación de la infraestructura base:

make -C tests catch-essential

Ejecución de tests individuales:

# Ejemplo: ejecutar test de ReLU #1
cd tests/relu/test_1 && ./run_test

# Ejemplo: ejecutar test de Dense #2
cd tests/dense/test_2 && ./run_test

# Ejemplo: ejecutar test de Convergence #1
cd tests/convergence/test_1 && ./run_test

Descripción de tests:

Categoría	Test	Nombre	Descripción
ReLU	1	ReLU Forward-Backward Simple	Valida forward pass con valores mixtos (-1,2,0,-3) y backward con gradientes
ReLU	2	ReLU Diagonal Pattern	Matriz 5x4 con patrón diagonal, verifica ceros en negativos
ReLU	3	Sigmoid Forward-Backward	Compara función Sigmoid con valores extremos (±100)
ReLU	4	ReLU Gradient Validation	Verifica gradientes en backward pass (1 si x>0, 0 si x≤0)
Dense	1	Dense Forward Identity Init	Forward con inicialización identidad, verifica Y=X
Dense	2	Dense Backward Iota	Backward con datos secuenciales usando std::iota
Dense	3	Dense He Initialization	Inicialización He con seed=42, verifica forward/backward
Dense	4	Dense Xavier Initialization	Inicialización Xavier con seed=4, verifica forward/backward
Convergence	1	XOR MSELoss ReLU	Red 2→4→1 con ReLU, MSELoss, 3000 epochs, lr=0.08, seed=42
Convergence	2	XOR BCELoss Sigmoid	Red 2→4→1 con Sigmoid, BCELoss, 4000 epochs, lr=0.08, seed=4
Convergence	3	XOR MSELoss ReLU Low LR	Red 2→4→1 con ReLU, MSELoss, 4000 epochs, lr=0.02, seed=20
Convergence	4	XOR BCELoss Sigmoid Alt Order	Red 2→4→1 con Sigmoid, BCELoss, 4000 epochs, lr=0.08, seed=4

Criterios de éxito:

Tests de ReLU/Dense: Verifican dimensiones correctas y valores numéricos con tolerancia epsilon(1e-12)
Tests de Convergence: Verifican que la red aprenda XOR correctamente (predicciones ≥0.6 para 1, <0.5 para 0)

3. Ejecución

Demo de ejemplo: Video/demo alojado en docs/demo.mp4. Pasos:

Preparar datos de entrenamiento (formato CSV).

Ejecutar comando de entrenamiento.

Evaluar resultados con script de validación.

4. Análisis del rendimiento

4.1 Configuración del modelo

Arquitectura de la red neuronal:

Capas: 10 → 64 → 32 → 16 → 1
- Entrada: 10 features técnicas (price_change, SMA, RSI, volatilidad, momentum, volume_ratio)
- Capa oculta 1: 64 neuronas + activación Sigmoid
- Capa oculta 2: 32 neuronas + activación Sigmoid
- Capa oculta 3: 16 neuronas + activación Sigmoid
- Salida: 1 neurona (clasificación binaria) + activación Sigmoid

Hiperparámetros de entrenamiento:

Épocas: 200
Batch size: 32 (todo el dataset procesado en cada época)
Learning rate: 0.001
Optimizador: Adam (β₁=0.9, β₂=0.999, ε=1e-8)
Función de pérdida: Binary Cross-Entropy (BCE)

Dataset:

Total de acciones: 5 (AAPL, GOOGL, JPM, JNJ, MSFT)
Muestreo temporal: Cada 5 días (reducción de dataset)
Máximo por acción: 500 muestras más recientes
División: 80% entrenamiento, 20% prueba
Normalización: Z-score (μ=0, σ=1) por feature

4.2 Métricas de rendimiento

El validador (model_validator) calcula automáticamente las siguientes métricas:

Métricas principales:

Accuracy (Exactitud): Porcentaje de predicciones correctas
- Formula: (TP + TN) / (TP + TN + FP + FN)
- Umbral de predicción: ≥ 0.5 → sube (1), < 0.5 → baja (0)
Precision (Precisión): De las predicciones de "subida", cuántas fueron correctas
- Formula: TP / (TP + FP)
- Indica confiabilidad en predicciones positivas
Recall (Sensibilidad): De las subidas reales, cuántas fueron detectadas
- Formula: TP / (TP + FN)
- Indica capacidad de detectar todas las subidas
F1-Score: Media armónica de precision y recall
- Formula: 2 × (Precision × Recall) / (Precision + Recall)
- Métrica balanceada para clasificación

Matriz de confusión:

                Predicho
                0       1
Real    0      TN      FP
        1      FN      TP

4.3 Análisis de resultados

Criterios de evaluación automática:

Accuracy > 70%: ✓ Excelente rendimiento del modelo
60% < Accuracy ≤ 70%: ⚠ Rendimiento aceptable, considerar más entrenamiento
50% < Accuracy ≤ 60%: ⚠ Rendimiento bajo, revisar hiperparámetros
Accuracy ≤ 50%: ✗ Rendimiento muy bajo, modelo necesita ajustes

Análisis de balance:

|Precision - Recall| < 0.1: ✓ Modelo balanceado
Precision > Recall: ⚠ Modelo conservador (alta precisión, bajo recall)
Recall > Precision: ⚠ Modelo agresivo (alto recall, baja precisión)

4.4 Ventajas de la implementación

✅ Código puro C++:

Sin dependencias externas (no requiere TensorFlow, PyTorch, NumPy)
Solo STL y CMake, fácil de compilar y portar
Implementación educativa clara de backpropagation desde cero

✅ Arquitectura extensible:

Patrones de diseño (Strategy, Template Method, Composite)
Fácil agregar nuevas capas, optimizadores o funciones de pérdida
Interfaces bien definidas (ILayer, IOptimizer, ILoss)

✅ Validación completa:

12 tests unitarios (ReLU, Dense, Convergence)
Validador automático con métricas detalladas
Pipeline completo: datos → preprocesamiento → entrenamiento → evaluación

✅ Features financieras relevantes:

10 indicadores técnicos estándar (SMA, RSI, volatilidad)
Normalización estadística (z-score)
Estrategia de muestreo para reducir dataset

4.5 Limitaciones y desafíos

❌ Rendimiento computacional:

Multiplicación matricial naive (O(n³)) sin optimizaciones
Sin uso de BLAS/LAPACK para operaciones de álgebra lineal
Sin paralelización (CPU single-threaded)
Entrenamiento lento en datasets grandes (>10K muestras)

❌ Memoria:

Tensores almacenan todos los datos en memoria contigua
Sin lazy evaluation ni gradient checkpointing
Copia completa de tensores en forward/backward pass

❌ Optimización limitada:

Solo Adam y SGD implementados
No soporta learning rate scheduling
Batch processing simplificado (no mini-batches paralelos)

❌ Características del mercado:

Datos históricos limitados (5 acciones, hasta 2020)
No considera factores externos (noticias, sentimiento, macro)
Predicción binaria simple (sube/baja) sin magnitud
No maneja gaps de mercado ni eventos especiales

4.6 Mejoras futuras propuestas

Aumentar el número de datos para el entrenamiento, que se tuvieron que recortar para que el tiempo de ejecución del programa no fuera excesivo.
Paralelizar muchos de los procesos.
Probar distintos hiperparámetros.

5. Trabajo en equipo

Tarea	Miembro	Rol
Todo	Cristhian J.	Todo

6. Conclusiones

Logros: Implementar NN desde cero, validar en dataset de ejemplo.
Evaluación: Calidad y rendimiento adecuados para propósito académico.
Aprendizajes: Profundización en backpropagation y optimización.
Recomendaciones: Escalar a datasets más grandes y optimizar memoria.

7. Bibliografía

[1] A. Prieto, B. Prieto, E. Ortigosa, E. Ros, F. Pelayo, J. Ortega, and I. Rojas, "Neural networks: An overview of early research, current frameworks and new challenges," Neurocomputing, vol. 214, pp. 242–268, 2016. DOI: 10.1016/j.neucom.2016.06.014.
[2] H. Ünal and F. Başçiftçi, "Evolutionary design of neural network architectures: a review of three decades of research," Artificial Intelligence Review, vol. 55, pp. 1723–1802, 2021. DOI: 10.1007/s10462-021-10049-5.
[3] X. Yao, "Evolutionary Artificial Neural Networks," International Journal of Neural Systems, vol. 4, no. 3, pp. 203–222, 1993. DOI: 10.1142/s0129065793000171.
[4] J. Schmidhuber, "Deep learning in neural networks: An overview," Neural Netw.: Off. J. Int. Neural Netw. Soc., vol. 61, pp. 85–117, 2014. DOI: 10.1016/j.neunet.2014.09.003.
[5] A. Baldominos, Y. Sáez, and P. Isasi, "On the automated, evolutionary design of neural networks: past, present, and future," Neural Comput. Appl., vol. 32, pp. 519–545, 2019. DOI: 10.1007/s00521-019-04160-6.
[6] K. Stanley, J. Clune, J. Lehman, and R. Miikkulainen, "Designing neural networks through neuroevolution," Nat. Mach. Intell., vol. 1, pp. 24–35, 2019. DOI: 10.1038/s42256-018-0006-z.
[7] Y. Ma and Y. Xie, "Evolutionary neural networks for deep learning: a review," Int. J. Mach. Learn. Cybern., vol. 13, pp. 3001–3018, 2022. DOI: 10.1007/s13042-022-01578-8.
[8] X. Zhou, A. Qin, M. Gong, and K. Tan, "A Survey on Evolutionary Construction of Deep Neural Networks," IEEE Trans. Evol. Comput., vol. 25, pp. 894–912, 2021. DOI: 10.1109/tevc.2021.3079985.
[9] M. Li, "Comprehensive Review of Backpropagation Neural Networks," Acad. J. Sci. Technol., 2024. DOI: 10.54097/51y16r47.
[10] I. Hashem, F. Alaba, M. Jumare, A. Ibrahim, and A. Abulfaraj, "Adaptive Stochastic Conjugate Gradient Optimization for Backpropagation Neural Networks," IEEE Access, vol. 12, pp. 33757–33768, 2024. DOI: 10.1109/access.2024.3370859.
[11] S. Essang, S. Okeke, J. Effiong, R. Francis, S. Fadugba, A. Otobi, J. Auta, C. Chukwuka, M. Ogar-Abang, and A. Moses, "Adaptive hybrid optimization for backpropagation neural networks in image classification," in Proc. Nigerian Soc. Phys. Sci., 2025. DOI: 10.61298/pnspsc.2025.2.150.
[12] A. Hazrati, S. Kariuki, and R. Silva, "Comparative Analysis of Backpropagation and Genetic Algorithms in Neural Network Training," Int. J. Health Technol. Innov., 2024. DOI: 10.60142/ijhti.v3i03.04.
[13] C. Bao, Y. Pu, and Y. Zhang, "Fractional-Order Deep Backpropagation Neural Network," Comput. Intell. Neurosci., 2018. DOI: 10.1155/2018/7361628.
[14] M. Muthuraman, "Dynamic Spectral Backpropagation for Efficient Neural Network Training," arXiv:2505.23369, 2025. [Online]. Available: https://arxiv.org/abs/2505.23369

Licencia

Este proyecto usa la licencia MIT. Ver LICENSE para detalles.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Proyecto Final 2025-1: Predictor de Subida o Bajada de Acciones

CS2013 Programación III · Informe Final

Descripción

Contenidos

Datos generales

Requisitos e instalación

1. Investigación teórica

2. Diseño e implementación

2.1 Arquitectura de la solución

Patrones de diseño implementados

Estructura del proyecto

Componentes principales

Características técnicas extraídas

2.2 Manual de uso y casos de prueba

Tests Unitarios

3. Ejecución

4. Análisis del rendimiento

4.1 Configuración del modelo

4.2 Métricas de rendimiento

4.3 Análisis de resultados

4.4 Ventajas de la implementación

4.5 Limitaciones y desafíos

4.6 Mejoras futuras propuestas

5. Trabajo en equipo

6. Conclusiones

7. Bibliografía

Licencia

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
data		data
docs		docs
include/utec		include/utec
scripts		scripts
src/utec/apps		src/utec/apps
tests		tests
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
stock_data_test.csv		stock_data_test.csv
stock_data_training.csv		stock_data_training.csv

CS1103/proyecto-final-2025-2-grun

Folders and files

Latest commit

History

Repository files navigation

Proyecto Final 2025-1: Predictor de Subida o Bajada de Acciones

CS2013 Programación III · Informe Final

Descripción

Contenidos

Datos generales

Requisitos e instalación

1. Investigación teórica

2. Diseño e implementación

2.1 Arquitectura de la solución

Patrones de diseño implementados

Estructura del proyecto

Componentes principales

Características técnicas extraídas

2.2 Manual de uso y casos de prueba

Tests Unitarios

3. Ejecución

4. Análisis del rendimiento

4.1 Configuración del modelo

4.2 Métricas de rendimiento

4.3 Análisis de resultados

4.4 Ventajas de la implementación

4.5 Limitaciones y desafíos

4.6 Mejoras futuras propuestas

5. Trabajo en equipo

6. Conclusiones

7. Bibliografía

Licencia

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages