Oracle Sentinel predice el movimiento de BTC cada 5 minutos. Cada predicción queda archivada con su contexto completo; cuando resuelve, el sistema observa si acertó y bajo qué condiciones. La próxima predicción ya sabe dónde fallar menos.
Cada predicción queda firmada en JSONL append-only. Nada es retrospectivo.
Polymarket cotiza probabilidades. Quien calibra mejor que el market-maker, gana. Oracle Sentinel es un sistema con memoria, autoaprendizaje y ejecución on-chain automática.
En BTC-5min, los MMs cotizan con baja información microestructural. Nuestro sistema integra 15 señales (precio, book, funding, whales) cada 5 minutos.
Cada predicción se compara contra el outcome real. La historia condicional (régimen, hora, señales observadas) modula la probabilidad de la próxima. La lógica es auditable caso por caso.
Cada predicción archivada con timestamp. Cada bet on-chain. Confusion matrix en endpoint público. Auditable por terceros en caliente.
Cada predicción se archiva con su contexto: régimen de mercado, hora, volatilidad, señales secundarias. Cuando se resuelve, el sistema registra si acertó o falló. Esa historia es la que decide el output de la próxima predicción.
Cada ventana de 5 min queda archivada con su contexto completo (régimen, hora, volatilidad, señales secundarias) y su outcome real. 847 lecciones acumuladas hasta hoy.
El sistema busca condiciones donde su accuracy baja sistemáticamente: régimen volátil, horarios específicos, confianza engañosamente alta. Los marca.
Antes de emitir la siguiente probabilidad, el predictor consulta su historial en condiciones similares. Si ahí falla, ajusta confianza a la baja. Si ahí acierta, la sube.
El sistema cuenta el outcome real en cada combinación de señales observadas. Esta tabla es la memoria del predictor — y lo que le permite autocorregirse.
A medida que cada celda acumula observaciones (umbral n≥20), su probabilidad converge a la frecuencia real del mercado en esa condición específica. No necesitamos fórmulas — la evidencia es la fórmula.
"Para esta ventana, el predictor miró 58 ventanas históricas en condiciones similares y observó que 27 fueron UP. Por eso reporta 47%." Ese razonamiento es visible en cada predicción.
A medida que la historia crece, la autocorrección gana dimensionalidad. Más patrones observables = predicciones más específicas al contexto.
Antes de cada predicción, el modelo recibe su propia memoria condicional — dónde falla, dónde acierta. Los números debajo son el contenido exacto que se inyectó en el último prompt. Endpoint público: /api/os/self-learning.
La intersección más interesante: cómo cambia la accuracy según el régimen de precio y si la señal de microestructura está de acuerdo. Verde = acertás más que el promedio; rojo = menos. Gris = n<20 (aún aprendiendo ese bucket).
Cada barra es un bucket. La línea vertical punteada marca la accuracy base global. A la izquierda, peor; a la derecha, mejor. El largo de la barra incluye el número de observaciones (n).
El reliability diagram compara la probabilidad reportada (eje X) con la frecuencia real observada (eje Y). La diagonal es perfección. Estar cerca de la diagonal significa que el sistema no está sobre-ni sub-confiado.
Los dos buckets más poblados (n=460 en 45%, n=294 en 55%) caen casi exactamente sobre la diagonal. Eso es calibración real: cuando el oráculo dice 55%, sale 58%. Cuando dice 45%, sale 50%.
★ donde vive el 89% de las predicciones. Es la zona que más importa — y donde el sistema está calibrado.
251 bets ejecutados desde Fase 0 (sin autoaprendizaje). El pico y el drawdown son el por qué existe el sistema de autocorrección que estás leyendo. Todo archivado, todo on-chain, todo auditable.
El pico de +$608 con 59.6% accuracy demuestra que el sistema puede ganar dinero en mercados reales. El edge no es teórico.
El drawdown vino de apostar fuerte en ventanas de alta confianza que estadísticamente eran trampas. Sin autoaprendizaje, el sistema no sabía que esas condiciones eran peligrosas.
La autocorrección que leíste arriba es la respuesta directa a este drawdown. Con memoria condicional, esas ventanas-trampa ya están catalogadas — la próxima vez la confianza baja automáticamente.
Cómo gana dinero un sistema con 59.6% de accuracy. Cada bet pasa por 3 filtros económicos: edge mínimo, Kelly cap, y costos. Si no supera los 3, no hay trade.
Asume 3% fees + edge medio de 2%. Varía por bet según edge específico.
¼ Kelly para reducir volatilidad a costa de ~6% de growth óptimo. Sharpe mejor que Kelly completo.
Bet rate conservador. Escalable linealmente con capital (respetando caps de book depth).
| Edge mínimo | ≥ 2% |
| Kelly cap | ¼ · f* Kelly |
| Max per-bet exposure | 3% del capital |
| Max concurrent bets | 12 mercados |
| Dampener en desacuerdo fuerte | × 0.5 |
| Floor per bet | $1 |
| Capital | Bets/día | EV/mes | Sharpe est. |
|---|---|---|---|
| $1k | ~14 | ~$25 | 1.4 |
| $10k | ~14 | ~$245 | 1.6 |
| $100k | ~14 | ~$2,400 | 1.6 |
| $1M | ~10 | ~$18k | 1.3 |
A $1M+ aparecen caps de book depth → bet rate cae. Edge absoluto escala, % sobre capital baja marginalmente.
Módulos en producción, auditables. Los presento como personas — porque eso es lo que hacen dentro del sistema.
"Miro 7 dimensiones del mercado y digo UP o DOWN con confianza calibrada."
Claude Haiku. Consume price-action, book, funding, whales, sentiment, regime. Output: dirección + confianza 0-1.
"Si Haiku duda — confianza ambigua — leo más profundo y decido."
Claude Sonnet. Solo interviene en casos de baja confianza. Más caro, más preciso, selectivo.
"No leo narrativas. Leo el book, el spread, el funding. Datos puros."
Logística sobre 15 features. Temporal holdout 20%, L2=0.05, retrain horario. OOS AUC 0.60.
"Tu probabilidad de 70% — ¿realmente es 70%? Yo te confirmo contra la realidad."
Ajusta la probabilidad reportada contra la frecuencia realizada por bucket. Evita overconfidence.
"Edge neto: probabilidad × payoff − costo. Si no supera el threshold, no hay bet."
Filtra cada señal por edge mínimo (2%). Aplica Kelly fraccionado. Respeta caps de exposición.
"No apostamos si el spread es una joda o el book está cruzado."
Chequea liquidez YES/NO, spread razonable, profundidad del book. Veto silencioso si falla.
"Cuando una ventana resuelve, cobro los tokens ganadores on-chain. Automático."
Gnosis Safe v1.3.0 + EIP-712. Llama CTF.redeemPositions() en Polygon. Sin intervención humana.
"Polymarket dice que ganaste. Confirmo contra Binance antes de cantar victoria."
Fallback independiente para resolver el outcome real. Protege contra dispute markets.
"Pediste $10. Te llenaron $7.82. Hago que el archivo diga la verdad: $7.82."
Parsea makingAmount/takingAmount del CLOB. Sobreescribe size_usd con fill real, preserva intent.
"No operás igual en mercado lateral que en vuelo parabólico. Yo clasifico."
Clasifica 4 regímenes (ranging, trending up/down, volatile). Modula confidence y sizing.
"Si AI y scalper se contradicen fuerte, reduzco tamaño a la mitad."
Al detectar desacuerdo >0.15 en probabilidad, multiplica el size por 0.5 (floor $1).
"Gas en el Safe, APIs, freshness del book. Si algo respira mal, bloqueo operaciones."
Healthcheck continuo. Cuando MATIC bajo, RPC cae, o feed se estanca, entra en DISARMED.
| Qué | Dónde vive | Por qué importa al inversor |
|---|---|---|
| Archivo de predicciones | data/btc_5m_predictions_archive.jsonl | Append-only. Cada predicción con timestamp, features, outcome. No hay forma de retrocambiar números. |
| Tabla de celdas (posterior) | /api/os/scalper-status | Confusion matrix, Wilson CI, y posterior por celda accesibles en endpoint público. |
| Bets on-chain | Polymarket CLOB · Polygon | Cada entrada y salida verificable en Polygonscan. Hash de transacción por bet. |
| Redemption | Gnosis Safe · EIP-712 | Cobro de tokens ganadores automático y verificable on-chain. |
| Modelo scalper | src/brain/scalper.py · retrain 1h | Temporal holdout 20%. AUC out-of-sample es la única métrica honesta de generalización. |
El sistema ya vive en producción con capital real ($20 simbólico). El edge conjunto (86% al menos uno acierta, 59.6% AI standalone, 63.8% scalper cuando AI falla) justifica escalar con disciplina Kelly.
$5-25k para validar edge a escala. PnL Kelly-ajustado instrumentado. 30 días.
$50-250k cuando fase 1 muestra Sharpe > 1.5 y consistencia semana a semana. Multi-mercado.
Cerebro como servicio: señales calibradas + ejecución para terceros. Licensing + perf fee.
Un partner con visión de infra cripto que quiera entrar temprano en un sistema con track record verificable. El producto existe, el edge es medible, y la arquitectura soporta escalar.