Fuente GitHub
Para equipos de producto y soporte técnico: conecta un repo y pregunta al bot cosas como "¿cómo se implementa el rate-limit?" — responde con el fragmento de código, el archivo y la línea exacta.
Cómo se indexa
rag.art ingesta tres niveles de granularidad:
- L1 — archivo crudo: el texto del archivo se trocea en chunks de ~500 tokens. Útil para búsqueda textual ("¿dónde está la constante
MAX_RETRIES?"). - L2 — módulos: se extraen funciones, clases y métodos con sus firmas, docstrings y un resumen generado. Útil para "¿qué hace
processWebhook?" - L3 — arquitectura: se genera un mapa del repositorio (carpetas, módulos principales, dependencias entre ellos). Útil para preguntas de alto nivel ("¿cómo se conecta el chat con el almacenamiento?").
Las respuestas del bot incluyen enlaces github.com/<repo>/blob/<sha>/<path>#Lstart-Lend así el equipo abre el código directamente.
Conexión
/bots/<id>/documents→ Añadir fuente → GitHub.- Instala la GitHub App de rag.art en tu organización (solo la primera vez).
- Elige el repo y la rama (por defecto
main). - Opcionalmente añade un
.ragartignoreal repo con patrones gitignore-compatibles para excluir carpetas (node_modules/,__snapshots__/, etc.). - Guarda. La primera ingesta tarda entre 30 s (repo pequeño) y 10 min (monorepo grande).
Sincronización automática
Una vez conectado, cada push a la rama seleccionada dispara una re-ingesta incremental:
- ≤50 archivos cambiados: actualiza solo los chunks afectados. Rápido (<15 s).
- >50 archivos: full rescan del repo. Más lento pero consistente.
Puedes consultar el historial de syncs en /bots/<id>/documents.
Límites por plan
| Plan | Bots con GitHub | Tamaño de repo | Frecuencia de sync |
|---|---|---|---|
| Free | 0 | — | — |
| Starter | 1 | ≤1 GB | Diaria |
| Growth | 3 | ≤5 GB | Tiempo real (webhook) |
| Pro | 10 | ≤20 GB | Tiempo real (webhook) |
Lo que NO se indexa
- Imágenes, binarios, archivos >2 MB.
- Archivos en
.gitignore(siempre) y.ragartignore(opcional). - Carpetas que por nombre parecen no-código:
node_modules/,vendor/,dist/,build/,.next/, etc. - Ramas distintas a la configurada.
Privacidad
- El código fuente se guarda en la base de datos de rag.art (no se envía a OpenAI excepto los chunks que se pasan como contexto de cada pregunta).
- Puedes ejecutar en una instancia self-hosted si tu política lo requiere — contacta para enterprise.
- Borrar el bot borra en cascada los documentos y chunks (<15 min, confirmado por webhook).