Fuente GitHub

Para equipos de producto y soporte técnico: conecta un repo y pregunta al bot cosas como "¿cómo se implementa el rate-limit?" — responde con el fragmento de código, el archivo y la línea exacta.

Cómo se indexa

rag.art ingesta tres niveles de granularidad:

L1 — archivo crudo: el texto del archivo se trocea en chunks de ~500 tokens. Útil para búsqueda textual ("¿dónde está la constante MAX_RETRIES?").
L2 — módulos: se extraen funciones, clases y métodos con sus firmas, docstrings y un resumen generado. Útil para "¿qué hace processWebhook?"
L3 — arquitectura: se genera un mapa del repositorio (carpetas, módulos principales, dependencias entre ellos). Útil para preguntas de alto nivel ("¿cómo se conecta el chat con el almacenamiento?").

Las respuestas del bot incluyen enlaces github.com/<repo>/blob/<sha>/<path>#Lstart-Lend así el equipo abre el código directamente.

Conexión

/bots/<id>/documents → Añadir fuente → GitHub.
Instala la GitHub App de rag.art en tu organización (solo la primera vez).
Elige el repo y la rama (por defecto main).
Opcionalmente añade un .ragartignore al repo con patrones gitignore-compatibles para excluir carpetas (node_modules/, __snapshots__/, etc.).
Guarda. La primera ingesta tarda entre 30 s (repo pequeño) y 10 min (monorepo grande).

Sincronización automática

Una vez conectado, cada push a la rama seleccionada dispara una re-ingesta incremental:

≤50 archivos cambiados: actualiza solo los chunks afectados. Rápido (<15 s).
>50 archivos: full rescan del repo. Más lento pero consistente.

Puedes consultar el historial de syncs en /bots/<id>/documents.

Límites por plan

Plan	Bots con GitHub	Tamaño de repo	Frecuencia de sync
Free	0	—	—
Starter	1	≤1 GB	Diaria
Growth	3	≤5 GB	Tiempo real (webhook)
Pro	10	≤20 GB	Tiempo real (webhook)

Lo que NO se indexa

Imágenes, binarios, archivos >2 MB.
Archivos en .gitignore (siempre) y .ragartignore (opcional).
Carpetas que por nombre parecen no-código: node_modules/, vendor/, dist/, build/, .next/, etc.
Ramas distintas a la configurada.

Privacidad

El código fuente se guarda en la base de datos de rag.art (no se envía a OpenAI excepto los chunks que se pasan como contexto de cada pregunta).
Puedes ejecutar en una instancia self-hosted si tu política lo requiere — contacta para enterprise.
Borrar el bot borra en cascada los documentos y chunks (<15 min, confirmado por webhook).