Por que IA local
As motivações para rodar recuperação e inferência na sua própria máquina.
Serviços de chat hospedados são ótimos, até o contexto ser privado. Anotações pessoais, um repositório privado, uma spec não publicada — são coisas que você não colaria em um chatbot público, e são exatamente para isso que o LocalLens foi feito.
Ele otimiza para quatro coisas.
1. Arquivos nunca saem da máquina
O QVAC carrega os modelos de chat e embedding localmente e roda eles no seu processo. Descoberta, chunking, embedding, recuperação, prompt, completion — cada passo acontece no seu hardware. Nada é enviado.
2. Respostas permanecem embasadas
O construtor de prompt em src/rag.ts
manda o modelo responder somente a partir dos chunks recuperados. Se a
resposta não estiver neles, o modelo fala isso. Citações entre colchetes como
[1] e [2] apontam de volta para o chunk exato de onde a afirmação veio.
Essa é uma escolha técnica. Prompts embasados cortam o modo de falha "confiantemente errado" que atinge assistentes gerais sempre que você aponta eles para conteúdo especializado.
3. Cloud-opcional
Tira a tomada de rede e o LocalLens continua funcionando. CLI e UI do navegador rodam offline. O único tráfego de rede é o download inicial do modelo, e o QVAC faz cache disso em disco.
Se depois você quiser compartilhar um brain com um colega, dá — mas é uma escolha que você faz no código, não um default que entrega seus dados por baixo dos panos.
4. Pequeno o suficiente para ler
Oito arquivos TypeScript em src/. Você lê a base de código inteira em
uma tarde e estende sem aprender um framework novo. Sem sistema de plugins,
sem interface de repositório abstrata, sem container de DI — nenhum desses
é um gargalo real nesse tamanho.
Onde isso para de ser suficiente
O LocalLens não é um sistema de gestão de documentos para produção. É uma referência deliberadamente pequena. Se você precisa de permissões, acesso multi-usuário ou backup-and-restore decente, você vai passar do tamanho dele, e tudo bem. O ponto é te dar uma linha de partida clara.
Leitura complementar
- Documentação do QVAC — o SDK que faz o trabalho pesado.
- Documentação do Bun — o runtime em que o LocalLens roda.