FAQ

JOTA PRO

Como o algoritmo ‘escolhe’ as variáveis mais importantes?

Para que nossos robôs consigam identificar as variáveis mais importantes, o primeiro passo é um trabalho manual. A equipe de especialistas do JOTA classifica manualmente as decisões do Carf –hoje, acumulamos dezenas de milhares de decisões analisadas individualmente. Feita essa classificação, treinamos a máquina para aprender quais características ajudam a prever os resultados daqueles processos classificados manualmente pela equipe do JOTA. Na sequência, calculamos as combinações de variáveis que preveem os resultados (base de treino) e checamos se essas combinações também preveem uma outra base separada aleatoriamente (base de teste).

Topo

Com que frequência vocês atualizam a base?

Existem três tipos de atualização na fase beta de desenvolvimento.

  1. Atualizamos o cálculo da previsão semanalmente. Nesta atualização, trazemos dados sobre decisões ocorridas no período nos processos que temos na base.
  2. Atualizamos três vezes por semana as informações referentes a andamentos processuais e de recursos.
  3. Atualizamos a base de processos conforme pedidos de clientes participantes da fase beta.

Para as próximas fases, o plano de atualização traz a inclusão de processos relacionados às 10.000 maiores empresas do país.

Topo

Que variáveis são usadas no modelo estatístico?

Para a fase beta, o time do JOTA Labs levantou mais de 30 variáveis para todos os casos disponibilizados no site do Carf, dentre as quais a quantidade de andamentos de cada processo, a velocidade desses andamentos nos últimos 30 e 90 dias, a data da última atualização e a data de entrada no Carf, a quantidade de tributos em discussão, além de uma variável para a presença ou ausência de cada tipo de tributo.

Topo

Como vocês obtiveram esses 125.000 processos?

Inicialmente, na fase beta de desenvolvimento em que estamos, usamos um método conhecido por webscrapping para coletar processos a partir de CNPJs. O Carf não fornece acesso direto aos dados, apesar de serem dados públicos. Posteriormente, conseguimos com o próprio Carf, via Lei de Acesso à Informação, uma lista contendo cerca de 120.000 processos em tramitação e fizemos a importação dos que ainda não constavam na base.

Topo

Que buscas e filtros são possíveis hoje?

Nesta fase beta, é possível buscar pelo número do processo, pelo nome do contribuinte, pelo tributo e por expressões textuais que constem na ementa e na decisão. Conseguimos ainda filtrar por processos que estão tramitando ou encerrados no Carf.

Topo