FAQ

CARF Previsível

Como a ferramenta identifica que um processo foi encerrado?

Nesta fase beta, consideramos encerrados os processos constantes de uma planilha informada pelo próprio Carf que conseguimos via Lei de Acesso à Informação. Estamos trabalhando na definição de regras próprias para identificarmos os processos de maneira independente.

Topo

O que querem dizer os status ‘tramitando’ e ‘encerrado no Carf’?

Processos que estejam tramitando são aqueles que ainda estão tendo seu mérito avaliado. Já os processos encerrados no Carf são aqueles em que todas as decisões ocorreram e já não há mais recurso possível. Esses processos podem estar nas delegacias regionais de origem em processo de autuação do contribuinte ou as autuações já podem ter ocorrido.

Topo

Como o algoritmo ‘escolhe’ as variáveis mais importantes?

Para que nossos robôs consigam identificar as variáveis mais importantes, o primeiro passo é um trabalho manual. A equipe de especialistas do JOTA classifica manualmente as decisões do Carf –hoje, acumulamos dezenas de milhares de decisões analisadas individualmente. Feita essa classificação, treinamos a máquina para aprender quais características ajudam a prever os resultados daqueles processos classificados manualmente pela equipe do JOTA. Na sequência, calculamos as combinações de variáveis que preveem os resultados (base de treino) e checamos se essas combinações também preveem uma outra base separada aleatoriamente (base de teste).

Topo

Com que frequência vocês atualizam a base?

Existem três tipos de atualização na fase beta de desenvolvimento.

  1. Atualizamos o cálculo da previsão semanalmente. Nesta atualização, trazemos dados sobre decisões ocorridas no período nos processos que temos na base.
  2. Atualizamos três vezes por semana as informações referentes a andamentos processuais e de recursos.
  3. Atualizamos a base de processos conforme pedidos de clientes participantes da fase beta.

Para as próximas fases, o plano de atualização traz a inclusão de processos relacionados às 10.000 maiores empresas do país.

Topo

Que variáveis são usadas no modelo estatístico?

Para a fase beta, o time do JOTA Labs levantou mais de 30 variáveis para todos os casos disponibilizados no site do Carf, dentre as quais a quantidade de andamentos de cada processo, a velocidade desses andamentos nos últimos 30 e 90 dias, a data da última atualização e a data de entrada no Carf, a quantidade de tributos em discussão, além de uma variável para a presença ou ausência de cada tipo de tributo.

Topo

Como vocês obtiveram esses 125.000 processos?

Inicialmente, na fase beta de desenvolvimento em que estamos, usamos um método conhecido por webscrapping para coletar processos a partir de CNPJs. O Carf não fornece acesso direto aos dados, apesar de serem dados públicos. Posteriormente, conseguimos com o próprio Carf, via Lei de Acesso à Informação, uma lista contendo cerca de 120.000 processos em tramitação e fizemos a importação dos que ainda não constavam na base.

Topo