FAQ

Carf Previsível: previsibilidade e algoritmo

Como funciona o algoritmo que calcula as chances de vitória pró Fisco ou pró contribuinte?

O Carf Previsível utiliza um modelo de aprendizado de máquina para inferir probabilidades de vitória ou derrota dos contribuintes ou do Estado em julgamentos em todas as seções e turmas do tribunal administrativo. Os cálculos analisam dados do recurso em aberto e atribuem probabilidade para a próxima decisão.

Para a fase beta, atualmente utilizamos um modelo de regressão logística, que prevê variáveis binárias (vencer ou perder um caso). Quando o grau de acerto ultrapassou 80%, nossa equipe utilizou esse aprendizado para prever todos os casos presentes na nossa base de dados.

Topo

Como o algoritmo capta mudanças recentes de jurisprudência?

A máquina sempre olha para uma base de treino para aprender e gerar as predições. Para lidar com o desafio de captar uma mudança de jurisprudência, a base de treinamento é constantemente atualizada. A cada semana, a equipe do JOTA faz novas classificações para que a máquina aprenda na situação mais atual possível. Mas algumas mudanças podem demorar alguns meses para serem aprendidas pelo computador porque é necessário que exista um padrão forte e identificável. Imagine que uma nova jurisprudência tenha sido criada, mas ela ainda é muito pouco aplicada. A máquina vai precisar de tempo para que essas informações entrem e sejam captadas. Para casos de mudança recente ou avaliações pontuais, o JOTA oferece o recurso de análise sob demanda dos analistas de dados para clientes JOTA PRO Tributos Expert.

Topo

Que variáveis são usadas no modelo estatístico?

Para a fase beta, o time do JOTA Labs levantou mais de 30 variáveis para todos os casos disponibilizados no site do Carf, dentre as quais a quantidade de andamentos de cada processo, a velocidade desses andamentos nos últimos 30 e 90 dias, a data da última atualização e a data de entrada no Carf, a quantidade de tributos em discussão, além de uma variável para a presença ou ausência de cada tipo de tributo.

Topo

Como o algoritmo ‘escolhe’ as variáveis mais importantes?

Para que nossos robôs consigam identificar as variáveis mais importantes, o primeiro passo é um trabalho manual. A equipe de especialistas do JOTA classifica manualmente as decisões do Carf –hoje, acumulamos dezenas de milhares de decisões analisadas individualmente. Feita essa classificação, treinamos a máquina para aprender quais características ajudam a prever os resultados daqueles processos classificados manualmente pela equipe do JOTA. Na sequência, calculamos as combinações de variáveis que preveem os resultados (base de treino) e checamos se essas combinações também preveem uma outra base separada aleatoriamente (base de teste).

Topo

Consigo saber quais variáveis afetaram a previsão de um determinado caso?

Nesta fase beta, ainda não estamos exibindo as variáveis de maior peso na previsão. O modelo de aprendizado de máquina permite que saibamos o peso médio que cada variável teve em uma rodada de atualização –uma visão agregada e não por processo. Estamos desenvolvendo formas para apresentar essa informação.

Topo