Como o policiamento baseado em dados ameaça a liberdade humana

Abaixo trago a tradução para o português da entrevista de Andrew G. Ferguson à The Economist. Ele é professor na Universidade do Distrito de Columbia nos EUA e é autor do livro The Rise of Big Data Policing.

A entrevista original, em inglês, no site da The Economist, você pode acessar clicando aqui

The Economist: A polícia sempre usou dados para tomar decisões. O que torna esta época diferente?

Andrew Ferguson: Policiamento tem sido tradicionalmente reativo [responsivo]: policiais respondem às chamadas de serviço e a experiência que determina onde eles patrulham. A tecnologia de Big Data permite que a polícia se torne muito mais proativa. Novas fontes de dados juntamente à análise preditiva agora permitem que a polícia visualize o crime de maneira diferente, identificando bloqueios individuais, indivíduos em situação de risco e gangues de formas inovadoras. Novas tecnologias de vigilância permitem que a polícia mapeie movimentos físicos, comunicações digitais e interações suspeitas de formas que possam revelar padrões de condutas criminosas antes ocultos, e em uma quantidade excessivamente grande de dados. Todas essas informações podem ser bastante úteis na aplicação da lei penal na busca de rastrear elementos da criminalidade na sociedade. A mesma tecnologia também pode ser bastante ameaçadora para as liberdades civis e a privacidade pessoal em comunidades já policiadas demais.

The Economist: O quão difundido é o uso da tecnologia no policiamento – quão diferente é o trabalho cotidiano dos policiais hoje em oposição a 20 ou 30 anos atrás?

Sr. Ferguson: A tecnologia está definindo onde a polícia patrulha, quem ela visa e como se investiga crimes. Mais de 60 departamentos de polícia americanos usam algum tipo de “policiamento preditivo” para orientar suas operações cotidianas. Em Los Angeles, por exemplo, a polícia define suas patrulhas com base em pontos críticos (hot-spots) do crime a partir de previsão computacional. Em Chicago, uma “lista de calor” derivada de algoritmos classifica as pessoas em risco de se tornarem vítimas ou perpetradoras de violência armada.

O resultado é que a polícia prioriza locais e pessoas específicos  para contatos e monitoramento a mais. Além disso, novas tecnologias de vigilância – incluindo câmeras policiais, leitores de placa de licença automatizados, rastreadores de celulares Stingray e câmeras de vigilância de alta definição – fornecem poderosas ferramentas de monitoramento. Toda essa tecnologia muda a forma como os policiais veem as comunidades que eles patrulham e os cidadãos que eles policiam. A tecnologia também muda o trabalho de policiamento, obrigando os policiais a se tornarem coletores de dados e analistas, pois atuam em material-fonte (inputs) e avaliações em tempo real.

The Economist: O policiamento de big data funciona? Isso tornou as pessoas menos propensas a serem vítimas de crime?

Sr. Ferguson: Esse julgamento ainda está fora de alcance.

Os estudos científicos são poucos e em grande parte inconclusivos. Em algumas cidades, as taxas de criminalidade diminuíram com a introdução de novas tecnologias, mas em outras não houve nenhum efeito significativo. As taxas de criminalidade se correlacionam com uma série de forças econômicas e circunstanciais que dificultam a demonstração de qualquer conexão causal com uma tecnologia específica. Mas, na verdade, o benefício do policiamento de big data para os departamentos de polícia é político.

A nova tecnologia dá aos chefes de polícia uma resposta à antiga pergunta feita por todos os políticos em todos os fóruns das comunidades: “Chefe, o que você está fazendo para combater o crime?” Eles agora têm uma resposta inspirada em tecnologia: “Estamos usando uma nova tecnologia de caixa preta para prever e deter o crime”. Se funciona, é secundário. O que importa é dar uma resposta à pergunta, de certo modo impossível de se responder (e talvez por isso injusta), que todo chefe de polícia enfrenta.

The Economist: Quais são os maiores potenciais para o abuso?

Sr. Ferguson: Existem vários. Primeiro, os dados podem distorcer o policiamento. Policiais enviados para uma área sinalizada como estando em risco de crimes violentos podem ver eventos cotidianos como mais ameaçadores do que são, fazendo com que fiquem mais propensos a usar da força policial. Em segundo lugar, a crescente rede de vigilância ameaça mitigar as liberdades de associação, de expressão política e as expectativas [o direito] de privacidade, erodindo o anonimato público. Em terceiro lugar, mesmo com as melhores políticas de uso, os policiais têm acesso a grandes quantidades de informações pessoais de pessoas que não são suspeitas de qualquer crime. Por fim, sem cuidado na seleção dos dados a serem utilizados, formas de discriminação já antigas, como racial ou social, serão reificadas nos dados.

The Economist: Como os cidadãos podem se proteger de tais abusos?

Sr. Ferguson: A hora para responder à ameaça do policiamento por big data é agora. Toda cidade deveria ter políticas escritas formais, detalhando o uso já aprovado de novas tecnologias de policiamento por big data. Todo cidadão deveria ser educado sobre os perigos para a privacidade, a liberdade e o desequilíbrio de poder que as tecnologias de vigilância trazem. Todo departamento de polícia deve envolver comunidades impactadas sobre os riscos e recompensas de novas tecnologias preditivas com respostas oficiais às preocupações com transparência, preconceito racial e direitos constitucionais. Toda comunidade deveria sediar “cúpulas de vigilância” anuais, onde servidores públicos, sociedade civil e representantes de polícia podem se reunir para um momento de prestação de contas pública sobre o uso e o abuso potencial das novas tecnologias de Big Data. Educação, empoderamento e engajamento são as únicas proteções contra um invasivo estado de vigilância orientado por dados.

Anúncios

Por que o fascismo é tão tentador – e como seus dados podem dar força a ele

O texto abaixo é a palestra de Yuval Noah Harari para o TED Talks. Créditos e versão do texto em PDF ao final.

Olá a todos.

É meio engraçado, porque escrevi que os humanos se tornarão digitais, mas não achei que isso aconteceria tão rápido e que aconteceria comigo! Mas aqui estou eu, como um avatar digital e aí estão vocês, então vamos lá.

Vamos começar com uma pergunta: “Quantos fascistas temos na plateia hoje?” (Risos)

Bem, é um pouco difícil dizer porque esquecemos o que é o fascismo. As pessoas agora usam o termo “fascista” como um tipo de uso geral do abuso. Ou confundem fascismo com nacionalismo. Vamos usar alguns minutos pra esclarecer o que é o fascismo, na verdade, e como ele é diferente do nacionalismo.

As formas mais brandas do nacionalismo têm estado entre algumas das criações humanas mais benevolentes. Nações são comunidades de milhões de estranhos que não se conhecem. Por exemplo, eu não conheço os  milhões de pessoas que compartilham a minha cidadania israelense. Mas graças ao nacionalismo, todos podemos nos preocupar uns com os outros e cooperar de forma eficaz. Isso é muito bom.

Algumas pessoas, como John Lennon, imaginam que sem nacionalismo, o mundo será um paraíso pacífico. Mas, mais provavelmente, sem nacionalismo, estaríamos vivendo no caos tribal. Se observarmos hoje os países mais prósperos e pacíficos do mundo, como a Suécia, Suíça e Japão, veremos que eles têm um forte senso de nacionalismo. Em contraste, países que não têm um forte senso de nacionalismo, como Congo, Somália e Afeganistão, tendem a ser violentos e pobres.

Então, o que é fascismo e como ele é diferente do nacionalismo?

Bem, o nacionalismo me diz que minha nação é única e que tenho obrigações especiais com ela. Já o fascismo me diz que minha nação é suprema e que tenho obrigações exclusivas com ela.

Não preciso me preocupar com ninguém ou com nada a não ser com minha nação. Normalmente, claro, as pessoas têm muitas identidades e lealdade a diferentes grupos. Por exemplo, posso ser um grande patriota, fiel ao meu país e, ao mesmo tempo, ser fiel a minha família, a minha vizinhança, minha profissão, à humanidade como um todo, à verdade e à beleza.

Mas quando temos diferentes identidades e lealdades, isso pode criar conflitos e complicações. Mas, quem disse que a vida é fácil? A vida é complicada. Lidemos com isso.

Fascismo é o que acontece quando as pessoas tentam ignorar as complicações e facilitar muito a própria vida delas. O fascismo nega todas as identidades, exceto a identidade nacional, e insiste que tenho obrigações somente com a minha nação.

Se minha nação exige que eu sacrifique minha família, então, vou sacrificar minha família. Se a nação exige que eu mate milhões de pessoas, então vou matar milhões de pessoas. E se minha nação exige que eu traia a verdade e a beleza, devo trair a verdade e a beleza.

Por exemplo, como um fascista avalia arte? Como um fascista decide se um filme é bom ou ruim?

É extremamente simples. Existe, na verdade, apenas um critério: se o filme serve aos interesses da nação, é um bom filme; se não serve aos interesses da nação, é um filme ruim. É bem por aí.

Do mesmo modo, como um fascista decide o que ensinar às crianças na escola? De novo, é muito simples. Existe apenas um critério: você ensina às crianças o que serve aos interesses da nação. A verdade não importa em nada.

Os horrores da Segunda Guerra Mundial e do Holocausto nos lembram das terríveis consequências deste raciocínio. Mas, geralmente, ao falarmos sobre os males do fascismo, fazemos isso de modo ineficaz, pois a tendência é descrever o fascismo como um monstro hediondo, sem realmente explicar o que havia de tão sedutor nele.

É um pouco como nos filmes de Hollywood que retratam os bandidos, Voldemort, Sauron ou Darth Vader, como feios, malignos e cruéis. Eles são cruéis até mesmo com aqueles que os apoiam. Quando vejo esses filmes, nunca entendo: por que alguém ficaria tentado a seguir um asqueroso nojento como o Voldemort?

O problema com o mal é que, na vida real, o mal não parece necessariamente feio. Ele pode parecer muito bonito. E isso é algo que o cristianismo sabia muito bem, é por isso que na arte cristã, ao contrário de Hollywood, Satanás é geralmente representado como um homem lindo.

É por isso que fica tão difícil resistir às tentações de Satanás, e porque também fica difícil resistir às tentações do fascismo.

O fascismo faz com que as pessoas se vejam como pertencendo à coisa mais bela e mais importante do mundo: a nação.

E então elas pensam: “Nos ensinaram que o fascismo é feio, mas quando me olho no espelho, vejo algo muito bonito. Não tem como eu ser um fascista, certo?” Errado.

Esse é o problema com o fascismo.

Quando você se olha no espelho fascista, se vê muito mais bonito do que realmente é. Na década de 1930, quando os alemães se olharam no espelho fascista, viram a Alemanha como a coisa mais linda do mundo. Se os russos se olharem no espelho fascista hoje, vão ver a Rússia como a coisa mais linda do mundo. E se os israelenses se olharem no espelho fascista, vão ver Israel como a coisa mais linda do mundo.

Não significa que estejamos enfrentando agora uma reprise da década de 1930. Fascismo e ditaduras podem voltar, mas vão voltar num novo formato, que é bem mais relevante às novas realidades tecnológicas do século XXI.

Em tempos antigos, a terra era o bem mais importante do mundo. Política, portanto, era a luta para controlar as terras. E ditadura significava que todas as terras pertenciam a um único governante ou a uma pequena oligarquia.

E na era moderna, as máquinas tornaram-se mais importantes do que a terra. Política tornou-se a luta para controlar as máquinas. E ditadura significava que muitas das máquinas ficavam concentradas nas mãos do governo ou de uma pequena elite.

Agora os dados estão substituindo tanto a terra quanto as máquinas como o bem mais importante. Política se torna a luta para controlar os fluxos de dados. E ditadura agora significa que muitos dados estão sendo concentrados nas mãos do governo ou de uma pequena elite.

O maior perigo que confronta a democracia liberal agora é que a revolução em tecnologia da informação tornará ditaduras mais eficientes do que as democracias.

No século XX, a democracia e o capitalismo derrotaram o fascismo e o comunismo, pois a democracia era melhor no processamento de dados e na tomada de decisões.

Devido à tecnologia do século XX, tornou-se simplesmente ineficiente tentar concentrar muitos dados e muito poder num só lugar.

Mas não é uma lei da natureza que processamento centralizado de dados seja sempre menos eficiente que o processamento distribuído de dados. Com o surgimento da IA e do aprendizado de máquina, talvez torne-se viável processar enormes quantidades de informação muito eficientemente num lugar, tomar todas as decisões num só lugar, e, assim, o processamento centralizado de dados será mais eficiente que o processamento distribuído de dados.

E, então, a principal desvantagem de regimes autoritários no século XXI, a tentativa deles de concentrar todas as informações num só lugar, se tornará a maior vantagem deles.

Outro perigo tecnológico que ameaça o futuro da democracia é a fusão da tecnologia da informação com a biotecnologia, o que pode resultar na criação de algoritmos que me conhecem melhor do que eu me conheço. E uma vez em posse desses algoritmos, um sistema externo, como o governo, pode não apenas prever minhas decisões, mas também pode manipular meus sentimentos, minhas emoções.

Um ditador pode não ser capaz de me fornecer boa assistência médica, mas será capaz de me fazer amá-lo e me fazer odiar a oposição.

Será difícil para a democracia sobreviver a tal desenvolvimento porque, no final, a democracia não é baseada na racionalidade humana, mas em sentimentos humanos.

Durante eleições e referendos, não estão te perguntando: “Qual é a sua opinião?” Na verdade, estão te perguntando: “Como você está se sentindo?” E se alguém puder manipular suas emoções efetivamente, a democracia se tornará um show emocional de marionetes. Então, o que podemos fazer pra evitar o retorno do fascismo e o surgimento de novas ditaduras?

A primeira questão que enfrentamos é: quem controla os dados?

Se você for engenheiro, encontre formas de evitar que muitos dados sejam concentrados nas mãos de poucos.

E encontre formas de se certificar que o processamento distribuído de dados seja, pelo menos, tão eficiente quanto o processamento centralizado de dados. Esta será a melhor proteção para a democracia.

Quanto ao restante de nós que não somos engenheiros, a questão número um que enfrentamos é como não permitir sermos manipulados por aqueles que controlam os dados.

Os inimigos da democracia liberal têm um método. Eles reprogramam nossos sentimentos. Não nossos e-mails, nem nossas contas bancárias. Eles reprogramam nossos sentimentos de medo, ódio e vaidade, e depois usam esses sentimentos para polarizar e destruir a democracia a partir de dentro.

Este é um método pioneiro, usado pelo Vale do Silício, para nos vender produtos. Mas agora, os inimigos da democracia estão usando esse mesmo método para nos vender medo, ódio e vaidade.

Eles não podem criar esses sentimentos do nada. Eles aprendem a reconhecer nossas próprias fraquezas preexistentes, e depois as usam contra nós. Portanto, é nossa responsabilidade conhecermos nossas fraquezas e garantirmos que elas não se tornem uma arma nas mãos dos inimigos da democracia.

Conhecer nossas próprias fraquezas também nos ajudará a evitar a armadilha do espelho fascista.

Como expliquei anteriormente, o fascismo explora nossa vaidade e isso faz com que nos vejamos bem mais bonitos do que realmente somos. Essa é a sedução.

Mas se vocês realmente se conhecem, não vão cair por este tipo de bajulação. Se colocarem um espelho a sua frente, que esconde o seu lado feio e faz com que se veja muito mais bonito e mais importante do que você realmente é, simplesmente quebre esse espelho.

Obrigado.

Palestra original publicada no youtube em 08 de junho de 2018, disponível neste link: https://www.youtube.com/watch?v=xHHb7R3kx40&index=7&list=LLz1KLeAmpvy9ieGwETAsu4w&t=0s

Tradução de Maricene Crus e revisão de Carolina Aguirre

Título original: Why fascism is so tempting – and how your data could power it

Texto em PDF: Por que o fascismo é tão tentador Yuval Noah Harari

Lei de proteção aos dados pessoais saindo do forno… e crua

De acordo com a notícia da jornalista Ana Pompeu (pelo Conjur, aqui), nesta terça-feira 14.08.18, Temer sancionou, com vetos, a tão esperada lei de proteção aos dados pessoais. Será a Lei nº 13.709/2018, com vigência para daqui 18 meses.

A proteção de dados pessoais já é discussão legislativa na Europa há mais de 20 anos. Lá a matéria é frequentemente lembrada e rediscutida, sempre levando-se em consideração as novas questões que emergem com o avanço tecnológico.

Ao mesmo tempo, enquanto a academia internacional já discute a proteção de dados pessoais lá no quinto andar, aqui estamos só olhando para a porta de entrada.

Pois bem, o parlamento brasileiro poderia pegar carona nessa discussão avançada da Europa, mas resolveram começar engatinhando mesmo.

Sejamos sinceros, a nova lei de proteção aos dados é um grande nada.

Lei pra inglês ver no melhor sentido do termo. Não avança nos pontos críticos e repete o jabá que não vai incomodar ninguém nem vincular os atores que realmente importam. Não dispõe sobre sanções e, quando indicou um órgão regulador, foi vetada pela presidência.

Segundo Ana Pompeu, a lei previa a criação da Autoridade Nacional de Proteção de Dados (ANPD), autarquia que seria vinculada ao Ministério da Justiça. O novo órgão teria atribuição de, por exemplo, elaborar diretrizes para uma Política Nacional de Proteção de Dados Pessoais e Privacidade, fiscalizar e a aplicar sanções em caso uso de dados fora da legislação.

A ideia de criação de uma autarquia é interessante, embora eu acredite que, constitucionalmente, essa atribuição caiba ao Ministério Público (mesmo não acreditando muito no MP para fiscalizar o Estado em práticas autoritárias).

Quem sabe o veto não reabra essa discussão. A meu ver, as sanções e, claro, os deveres, devem estar especificados por lei, não por portaria de autarquia vinculada ao Executivo…

O essencial, e que faltou na lei, é a determinação de que todos os processos de tratamento de dados sejam abertos e sujeitos a controle posterior, se não do público em geral, no mínimo, da comunidade acadêmica e das instâncias reguladoras e do MP, com direito de participação de quem os dados se referem.

Pertinente seria a determinação de procedimentos mínimos especificados sobre transparência nos processos de tratamento de dados e prestação de contas a uma instância apenas, externa àquela que requereu e tratou os dados, que teria a competência para apurar infrações e provocar o Judiciário para aplicação de penalidades previamente estabelecidas.

Em outras palavras, a lei de proteção aos dados pessoais deveria estabelecer regras mínimas para qualquer tratamento de dados e estabelecer deveres claros e precisos de prestação de contas. Não foi o que aconteceu.

A lei trabalha sobre generalidades e abstrações. Veja só: O tratamento de dados pessoais ou a sua interconexão respeitará a lealdade e boa fé, de modo a atender aos legítimos interesses dos seus titulares…

Boa fé e lealdade!… até são valores que podiam ter certa força normativa lá na Idade Média, mas hoje não significam absolutamente nada. O que vincula não é uma regra genérica pedindo boa intenção. E o pior é que eles sabem muito bem disso.

Mas o pior da lei nem é isso. É a previsão de que ela não vale – isso mesmo, simplesmente não se aplica – aos bancos de dados utilizados pela administração pública, investigação criminal ou inteligência. Ora, aprendi que em uma democracia a Lei cria, vincula e limita o Estado. Porém, com a população desatenta, o Estado pode simplesmente querer regular os demais e se desvincular de qualquer obrigação!

Temo, acho que com razão, que a lei – aberta e genérica como está – vá servir mais para o Estado controlar e censurar a sociedade do que para a sociedade controlar o Estado.

Bom, mas o Estado pode tudo. São outros tempos mesmo…

 

Processo Penal de Vingança: uma correlação entre Carnelutti e Black Mirror

O texto abaixo é uma resenha do meu aluno de direito na UFLA, Gabriel Felipe Nami Inácio, quem gentilmente me autorizou a publicá-lo no blog.

Contém spoilers!

Processo Penal de Vingança: uma correlação entre As misérias do Processo Penal, de Francesco Carnelutti, e o episódio White Bear, da série Black Mirror.

O fim último do processo penal consiste em assegurar os direitos individuais do acusado, ao menos em uma dimensão teórica, de modo que se possa obter um devido processo penal justo e efetivo. É por meio desse ramo jurídico também que se verifica o grau de democracia de um Estado, a partir de um exame da valoração imputada à liberdade humana. Nesse sentido, o sistema acusatório é estruturado a partir de uma distinção clara entre quem julga e quem acusa, de forma que o exercício de uma atividade própria das partes pelo magistrado é incompatível com os valores desse sistema.

Com efeito, Carnelutti discorre em sua obra, “As misérias do processo penal”, sobre a posição dos magistrados, promotores, advogados e réus. O autor salienta que as decisões judiciais podem sofrer influência da mídia, sobretudo em casos de grande repercussão social, corroborando para um processo penal que suprime direitos e garantias individuais do réu em prol de apelos sociais controlados pela mídia. O jurista italiano ainda analisa a situação a qual o réu fica sujeito, dispondo sobre a exposição de um acusado e o consequente estigma social que lhe é imputado, ainda no decorrer do processo. De fato, o processo é por si só uma pena, conforme afirma Carnelutti, que produz efeitos prejudiciais não apenas na vida do indivíduo acusado, mas também na de seus familiares e pessoas de seu convívio social.

black mirror.jpeg

É possível elucidar ainda a tese proposta pelo autor a partir de um escrutínio do episódio “White Bear”, da série Black Mirror.

O episódio se inicia com a protagonista, que não se lembra da própria identidade, sendo perseguida por pessoas fantasiadas, além de filmada por outras que não prestam qualquer auxílio. Após tentativas de assassinato contra a protagonista, a perseguição é concluída quando ela chega a uma sala de máquinas que se transforma em um palco. Nesse ínterim, a personagem se recorda de quem é: Victoria Skillane, condenada pelos crimes de sequestro e assassinato de uma criança. A partir disso, são exibidos vídeos da criança como refém, gravados pela própria protagonista, a qual suplica pela misericórdia da platéia e dos apresentadores. White Bear, nome dado em homenagem ao urso de pelúcia da criança assassinada, é sobre um campo de diversões punitivo, em que criminosos são condenados a participar desses espetáculos perversos. Nesse diapasão, observa-se que a dinâmica e crítica do episódio convergem para o sistema punitivo fundamentado no sentimento de vingança, que, em uma dimensão diacrônica, desvia o processo penal de sua finalidade, sobretudo quando o juiz é persuadido e tem liberdade processual para além das características inerentes à atividade de julgar. Além disso, verifica-se que o próprio processo penal em si já é uma tortura contra o acusado, conforme enfatiza Carnelutti, haja vista a rotulação do acusado e a reverberação social de um processo penal.

A partir disso, é notório que o juiz deve assumir uma postura imparcial, de modo que o devido processo penal e os direitos individuais do réu não sejam frustrados, seja em decorrência do sentimento de vingança dos familiares da vítima, de pressões exercidas pela mídia ou até mesmo das próprias fragilidades do magistrado. Por imparcialidade, entende-se que o juiz deve se manter afastado da atividade de investigar, ocupando-se exclusivamente com a atividade de julgar. Insta salientar ainda que não se sustenta a percepção de um juiz como mero reprodutor da lei, uma vez que se reconhece o mito da neutralidade, consoante perspectiva do próprio Carnelutti (1995, p. 47):

A justiça humana não pode ser senão uma justiça parcial; a sua humanidade não pode senão resolver-se na sua parcialidade. Tudo aquilo que se pode fazer é buscar diminuir esta parcialidade. O problema do direito e o problema do juiz é uma coisa só. Como pode fazer o juiz ser melhor daquilo que é? A única via que lhe é aberta a tal fim é aquela de sentir a sua miséria: precisa sentirem-se pequenos para serem grandes.

À luz da crítica elaborada, é evidente que desvios de finalidade do processo penal refletem proporcionalmente uma sociedade menos democrática. A insigne operação lava-jato apresenta diversos episódios nos quais o juiz Sérgio Moro agiu de forma questionável, demonstrando não somente incongruência com as funções de seu ofício, mas inconsistência de sua atuação. Como exemplo, reputa-se a divulgação de uma conversa entre os ex-presidentes, Luiz Inácio Lula da Silva e Dilma Rousseff, divulgado de maneira irregular. O juiz, em entrevista, afirmou que a divulgação dos áudios era matéria de interesse público.

Portanto, é notório que o processo penal como instrumento de garantia de direitos individuais alcança não tão somente o acusado, mas todo e qualquer cidadão. Dessa forma, urge a necessidade de preservação das liberdades individuais, que norteiam todo o processo penal, de maneira que este não se submeta a sentimentos de vingança, atentando contra o próprio regime democrático.

Data Mining e suas limitações

A mineração de dados (data mining) tem sido apontada como uma ferramenta útil no trabalho de segurança pública e de combate ao crime. Contudo, é possível apontar sérios problemas com o data mining, que muitas vezes passam despercebidos pelos agentes de segurança empolgados com essa tecnologia.

Antes de apontar os problemas, vale uma explicação sobre o que é o data mining.

O data mining, traduzido para o português como mineração de dados (ou prospecção de dados em portugal), consiste na extração automatizada de dados de variadas fontes ou banco de dados que objetiva a busca por padrões. Ao contrário da estatística, em que os dados são coletados com o propósito de testar uma hipótese específica, ou estimar os parâmetros de um modelo, a mineração de dados não busca a análise dos dados em si, mas dos padrões sugeridos pelo data mining. Daí que eventualmente o data mining é referido como uma análise secundária. Assim, se a estatística é utilizada para confirmação de determinada hipótese ou modelo, a mineração de dados gera as hipóteses.

Assim, temos o primeiro problema. Com o data mining não se faz qualquer questionamento sobre as fontes de dados.

Por exemplo, se quisermos usar o data mining para detecção de padrões acerca de furtos, vamos pegar as informações registradas pela Polícia com determinada rubrica. A mineração vai apontar os locais preferenciais de ocorrências de furto, dando origem ao que se chama de mancha de criminalidade.

Contudo, pode não se questionar a forma como são registrados esses dados. Se, por exemplo, furtos em uma universidade forem todos registrados com um endereço específico, teremos uma mancha de criminalidade falsa, dada sua extensão territorial.

Tampouco vai haver informações sobre os dados não coletados. É possível dizer que, em determinadas regiões, as pessoas tem menos acesso à informação e à Polícia, seja por razões de desconfiança ou por temerem o envolvimento que a denúncia pode surtir. Nesse quesito, o data mining pode gerar padrões equivocados, indicando uma vitimização exacerbada de determinados grupos em relação a outros.

O data mining para detecção de eventuais criminosos também é um grande problema. Isso porque sabemos do problema da seletividade penal, que atinge pobres e negros de regiões periféricas com maior intensidade.

Se os dados são fruto dessa seletividade, obviamente o data mining vai apenas reforçá-la, indicando padrões pré-existentes. Assim, mais do que contribuir para a busca de novos padrões, o data mining apenas vai contribuir para um quadro mais profundo de seletividade. Há aqui a confirmação esperada, sucedida de satisfação decorrente de expectativa prévia, sem hipótese de refutação.

Não é possível um bom e eficiente data mining com uma base de dados já enviesada.

Outro problema com o data mining é a discriminação.

As bases de dados podem se referir a uma série de informações como sexo, orientação sexual, religião, gênero, cor, renda, endereço etc. Padrões que vinculam criminalidade com essas características podem criar generalizações de cunho preconceituoso, contribuindo para o aprofundamento da discriminação sobre minorias e grupos vulneráveis.

Um padrão sugerido pelo data mining de que há mais criminalidade em determinado bairro pode ser compreendido preconceituosamente como se as pessoas daquele bairro fossem potenciais criminosos ou mais tendentes ao crime.

Aqui estaríamos no clássico erro lombrosiano. Um padrão sugerido pelo data mining de que suspeitos de roubos são pessoas negras não sugere que pessoas negras têm uma tendência criminosa, mas de que o registro dos dados de criminosos foi seletivo. Ou seja, mostra-se a seletividade na coleta de dados e não de um padrão entre negritude e criminalidade.

Por fim, temos o problema da privacidade, que pode ocorrer nas duas pontas do data mining.

A primeira ponta se refere ao dado em si, cuja proteção cada vez mais se torna importante no mundo tecnológico, em que quase tudo de nossas vidas é reduzido a dados. Ainda que se cada órgão público ou empresa tenha seus bancos de dados, não se pode admitir uma malha penal que suprime qualquer competência, concedendo-se às instâncias de segurança pública acesso irrestrito a qualquer base de dados.

Há uma expectativa mínima de privacidade de que nem todas as informações pessoais necessárias para celebração de um contrato ou cumprimento de obrigação não estejam livremente disponíveis ao poder estatal repressivo.

A outra ponta se refere ao alcance de determinado sujeito ou grupo a partir do padrão sugerido pelo data mining. Ainda que o sistema aponte determinada pessoa como suspeita, é questionável em que medida é possível investigar o sujeito, ao preço de sua privacidade, com base no data mining.

É necessário, no mínimo, alguma vinculação entre algum fato criminoso e a pessoa para autorizar eventual investigação. Somente o data mining como fundamento para investigações a sujeitos determinados pode gerar abusos e mitigações de direitos injustas sobre pessoas inocentes.

No Brasil, pelo menos na breve pesquisa que realizei, o data mining está sendo recebido com empolgação juvenil. As preocupações sobre seus problemas e limitações, apontados em muitos estudos no exterior, ainda não chegaram. A tecnologia sempre nos exige atenção dobrada.

Informações do texto nos artigos:

What Is Data Mining and How Does It Work? – Toon Calders, Bart Custers

Responsibly Innovating Data Mining and Profiling Tools: A New Approach to Discrimination Sensitive and Privacy Sensitive Attributes – Bart H.M. Custers and Bart W. Schermer