Opinião & Análise

Direitos autorais

A tutela da voz e a deepfake music

Canal no Youtube cria deepfakes com voz de Jay-Z e o cantor toma medidas para retirar o conteúdo do ar

Crédito: Pixabay

Vocal Synthesis[1]é um canal do YouTube com cerca de 63,4 mil inscritos que disponibiliza deepfakes musicais: áudios gerados por meio de técnicas de inteligência artificial conjugadas com prévias bases de dados que, em síntese, imitam vozes humanas.

O canal tem uma série de vídeos notáveis, combinando vozes famosas em situações improváveis: Bob Dylan cantando Britney Spears[2], Ayn Rand lendo Rick and Morty[3] e Donald Trump cantando um rap[4].

Essa atividade não é novidade. Programas como o Jukebox[5], por exemplo, se destinam a a criar músicas novas com base em padrões musicais de outros cantores famosos. Essencialmente, os algoritmos analisam uma base de dados musicais, encontram padrões e características de estilo musical e os correlacionam para gerar um novo áudio.

Parece apenas hilário e inofensivo, mas uma das vozes se incomodou: Jay-Z. O canal disponibilizou, dentre uma série de outros vídeos, deepfakes com Jay-Z recitando Hamlet[6], lendo o livro do Gênesis[7] e cantando músicas de Billy Joel[8]. Em contrapartida, a Roc Nation LLC, agência de Jay-Z, notificou o programador sob a alegação de que ele estaria representando ilegalmente a voz do cantor e que isso violaria seus direitos autorais[9].

Os responsáveis pelo canal se manifestaram dizendo estarem “decepcionados que Jay-Z e Roc Nation decidiram intimidar um pequeno YouTuber dessa maneira. Também é decepcionante que o YouTube escolha novamente reprimir a criatividade, apoiando reflexivamente empresas poderosas em vez de pequenos criadores de conteúdo”[10].

O criador também aponta que houve “uso justo”, não havendo que se falar em retirada do material, considerando o objetivo, a natureza e o caráter do conteúdo, a quantidade e a substancialidade do trecho tomado e o efeito do uso no mercado do titular. Ademais, sustentou que o canal é um projeto anônimo, não comercial, que não gera receitas com publicidade nem benefícios financeiros para o criador e que o impacto no mercado musical de Jay-Z é inexistente.

Não se ignora que tais argumentos possuem relevância, máxime considerando que a controvérsia central sobre deepfakes reside essencialmente no engano e na desinformação, situação inexistente nos vídeos em questão, uma vez que explicitamente informava ao espectador que o áudio era gerado por meio de um software e há nítido caráter satírico.

Por outro lado, também impende evidenciar que a voz é um elemento da personalidade que identifica o sujeito no meio social, especialmente no ramo artístico, o que pode ensejar questionamentos sobre a sua utilização na produção das referidas deepfakes.

Ironicamente, Jay-Z e Beyoncé foram recentemente processados com fundamento na alegação de terem se utilizado, sem autorização, da voz de uma cantora jamaicana em uma música[11].

Noutro norte, um dos vídeos do canal Vocal Synthesis é o que simula a rainha Elizabeth II lendo “Lucy in the Sky with Diamonds”[12], dos Beatles. Isso pode nos levar até um experimento mental: como seria se os Beatles estivessem juntos hoje? Poderia uma IA selecionar uma base de dados com conteúdo musical e vozes dos integrantes e, hoje, lançar um suposto EP? Imagine um software capaz de armazenar todo o material musical produzido, agregando com vozes em diálogos, entrevistas e outras situações, ocasião em que geraria um suposto conteúdo novo da banda.

Parece um episódio de Black Mirror, mas não é tão distante da realidade. Um youtuber já criou uma música que seria atribuída ao Nirvana, além de ter feito isso com grupos como AC/DC e Metallica[13].

A propositura da demanda por Jay-Z e o surgimento cada vez mais frequente de deepfakes musicais enseja questionamentos sobre atividades corriqueiras que já conhecemos há um tempo: qual seria a diferença, então, de uma deepfake musical para os comuns imitadores cômicos?

Quais as implicações jurídicas que as deepfakes musicais acarretam?

Tratam-se de criações novas ou de meras reproduções de um bem jurídico prévio?

A voz é um bem jurídico autônomo?

Existe uma tutela jurídica da voz no ordenamento jurídico brasileiro?

Quais os impactos desse tratamento para o futuro das deepfakes musicais?

São inúmeras as questões envolvidas e, por óbvio, o objetivo desse texto não é esgotá-las nem, de pronto, solucionar os problemas levantados, mas apenas instigar reflexões sobre a necessária revisitação de conceitos e adaptação do Direito aos novos influxos do movimento tecnológico.

Ressalte-se, ainda, que o sistema americano é essencialmente distinto do brasileiro, uma vez que segue o sistema de copyright, ao passo em que, no Brasil, seguimos o direito de autor, o que comporta diferenças em seu tratamento.

A voz é um elemento único que nos identifica. No Brasil, a Lei nº 9.610/98, que disciplina os direitos autorais, estipula em seu art. 90, parágrafo segundo, que a proteção aos artistas intérpretes ou executantes estende-se à reprodução da voz e imagem, quando estão associadas às suas atuações.

O Superior Tribunal de Justiça, por sua vez, compreende a voz como um elemento que é protegido no âmbito dos direitos da personalidade, seja como direito autônomo ou como parte integrante do direito à imagem e/ou à identidade pessoal[14].

Nesse sentido, o Tribunal entende que podem ser objeto de disposição voluntária, desde que não permanente nem geral, estando sua utilização condicionada à prévia autorização do titular e em conformidade com o contrato.

No mesmo sentido, o Tribunal Regional do Trabalho da 3ª Região já condenou uma instituição financeira a indenizar ex-empregado que teve sua voz utilizada sem autorização em atividade lucrativa do empregador[15].

No Brasil parece existir, portanto, tendência de tutela da voz como um atributo da personalidade, o que demandaria a prévia autorização do titular para sua utilização. No entanto, situações como as das deepfakes musicais, acompanhadas de suas especificidades, ainda não chegaram aos tribunais brasileiros.

Uma solução seria tratar a voz como um atributo do direito de identidade pessoal e dar-lhe o mesmo tratamento do direito de imagem, considerando, ainda, as particularidades que cada caso concreto irá apresentar e a metodologia da constitucionalização das relações privadas.

A inovação e o surgimento de novos fenômenos sociais muitas vezes enseja a necessidade de que o intérprete revisite conceitos doutrinários e epistemológicos consolidados sobre determinada matéria. A ascensão de fenômenos digitais no cotidiano, situações essencialmente dinâmicas e complexas, torna ainda mais desafiadora a aplicação dos institutos jurídicos atuais.

É inquestionável que o advento de um novo contexto tecnológico acarreta modificações no tratamento das demandas postas em apreciação, não somente sob o prisma social, como também no prisma jurídico, seja material ou procedimental.

Nesse ponto, não raro se verificam algumas lacunas ou situações que não foram previamente disciplinadas pelo legislador, fenômeno previsível especialmente em um contexto de mutações tecnológicas e de queda do paradigma da codificação.

No ramo artístico, essa relação se torna ainda mais sensível, uma vez que o desenvolvimento de tecnologias tem permitido a ascensão de criações antes não imaginadas e a revisitação do próprio conceito de criador.

Nos dizeres de Oscar Wilde, a vida imita a arte muito mais do que a arte imita a vida. E Chico Buarque, em uma famosa composição, já afirmava: “minha voz, se vós não sereis minha, vós não sereis de mais ninguém”.

 


[1] Disponível em: <https://www.youtube.com/channel/UCRt-fquxnij9wDnFJnpPS2Q/videos>. Acesso em: 27 de junho de 2020.

[2] Disponível em: <https://www.youtube.com/watch?v=PRWlvlXx5lw>. Acesso em: 27 de junho de 2020.

[3] Disponível em: <https://www.youtube.com/watch?v=ExUyyfT-DdM>. Acesso em: 27 de junho de 2020.

[4] Disponível em: <https://www.youtube.com/watch?v=VGySONiY3Yg>. Acesso em: 27 de junho de 2020.

[5] Disponível em: <https://openai.com/blog/jukebox/>. Acesso em: 27 de junjho de 2020.

[6] Disponível em: <https://www.youtube.com/watch?v=m7u-y9oqUSw>. Acesso em: 27 de junho de 2020.

[7] Disponível em: <https://www.youtube.com/watch?v=ET-fpmq2bek&t=1s>. Acesso em: 27 de junho de 2020.

[8] Disponível em: <https://www.youtube.com/watch?v=iyemXtkB-xk>. Acesso em: 27 de junho de 2020.

[9] Disponível em: <https://www.theverge.com/2020/4/28/21240488/jay-z-deepfakes-roc-nation-youtube-removed-ai-copyright-impersonation>. Acesso em: 27 de junho de 2020.

[10] Disponível em: <https://waxy.org/2020/04/jay-z-orders-deepfake-audio-parodies-off-youtube/>. Acesso em: 27 de junho de 2020.

[11] Disponível em: <https://entretenimento.uol.com.br/noticias/redacao/2020/06/17/beyonce-e-jay-z-sao-processados-por-usar-voz-de-artista-em-faixa-diz-site.htm>. Acesso em: 27 de junho de 2020.

[12] Disponível em: <https://www.youtube.com/watch?v=kktRTmgLMjg>. Acesso em: 27 de junho de 2020.

[13] Disponível em: <https://olhardigital.com.br/noticia/youtuber-usou-inteligencia-artificial-para-criar-musica-do-nirvana/102353>. Acesso em: 27 de junho de 2020.

[14] REsp 1630851/SP, Rel. Ministro PAULO DE TARSO SANSEVERINO, TERCEIRA TURMA, julgado em 27/04/2017, DJe 22/06/2017.

[15] Disponível em: <https://www.conjur.com.br/2015-nov-08/empregado-teve-voz-usada-autorizacao-indenizado>. Acesso em: 27 de junho de 2020.


Cadastre-se e leia 10 matérias/mês de graça e receba conteúdo especializado

Cadastro Gratuito