Detecção de fake news em um tweet utilizando machine learning e processamento de linguagem natural / Detecting fake news in a tweet using machine learning and natural language processing

Ayrton Domingos Lorenceti, Giancarlo Dondoni Salton

Abstract


Nos últimos anos o Brasil sofreu uma democratização do acesso à tecnologia e informação, fazendo com que camadas mais carentes da população adquirissem acesso a esses recursos. Com isso, aplicativos de mensagens e redes sociais se tornaram fontes primárias de informação entre os brasileiros. Nesse ambiente cibernético, notícias circulam com imensa velocidade por serem compartilhadas em tempo real, alcançando uma enorme quantidade de pessoas em pouco tempo. Da mesma forma que as notícias publicadas por veículos de comunicação profissionais, as notícias falsas – as chamadas fake news – se beneficiam dessa velocidade de compartilhamento da informação. Estando diariamente expostos a milhares de notícias, não há como fazer a verificação de veracidade de todas as notícias por se tratar de uma tarefa trabalhosa, muitas vezes demorada, e que nem sempre retorna informações suficientes para uma conclusão definitiva. Com o objetivo de facilitar a verificação de fake news, esta pesquisa conduziu o treinamento de modelos de Aprendizado de Máquina, associados à técnicas de Processo de Linguagem Natural, para verificar se um tweet em português contém fake news utilizando uma amostra com 344 tweets classificados manualmente. Ao final do trabalho, nenhum dos modelos treinados conseguiu detectar fake news com alto grau de confiança devido a uma baixa quantidade de exemplos de tweets com fake news visto que, apesar de fake news ser um fenômeno que ocorre frequentemente na internet, exemplos específicos e sem repetição (ou seja, sem retweets) são mais raros de se encontrar. Apesar disso, o trabalho mostrou-se frutífero e dá indícios de que com uma quantia adequada de exemplos é possível gerar um modelo de Aprendizado de Máquina para detecção destas fake news em tweets.


Keywords


aprendizado de máquina, processamento de linguagem natural, twitter, fake news.

References


ALLCOTT, Hunt; GENTZKOW, Matthew. Social Media and Fake News in the 2016

Election. Journal Of Economic Perspectives, [s.l.], v. 31, n. 2, p. 211-236, maio 2017.

American Economic Association. http://dx.doi.org/10.1257/jep.31.2.211. Disponível em:

. Acesso em: 17 abr. 2020.

Data Science Academy. Deep Learning Book, 2019. Disponível em:

. Acesso em: 21 jun. 2020.

GOODFELLOW, Ian et al. Deep Learning. [s.i]: The Mit Press, 2016. 800 p. (Adaptive

Computation and Machine Learning series).

HERMIDA, Alfred. TWITTERING THE NEWS. Journalism Practice, [s.l.], v. 4, n. 3, p. 297-308, ago. 2010. Informa UK Limited. http://dx.doi.org/10.1080/17512781003640703. Disponível em: . Acesso em: 06 abr. 2020.

LANGLEY, Pat; SIMON, Herbert A. Applications of machine learning and rule

induction. Communications Of The Acm, [s.l.], v. 38, n. 11, p. 54-64, 1 nov. 1995.

Association for Computing Machinery (ACM). http://dx.doi.org/10.1145/219717.219768.

Disponível em: . Acesso em: 16 maio

LAVADO, Thiago. G1. Uso da internet no Brasil cresce, e 70% da população está conectada. 2019. Disponível em: . Acesso em: 12 ago. 2020.

MONT’ALVERNE, Camila; MITOZO, Isabele. MUITO ALÉM DA MAMADEIRA ERÓTICA: as notícias compartilhadas nas redes de apoio a presidenciáveis em grupos de whatsapp, nas eleições brasileiras de 2018. In: CONGRESSO DA ASSOCIAÇÃO BRASILEIRA DE PESQUISADORES EM COMUNICAÇÃO E POLÍTICA, 8., 2019, Curitiba - Paraná. [s.i]. Brasília - Distrito Federal: Associação Brasileira de Pesquisadores em Comunicação e Política, 2019. [s.i], [s.i]-[ s.i].

QUEIROZ

RICH, Elaine; KNIGHT, Kevin. Artificial Intelligence: a modern approach. 2. ed. New York: Prentice Hall, 1995. 946 p. Disponível em: . Acesso em: 30 out. 2020.

RUSSELL, Stuart; NORVIG, Peter. Inteligência Artificial. 3. ed. Rio de Janeiro: 2013. 1324p.

SCHU, Kai; SLIVA, Amy; WANG, Suhang; TANG, Jiliang; LIU, Huan. Fake News Detection on Social Media: A Data Mining Perspective. arXiv, 2017. Disponível em < https://arxiv.org/pdf/1708.01967.pdf>

TANDOC, Edson C.; LIM, Zheng Wei; LING, Richard. Defining “Fake News”. Digital

Journalism, [s.l.], v. 6, n. 2, p. 137-153, 30 ago. 2017. Informa UK Limited. 38

http://dx.doi.org/10.1080/21670811.2017.1360143. Disponível em:

. Acesso em: 04

abr. 2020.




DOI: https://doi.org/10.34117/bjdv8n6-071