Ligação de dados espaço-temporais e textuais de mídias sociais com locais de interesse visitados / Linking space-time and textual data from social media with visited sites of interest

Authors

  • Ad Nunes Ribeiro Brazilian Journals Publicações de Periódicos, São José dos Pinhais, Paraná
  • Renato Fileto
  • Italo Lopes Oliveira

DOI:

https://doi.org/10.34117/bjdv6n9-520

Keywords:

Postagens em mídias sociais, Dados ligados abertos, Dados geoespaciais, Ligação espacial, Enriquecimento semântico.

Abstract

Dados de mídias sociais são gerados constantemente e representam uma relevante fonte de informação atualizada nos dias atuais. Todavia, mí- dias sociais incluem dados semi-estruturados (e.g. coordenadas geográ- ficas opcionais, indicação de local) e não estruturados (e.g. textos de postagens) que precisam ter sua semântica correta explicitada. Uma das formas de fazer isso é através de anotações semânticas que ligam porções relevantes de dados (e.g. um tweet inteiro, menções a entida- des nomeadas) a descrições com semântica bem definida em base de dados (e.g. locais de interesse do OpenStreetMap) ou de conhecimento (e.g. DBpedia, LinkedGeoData). Este trabalho se propõe a estudar, selecionar, desenvolver e testar algoritmos para ligar dados de mídias sociais que possuam coordenadas geográficas e texto (e.g. tweets ge- orreferenciados) a lugares de interesse visitados, descritos em bases de dados ou de conhecimento com semântica bem definida. Esta tarefa pode não ser tão simples em certas situações, porque coordenadas cos- tumam ter precisão limitada e pode haver uma grande quantidade de locais de interesse próximos à coordenada da postagem e até mesmo locais de interesse com coordenadas praticamente sobrepostas (e.g. em um edifício com vários andares). Desta forma, foi implementado um algoritmo para ligação de dados sobre movimento que considera dois raios distintos: um menor em que basta proximidade para ligar com confiança e outro maior em que se requer também menção ao local vi- sitado no texto para aumentar a confiabilidade da ligação. Em ambos os casos, ambiguidades são resolvidas escolhendo o local de interesse com rótulo lexicalmente mais similar ao local mencionado no texto da postagem.

 

References

ABNT. Nbr 9241-11: Requisitos ergonômicos para trabalho de escritórios com computadores. In: Parte 11 – Orientações sobre Usabilidade. Rio de Janeiro, Brazil: [s.n.], 2002.

AGICHTEIN, E.; CASTILLO, C.; DONATO, D. Finding high-quality content in social media. 2008.

CAMBOIM, P. ARQUITETURA PARA INTEGRAÇÃODE DADOS INTERLIGADOS ABERTOS À INDE-BR. 2013.

<http://bdtd.ibict.br/vufind/Record/UFPR_b305290996977f7d37f11- 07442f53199/Details>. Acessado em 23/11/2016.

CODESCU, M. et al. Ontology-based route planning for openstreetmap. 2014.

<https://www.researchgate.net/publication/265203560_OSMonto_An_Ontology_of_OpenStreetMap_Tags>. Acessado em 16/05/2017.

FILETO, R. et al. Semantic enrichment and analysis of movement data: Probably it is just starting! Sigspatial, 2015.

FILETO, R. et al. The baquara 2 knowledge-based framework for semantic enrichment and analysis of movement data. Data & Knowledge Engineering, v. 98, p. 104–122, 2015.

FURLETTI, B. et al. Inferring human activities from gps tracks. UrbComp ’13 Proceedings of the 2nd ACM SIGKDD International Workshop on Urban Computing, 2013.

GAO, J.; CAO, B.; FAN, H. Point of interest data storage using ontology. 3rd International Conference on Systems and Informatics, p. 1122–1126, 2016.

HABIB, M. B.; KEULEN, M. van. Information extraction for social media. 2014.

IBM. IBM What is big data? - Bringing big data to the enterprise. 2012. <http://www-01.ibm.com/software/data/bigdata/what-is-big- data.html>. Acessado em 22/11/2016.

JORENTE, V.; OLIVEIRA, B. e. Information design and information science: A possible approach. XVI ENANCIB Informação, Memória e Patrimônio: do documento as redes, 2015.

KIM, Y.; PEREIRA, F. C.; ZHAO, F. Activity recognition for a smartphone based travel survey based on cross-user history data. Pattern Recognition (ICPR), 22nd International Conference on, 2014.

LóSCIO, B. Dados, Integração de Dados e Dados Interligados. 2012.

<http://dados.gov.br/wp/wpcontent/uploads/2012/10/workshop_BSB_02.pdf>. Acessado em 3/12/2016.

MEIJ, E.; WEERKAMP, W.; RIJKE, M. de. Adding semantics to microblog posts. 2012.

MORSTATTER, F.; GAO, H.; LIU, H. Discovering location information in social media. 2015.

SANG, T. K.; F, E.; MEULDER, F. D. Introduction to the conll-2003 shared task: Language-independent named entity recognition.

Proceedings of the seventh conference on Natural language learning at HLT-NAACL 2003, v. 4. Association for Computational Linguistics, p. 142–147, 2003.

UFSC. Coordenação de Projetos. Departamento de Informática e Estatística - INE. <http://projetos.inf.ufsc.br>. Acessado em 20/11/2016.

UFSC. O Departamento. Departamento de Informática e Estatística- INE. <http://ine.ufsc.br/o-departamento/>. Acessado em 20/11/2016.

UFSC. Regimento interno para elaboração de Trabalhos de Conclusão de Curso (TCC) de Ciências da Computação. Departamento de Informática e Estatística - INE. . Acessado em 20/11/2016.

UFSC. Sistema – TCC – UFSC. Departamento de Informática e Estatística - INE. <http://tcc.inf.ufsc.br>. Acessado em 20/11/2016.

WU, F. et al. Semantic annotation of mobility data using social media. WWW ’15 Proceedings of the 24th International Conference on World Wide Web, p. 1253–1263, 2015

Published

2020-09-22

How to Cite

Ribeiro, A. N., Fileto, R., & Oliveira, I. L. (2020). Ligação de dados espaço-temporais e textuais de mídias sociais com locais de interesse visitados / Linking space-time and textual data from social media with visited sites of interest. Brazilian Journal of Development, 6(9), 71022–71057. https://doi.org/10.34117/bjdv6n9-520

Issue

Section

Original Papers