Mostrar el registro sencillo del ítem

dc.contributor.authorHernández-Pajares, Beatriz
dc.contributor.authorPérez-Marín, Diana
dc.contributor.authorFrías-Martínez, Vanessa
dc.date.accessioned2021-04-21T16:55:17Z
dc.date.available2021-04-21T16:55:17Z
dc.date.issued2020-01-30
dc.identifierhttps://revistas.itm.edu.co/index.php/tecnologicas/article/view/1454
dc.identifier10.22430/22565337.1454
dc.identifier.urihttp://hdl.handle.net/20.500.12622/4600
dc.description.abstractLas redes sociales acumulan gran cantidad de información. Las actuales técnicas de Procesamiento de Lenguaje Natural permiten su procesamiento automático y las técnicas de Minería de Datos permiten extraer datos útiles a partir de la información recopilada y procesada. Sin embargo, de la revisión del estado del arte, se observa que la mayoría de los métodos de clasificación de los datos identificados y extraídos de redes sociales son biclase. Esto no es suficiente para algunas áreas de clasificación, en las que hay más de dos clases a considerar. En este artículo, se aporta un estudio comparativo de los métodos svm y Random Forests, para la identificación automática de n-clases en microblogging de redes sociales. Los datos recopilados automáticamente para el estudio están conformados por 190 000 tweets de cuatro organismos oficiales: Metro, Protección Civil, Policía, y Gobierno de México. De los resultados obtenidos, se recomienda el uso de Random Forests, ya que se consigue una precisión media del 81.46 % y una cobertura media del 59.88 %, con nueve tipos de quejas identificadas automáticamente.  spa
dc.format.mimetypeapplication/pdf
dc.language.isospa
dc.publisherInstituto Tecnológico Metropolitano - ITMspa
dc.relationhttps://revistas.itm.edu.co/index.php/tecnologicas/article/view/1454
dc.relation10.22430/22565337.1454
dc.rightsCopyright (c) 2020 TecnoLógicasspa
dc.rightshttp://creativecommons.org/licenses/by-nc-sa/4.0spa
dc.source2256-5337
dc.source0123-7799
dc.sourceTecnoLógicas; Vol. 23 No. 47 (2020); 109-120eng
dc.sourceTecnoLógicas; Vol. 23 Núm. 47 (2020); 109-120spa
dc.subjectMinería de textospa
dc.subjectclasificación multiclasespa
dc.subjectredes socialesspa
dc.subjectTwitterspa
dc.titleVisualization and Multiclass Classification of Complaints to Official Organisms on Twitterspa
dc.title.alternativeClasificación multiclase y visualización de quejas de organismos oficiales en twittereng
dc.type.spaArtículosspa
dc.subject.keywordsText Miningeng
dc.subject.keywordsMulticlass Classificationeng
dc.subject.keywordsSocial Networkseng
dc.subject.keywordsTwittereng
dc.typeinfo:eu-repo/semantics/article
dc.typeinfo:eu-repo/semantics/publishedVersion
dc.typeArticleseng
dc.relation.ispartofjournalTecnoLógicas
dc.description.abstractenglishSocial networks generate massive amounts of information. Current Natural Language techniques allow the automatic processing of that information, and Data Mining enables the automatic extraction of useful info. However, a state-of-the-art review reveals that many classification methods only distinguish two classes. This paper presents a procedure to automatically classify tweets into several classes (more than two). The steps of the procedure are described in detail so that any researcher can follow them. The accuracy and coverage (instead of only coverage as usual in the literature) of two automatic classifiers (SVM and Random Forests) were analyzed in a comparative study. The procedure was applied to automatically identify more than two types of complaint from 190,000 tweets. According to the results, Random Forests should be used because they achieve an average accuracy of 81.46 % and an average coverage of 59.88 %.eng
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.type.coarhttp://purl.org/coar/resource_type/c_6501


Ficheros en el ítem

FicherosTamañoFormatoVer

No hay archivos asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem