En el contexto de la Web 2.0, las opiniones volcadas por los usuarios a través de las redes sociales, foros y otros servicios, acerca de productos, política u otras temáticas, conforman una interesantísima información con un gran potencial practico de car
-
November 27, 2014 (v1)PublicationUploaded on: March 27, 2023
-
March 10, 2022 (v1)PublicationITALICA at PAN 2013: An Ensemble Learning Approach to Author Profiling Notebook for PAN at CLEF 2013
This notebook discusses the approach to the Author Profiling task developed by the Italica group for PAN 2013. This system implements two different sets of classifiers which are combined later in order to build a final classifier that takes into account the decisions of the previous ones. The initial classifiers are focused on vector space...
Uploaded on: March 25, 2023 -
March 10, 2022 (v1)Publication
Esta comunicación presenta una formalización de las interacciones que se producen entre los estudiantes que participan en un curso virtual y que integra aprendizaje colaborativo. Para tratar de establecer en que contexto este aprendizaje es más eficiente que el individual, los experimentos que hayan de llevarse a cabo deben tener...
Uploaded on: December 4, 2022 -
July 18, 2020 (v1)Publication
Twitter is a social network in which people publish publicly accessible brief, instant messages. With its exponential growth and the public nature and transversality of its contents, more researchers are using Twitter as a source of data for multiple purposes. In this context, the ability to retrieve those messages (tweets) related to a certain...
Uploaded on: March 27, 2023 -
July 21, 2020 (v1)Publication
Twitter se ha convertido en un recurso con gran potencial a la hora de analizar los estados de opinión acerca de temas de actualidad. En el presente trabajo mostramos la metodología utilizada para la obtención de un corpus de mensajes de Twitter relacionados con las elecciones generales españolas del 20 de noviembre de 2011. Dado que el acceso...
Uploaded on: March 27, 2023 -
March 10, 2022 (v1)Publication
En este trabajo abordamos la ampliación de lexicones de opinión específicos de dominio a partir de textos del dominio elegido. El método se basa en la construcción de clasificadores que catalogan las palabras de entrada como positivas, negativas o neutras, y en un criterio estricto de selección de las palabras que pretende garantizar la...
Uploaded on: March 25, 2023 -
August 5, 2020 (v1)Publication
Este artículo propone una aproximación léxica basada en recursos para abordar la tarea TWEET-NORM. El sistema presenta una arquitectura modular sencilla pero extensible en la cual cada módulo de análisis propone candidatos para cada palabra OOV de forma independiente. Cada uno de estos módulos de análisis intenta abordar una problemática...
Uploaded on: March 27, 2023 -
July 18, 2020 (v1)Publication
Current approaches to single and cross-domain polarity classification usually use bag of words, n-grams or lexical resource-based classifiers. In this paper, we propose the use of meta-learning to combine and enrich those approaches by adding also other knowledge-based features. In addition to the aforementioned classical approaches, our system...
Uploaded on: December 4, 2022 -
August 5, 2020 (v1)Publication
In this paper we investigate how to adapt the TextRank method to make it work in a supervised way. TextRank is a graph based method that applies the ideas of the ranking algorithm used in Google (PageRank) to Natural Language Processing (NLP) tasks. This approach has given very good results in many NLP tasks like text summarization, keyword...
Uploaded on: March 27, 2023 -
August 5, 2020 (v1)Publication
In this work we tackle the problem of the spam detection on the Web. Spam web pages have become a problem for Web search engines, due to the negative effects that this phe-nomenon can cause in their retrieval results. Our approach is based on a random-walk algorithm that obtains a ranking of pages according to their relevance and their spam...
Uploaded on: December 5, 2022 -
August 4, 2020 (v1)Publication
En este trabajo presentamos un conjunto de lexicones de polaridades semánticas a nivel de lemas para inglés, español, catalán, gallego y euskera. Estos lexicones están estructurados en capas, lo que permite seleccionar distintos compromisos entre la cantidad de estimaciones de positividad y negatividad y la precisión de dichas estimaciones. Los...
Uploaded on: March 27, 2023 -
July 16, 2020 (v1)Publication
Many tasks related to sentiment analysis rely on sentiment lexicons, lexical resources containing information about the emotional implications of words (e.g., sentiment orientation of words, positive or negative). In this work, we present an automatic method for building lemma-level sentiment lexicons, which has been applied to obtain lexicons...
Uploaded on: December 4, 2022 -
December 16, 2022 (v1)Publication
Nuestro proyecto se centra en la identificación de factores competitivos de los establecimientos hoteleros en Andalucía. Para ello usaremos técnicas de Procesamiento del Lenguaje Natural aplicadas a las opiniones online publicadas por los usuarios, a través de plataformas de infomediación como TripAdvisor. Estamos especialmente interesados en...
Uploaded on: March 24, 2023 -
July 19, 2020 (v1)Publication
En este artículo mostramos cómo es posible sacar partido de la información estructurada que proporciona la red social Twitter. Los textos escritos en Twitter son cortos y de baja calidad, lo que dificulta la aplicación de técnicas y herramientas que tradicionalmente se han venido usando para procesar textos en lenguaje natural. Sin embargo,...
Uploaded on: March 27, 2023 -
August 3, 2020 (v1)Publication
En el presente trabajo mostramos la metodología utilizada para la construcción de un lexicón en inglés compuesto de adjetivos y sus orientaciones semánticas. En lugar de calcular un único valor por término, inducimos un conjunto de valores que codifican la orientación semántica de un término cuando es utilizado en distintos dominios. La...
Uploaded on: March 27, 2023 -
March 11, 2022 (v1)Publication
Spam web pages have become a problem for Information Retrieval systems due to the negative effects that this phenomenon can cause in their results. In this work we tackle the problem of detecting these pages with a propagation algorithm that, taking as input a web graph, chooses a set of spam and not-spam web pages in order to spread their spam...
Uploaded on: March 25, 2023 -
July 9, 2020 (v1)Publication
Twitter is a social media platform with widespread success where millions of people continuously express ideas and opinions about a myriad of topics. It is a huge and interesting source of data but most of these texts are usually written hastily and very abbreviated, rendering them unsuitable for traditional Natural Language Processing (NLP)....
Uploaded on: March 27, 2023 -
March 10, 2022 (v1)Publication
El spam en la web representa un grave problema para los sistemas de Recuperación de Información, debido al perjuicio que puede ocasionar en la calidad de los resultados de los mismos. En este trabajo se presenta un sistema de detección de spam en la web basado en un algoritmo de ranking que ordena las páginas web de acuerdo a su reevancia,...
Uploaded on: March 25, 2023 -
July 14, 2020 (v1)Publication
La disponibilidad de grandes corpus con texto etiquetado es un aspecto esencial en muchas tareas del procesamiento del lenguaje natural. El esfuerzo que se requiere para etiquetar manualmente este gran número de frases ha animado a los investigadores a crear aplicaciones automáticas para este trabajo. Nuestra propuesta representa un método para...
Uploaded on: December 4, 2022 -
July 19, 2020 (v1)Publication
Las webs basadas en el contenido generado por usuarios (UGC) tienen una aplicabilidad potencial en un gran número de campos. En este trabajo rea lizamos un estudio de la utilidad de estos sistemas para determinar la percepción de los usuarios expresada en sus opiniones sobre productos o servicios. Para ello, hemos compilado y analizado...
Uploaded on: March 27, 2023 -
July 17, 2020 (v1)Publication
En los últimos años se ha producido un creciente interés por el procesamiento automático de las opiniones contenidas en documentos de texto, en parte como consecuencia del aumento exponencial de contenidos generados por usuarios en la Web 2.0, y por el interés entre otros de empresas y gobiernos en analizar, filtrar o detectar automáticamente...
Uploaded on: March 27, 2023 -
July 16, 2020 (v1)Publication
In most tasks related to opinion mining and sentiment analysis, it is necessary to compute the semantic orientation (i.e., positive or negative evaluative implications) of certain opinion expressions. Recent works suggest that semantic orientation depends on application domains. Moreover, we think that semantic orientation depends on the...
Uploaded on: December 5, 2022 -
August 4, 2020 (v1)Publication
In this paper we present the relevance ranking algorithm named PolarityRank. This algorithm is inspired in PageRank, the webpage relevance calculus method used by Google, and generalizes it to deal with graphs having not only positive but also negative weighted arcs. Besides the definition of our algorithm, this paper includes the algebraic...
Uploaded on: December 5, 2022 -
July 17, 2020 (v1)Publication
Este trabajo resume una experiencia de uso de UIMA (Unstructured Information Management Architecture), una plataforma que permite la creación e integración de aplicaciones que procesen información no estructurada como textos en lenguaje natural, audio o vídeo. La característica más importante de UIMA es la interoperabilidad ya que permite la...
Uploaded on: March 27, 2023