CRUZ MATA , Fermín

Last name: CRUZ MATA

First name: Fermín

November 27, 2014 (v1)

Publication

Metadata-only

Extracción de Opiniones sobre Características : Un Enfoque Práctico Adaptable al Dominio

Cruz Mata, Fermín

En el contexto de la Web 2.0, las opiniones volcadas por los usuarios a través de las redes sociales, foros y otros servicios, acerca de productos, política u otras temáticas, conforman una interesantísima información con un gran potencial practico de car

Uploaded on: March 27, 2023
March 10, 2022 (v1)

Publication

Metadata-only

ITALICA at PAN 2013: An Ensemble Learning Approach to Author Profiling Notebook for PAN at CLEF 2013

Cruz Mata, Fermín Haro R. Rafa Ortega Rodríguez, Francisco Javier

This notebook discusses the approach to the Author Profiling task developed by the Italica group for PAN 2013. This system implements two different sets of classifiers which are combined later in order to build a final classifier that takes into account the decisions of the previous ones. The initial classifiers are focused on vector space...

Uploaded on: March 25, 2023
March 10, 2022 (v1)

Publication

Metadata-only

Aportaciones de una formalización de las interacciones producidas en un entorno que integra aprendizaje colaborativo al diseño de un curso virtual

Romero Moreno, Luisa María Troyano Jiménez, José Antonio Cruz Mata, Fermín

Esta comunicación presenta una formalización de las interacciones que se producen entre los estudiantes que participan en un curso virtual y que integra aprendizaje colaborativo. Para tratar de establecer en que contexto este aprendizaje es más eficiente que el individual, los experimentos que hayan de llevarse a cabo deben tener...

Uploaded on: December 4, 2022
July 18, 2020 (v1)

Publication

Metadata-only

Dynamic Topic-Related Tweet Retrieval

Cotelo Moya, Juan Manuel Cruz Mata, Fermín Troyano Jiménez, José Antonio

Twitter is a social network in which people publish publicly accessible brief, instant messages. With its exponential growth and the public nature and transversality of its contents, more researchers are using Twitter as a source of data for multiple purposes. In this context, the ability to retrieve those messages (tweets) related to a certain...

Uploaded on: March 27, 2023
July 21, 2020 (v1)

Publication

Metadata-only

Generación adaptativa de consultas para la recuperación temática de tweets

Cotelo Moya, Juan Manuel Cruz Mata, Fermín Troyano Jiménez, José Antonio

Twitter se ha convertido en un recurso con gran potencial a la hora de analizar los estados de opinión acerca de temas de actualidad. En el presente trabajo mostramos la metodología utilizada para la obtención de un corpus de mensajes de Twitter relacionados con las elecciones generales españolas del 20 de noviembre de 2011. Dado que el acceso...

Uploaded on: March 27, 2023
March 10, 2022 (v1)

Publication

Metadata-only

Ampliación de lexicones de opinión específicos de dominio usando representaciones continuas de palabras

López Solaz, Tomás Cruz Mata, Fermín Enríquez de Salamanca Ros, Fernando

En este trabajo abordamos la ampliación de lexicones de opinión específicos de dominio a partir de textos del dominio elegido. El método se basa en la construcción de clasificadores que catalogan las palabras de entrada como positivas, negativas o neutras, y en un criterio estricto de selección de las palabras que pretende garantizar la...

Uploaded on: March 25, 2023
August 5, 2020 (v1)

Publication

Metadata-only

Resource-based lexical approach to TWEET-NORM task

Cotelo Moya, Juan Manuel Cruz Mata, Fermín Troyano Jiménez, José Antonio

Este artículo propone una aproximación léxica basada en recursos para abordar la tarea TWEET-NORM. El sistema presenta una arquitectura modular sencilla pero extensible en la cual cada módulo de análisis propone candidatos para cada palabra OOV de forma independiente. Cada uno de estos módulos de análisis intenta abordar una problemática...

Uploaded on: March 27, 2023
July 18, 2020 (v1)

Publication

Metadata-only

Cross-domain polarity classification using a knowledge-enhanced meta-classifier

Franco Salvador, Marc Cruz Mata, Fermín Troyano Jiménez, José Antonio

Current approaches to single and cross-domain polarity classification usually use bag of words, n-grams or lexical resource-based classifiers. In this paper, we propose the use of meta-learning to combine and enrich those approaches by adding also other knowledge-based features. In addition to the aforementioned classical approaches, our system...

Uploaded on: December 4, 2022
August 5, 2020 (v1)

Publication

Metadata-only

Supervised TextRank

Cruz Mata, Fermín Troyano Jiménez, José Antonio Enríquez de Salamanca Ros, Fernando

In this paper we investigate how to adapt the TextRank method to make it work in a supervised way. TextRank is a graph based method that applies the ideas of the ranking algorithm used in Google (PageRank) to Natural Language Processing (NLP) tasks. This approach has given very good results in many NLP tasks like text summarization, keyword...

Uploaded on: March 27, 2023
August 5, 2020 (v1)

Publication

Metadata-only

Spam detection with a content-based random-walk algorithm

Ortega Rodríguez, Francisco Javier MacDonald, Craig Troyano Jiménez, José Antonio

In this work we tackle the problem of the spam detection on the Web. Spam web pages have become a problem for Web search engines, due to the negative effects that this phe-nomenon can cause in their retrieval results. Our approach is based on a random-walk algorithm that obtains a ranking of pages according to their relevance and their spam...

Uploaded on: December 5, 2022
August 4, 2020 (v1)

Publication

Metadata-only

ML-SentiCon: Un lexicón multilingüe de polaridades semánticas a nivel de lemas

Cruz Mata, Fermín Troyano Jiménez, José Antonio Pontes Balanza, Beatriz

En este trabajo presentamos un conjunto de lexicones de polaridades semánticas a nivel de lemas para inglés, español, catalán, gallego y euskera. Estos lexicones están estructurados en capas, lo que permite seleccionar distintos compromisos entre la cantidad de estimaciones de positividad y negatividad y la precisión de dichas estimaciones. Los...

Uploaded on: March 27, 2023
July 16, 2020 (v1)

Publication

Metadata-only

Building layered, multilingual sentiment lexicons at synset and lemma levels

Cruz Mata, Fermín Troyano Jiménez, José Antonio Pontes Balanza, Beatriz

Many tasks related to sentiment analysis rely on sentiment lexicons, lexical resources containing information about the emotional implications of words (e.g., sentiment orientation of words, positive or negative). In this work, we present an automatic method for building lemma-level sentiment lexicons, which has been applied to obtain lexicons...

Uploaded on: December 4, 2022
December 16, 2022 (v1)

Publication

Metadata-only

Explorando la generación de contenido online por el usuario y su influencia predictiva en la Calidad Relacional. Aplicación al sector hotelero de Andalucía

Sánchez Franco, Manuel Jesús Troyano Jiménez, José Antonio Cruz Mata, Fermín

Nuestro proyecto se centra en la identificación de factores competitivos de los establecimientos hoteleros en Andalucía. Para ello usaremos técnicas de Procesamiento del Lenguaje Natural aplicadas a las opiniones online publicadas por los usuarios, a través de plataformas de infomediación como TripAdvisor. Estamos especialmente interesados en...

Uploaded on: March 24, 2023
July 19, 2020 (v1)

Publication

Metadata-only

Explorando Twitter mediante la integración de información estructurada y no estructurada

Cotelo Moya, Juan Manuel Cruz Mata, Fermín Ortega Rodríguez, Francisco Javier

En este artículo mostramos cómo es posible sacar partido de la información estructurada que proporciona la red social Twitter. Los textos escritos en Twitter son cortos y de baja calidad, lo que dificulta la aplicación de técnicas y herramientas que tradicionalmente se han venido usando para procesar textos en lenguaje natural. Sin embargo,...

Uploaded on: March 27, 2023
August 3, 2020 (v1)

Publication

Metadata-only

Inducción de un Lexicón de Opinión Orientado al Dominio

Cruz Mata, Fermín Troyano Jiménez, José Antonio Ortega Rodríguez, Francisco Javier

En el presente trabajo mostramos la metodología utilizada para la construcción de un lexicón en inglés compuesto de adjetivos y sus orientaciones semánticas. En lugar de calcular un único valor por término, inducimos un conjunto de valores que codifican la orientación semántica de un término cuando es utilizado en distintos dominios. La...

Uploaded on: March 27, 2023
March 11, 2022 (v1)

Publication

Metadata-only

PolaritySpam: Propagating Content-based Information Through a Web-Graph to Detect Web Spam

Ortega Rodríguez, Francisco Javier Troyano Jiménez, José Antonio Cruz Mata, Fermín

Spam web pages have become a problem for Information Retrieval systems due to the negative effects that this phenomenon can cause in their results. In this work we tackle the problem of detecting these pages with a propagation algorithm that, taking as input a web graph, chooses a set of spam and not-spam web pages in order to spread their spam...

Uploaded on: March 25, 2023
July 9, 2020 (v1)

Publication

Metadata-only

A modular approach for lexical normalization applied to Spanish tweets

Cotelo Moya, Juan Manuel Cruz Mata, Fermín Troyano Jiménez, José Antonio

Twitter is a social media platform with widespread success where millions of people continuously express ideas and opinions about a myriad of topics. It is a huge and interesting source of data but most of these texts are usually written hastily and very abbreviated, rendering them unsuitable for traditional Natural Language Processing (NLP)....

Uploaded on: March 27, 2023
March 10, 2022 (v1)

Publication

Metadata-only

Detecciòn de Spam en la Web mediante el análisis de texto y de grafos

Ortega Rodríguez, Francisco Javier Troyano Jiménez, José Antonio Cruz Mata, Fermín

El spam en la web representa un grave problema para los sistemas de Recuperación de Información, debido al perjuicio que puede ocasionar en la calidad de los resultados de los mismos. En este trabajo se presenta un sistema de detección de spam en la web basado en un algoritmo de ranking que ordena las páginas web de acuerdo a su reevancia,...

Uploaded on: March 25, 2023
July 14, 2020 (v1)

Publication

Metadata-only

Ampliación automática de corpus mediante la colaboración de varios etiquetadores

Enríquez de Salamanca Ros, Fernando Troyano Jiménez, José Antonio Cruz Mata, Fermín

La disponibilidad de grandes corpus con texto etiquetado es un aspecto esencial en muchas tareas del procesamiento del lenguaje natural. El esfuerzo que se requiere para etiquetar manualmente este gran número de frases ha animado a los investigadores a crear aplicaciones automáticas para este trabajo. Nuestra propuesta representa un método para...

Uploaded on: December 4, 2022
July 19, 2020 (v1)

Publication

Metadata-only

Enriching User Reviews Through An Opinion Extraction System

Ortega Rodríguez, Francisco Javier Troyano Jiménez, José Antonio Cruz Mata, Fermín

Las webs basadas en el contenido generado por usuarios (UGC) tienen una aplicabilidad potencial en un gran número de campos. En este trabajo rea lizamos un estudio de la utilidad de estos sistemas para determinar la percepción de los usuarios expresada en sus opiniones sobre productos o servicios. Para ello, hemos compilado y analizado...

Uploaded on: March 27, 2023
July 17, 2020 (v1)

Publication

Metadata-only

Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en español

Cruz Mata, Fermín Troyano Jiménez, José Antonio Enríquez de Salamanca Ros, Fernando

En los últimos años se ha producido un creciente interés por el procesamiento automático de las opiniones contenidas en documentos de texto, en parte como consecuencia del aumento exponencial de contenidos generados por usuarios en la Web 2.0, y por el interés entre otros de empresas y gobiernos en analizar, filtrar o detectar automáticamente...

Uploaded on: March 27, 2023
July 16, 2020 (v1)

Publication

Metadata-only

Automatic Expansion of Feature-Level Opinion Lexicons

Cruz Mata, Fermín Troyano Jiménez, José Antonio Ortega Rodríguez, Francisco Javier

In most tasks related to opinion mining and sentiment analysis, it is necessary to compute the semantic orientation (i.e., positive or negative evaluative implications) of certain opinion expressions. Recent works suggest that semantic orientation depends on application domains. Moreover, we think that semantic orientation depends on the...

Uploaded on: December 5, 2022
August 4, 2020 (v1)

Publication

Metadata-only

PolarityRank: Finding an equilibrium between followers and contraries in a network

Cruz Mata, Fermín García Vallejo, Carlos Antonio Enríquez de Salamanca Ros, Fernando

In this paper we present the relevance ranking algorithm named PolarityRank. This algorithm is inspired in PageRank, the webpage relevance calculus method used by Google, and generalizes it to deal with graphs having not only positive but also negative weighted arcs. Besides the definition of our algorithm, this paper includes the algebraic...

Uploaded on: December 5, 2022
July 17, 2020 (v1)

Publication

Metadata-only

Construcción de un sistema PLN usando el framework UIMA

Cruz Mata, Fermín Troyano Jiménez, José Antonio Enríquez de Salamanca Ros, Fernando

Este trabajo resume una experiencia de uso de UIMA (Unstructured Information Management Architecture), una plataforma que permite la creación e integración de aplicaciones que procesen información no estructurada como textos en lenguaje natural, audio o vídeo. La característica más importante de UIMA es la interoperabilidad ya que permite la...

Uploaded on: March 27, 2023

CRUZ MATA , Fermín

Recent uploads