Información del autor
Autor Savoy, Jacques |
Documentos disponibles escritos por este autor (2)



10th International Conference of the CLEF Association, CLEF 2019, Lugano, Switzerland, September 9–12, 2019, Proceedings / Crestani, Fabio ; Braschler, Martin ; Savoy, Jacques ; Rauber, Andreas ; Müller, Henning ; Losada, David E. ; Heinatz Bürki, Gundula ; Cappellato, Linda ; Ferro, Nicola
![]()
TÃtulo : 10th International Conference of the CLEF Association, CLEF 2019, Lugano, Switzerland, September 9–12, 2019, Proceedings Tipo de documento: documento electrónico Autores: Crestani, Fabio, ; Braschler, Martin, ; Savoy, Jacques, ; Rauber, Andreas, ; Müller, Henning, ; Losada, David E., ; Heinatz Bürki, Gundula, ; Cappellato, Linda, ; Ferro, Nicola, Mención de edición: 1 ed. Editorial: [s.l.] : Springer Fecha de publicación: 2019 Número de páginas: XVIII, 434 p. 128 ilustraciones, 49 ilustraciones en color. ISBN/ISSN/DL: 978-3-030-28577-7 Nota general: Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos. Idioma : Inglés (eng) Palabras clave: Procesamiento del lenguaje natural (Informática) Red de computadoras Ciencias sociales Procesamiento del lenguaje natural (PNL) Redes de comunicación informática Aplicación informática en ciencias sociales y del comportamiento. Clasificación: 006.35 Resumen: Este libro constituye las actas arbitradas de la 10ª Conferencia Internacional de la Asociación CLEF, CLEF 2019, celebrada en Lugano, Suiza, en septiembre de 2019. La conferencia se centra claramente en la recuperación de información experimental, con especial atención a los desafÃos de la multimodalidad, el multilingüismo y la búsqueda interactiva, que abarca desde datos no estructurados hasta semiestructurados y estructurados. Los 7 artÃculos completos y los 8 artÃculos breves presentados en este volumen fueron cuidadosamente revisados ​​y seleccionados entre 30 presentaciones. Este año, muchas contribuciones abordan las redes sociales con la detección de posturas o la identificación temprana de signos de depresión en Twitter en un contexto interlingüÃstico. Además, este volumen presenta 7 artÃculos "lo mejor de los laboratorios" que se revisaron como una presentación de artÃculo completo con los mismos criterios de revisión. Los laboratorios representaron desafÃos cientÃficos basados ​​en nuevos conjuntos de datos y problemas del mundo real en el acceso a información multimodal y multilingüe. Además de esto, 9 laboratorios de evaluación comparativa informaron los resultados de sus actividades de un año en charlas generales y sesiones de laboratorio. Nota de contenido: What Happened in CLEF... For a While? -- Crosslingual depression detection in Twitter using bilingual word alignments -- Studying the Variability of System Setting Effectiveness by Data Analytics and Visualization -- Stance Detection in Web and Social Media : A Comparative Study -- TwitCID: a Collection of Data Sets for Studies on Information Diffusion on Social Networks -- Sonny, Cerca! Evaluating the Impact of Using a Vocal Assistant to Search at School -- Generating Cross-Domain Text Corpora from Social Media Comments -- Efficient Answer-Annotation for Frequent Questions -- Improving Ranking for Systematic Reviews Using Query Adaptation -- Analyzing the adequacy of readability indicators to a non-English language -- How many labels? Determining the Number of Labels in Multi-Label Text Classiï¬cation -- Using Audio Transformations to Improve Comprehension in Voice Question Answering -- A User Modeling Shared Challenge Proposal -- How Lexical Gold Standards Have Effects On The Usefulness Of Text Analysis Tools For Digital Scholarship -- Personality facets recognition from text -- Unsupervised System Combination for Set-based Retrieval with Expectation Maximization -- An Ensemble Approach to Cross-Domain Authorship Attribution -- Evaluation of Deep Species Distribution Models using Environment and Co-occurrences -- Interactive Learning-based Retrieval Technique for Visual Lifelogging -- An Effective Deep Transfer Learning and Information Fusion Framework for Medical Visual Question Answering -- Language Modeling in Temporal Mood Variation Models for Early Risk Detection on The Internet -- Medical Image Labeling and Semantic Understanding for Clinical Applications -- To Check or not to Check: Syntax, Semantics, and Context in the Language of Check-worthy Claims -- Overview of CENTRE@CLEF 2019: Sequel in the Systematic Reproducibility Realm -- Overview of the CLEF-2019 CheckThat!: Automatic Identiï¬cation and Veriï¬cation of Claims -- Overview of the CLEF eHealth Evaluation Lab 2019 -- Overview of eRisk 2019: Early Risk Prediction on the Internet -- ImageCLEF 2019: Multimedia Retrieval in Medicine, Lifelogging, Security and Nature -- Overview of LifeCLEF 2019: Identiï¬cation of Amazonian Plants, South & North American Birds, and Niche Prediction -- Overview of PAN 2019: Bots and Gender Proï¬ling, Celebrity Proï¬ling, Cross-domain Authorship Attribution and Style Change Detection -- Overview of the CLEF 2019 Personalised Information Retrieval Lab (PIR-CLEF 2019) -- Overview of CLEF 2019 Lab ProtestNews: Extracting Protests from News in a Cross-context Setting. Tipo de medio : Computadora Summary : This book constitutes the refereed proceedings of the 10th International Conference of the CLEF Association, CLEF 2019, held in Lugano, Switzerland, in September 2019. The conference has a clear focus on experimental information retrieval with special attention to the challenges of multimodality, multilinguality, and interactive search ranging from unstructured to semi structures and structured data. The 7 full papers and 8 short papers presented in this volume were carefully reviewed and selected from 30 submissions. This year, many contributions tackle the social networks with the detection of stances or early identiï¬cation of depression signs on Twitter in a cross-lingual context. Further this volume presents 7 "best of the labs" papers which were reviewed as a full paper submission with the same review criteria. The labs represented scientific challenges based on new data sets and real world problems in multimodal and multilingual information access. In addition to this, 9 benchmarking labs reported results of their yearlong activities in overview talks and lab sessions. Enlace de acceso : https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...] 10th International Conference of the CLEF Association, CLEF 2019, Lugano, Switzerland, September 9–12, 2019, Proceedings [documento electrónico] / Crestani, Fabio, ; Braschler, Martin, ; Savoy, Jacques, ; Rauber, Andreas, ; Müller, Henning, ; Losada, David E., ; Heinatz Bürki, Gundula, ; Cappellato, Linda, ; Ferro, Nicola, . - 1 ed. . - [s.l.] : Springer, 2019 . - XVIII, 434 p. 128 ilustraciones, 49 ilustraciones en color.
ISBN : 978-3-030-28577-7
Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos.
Idioma : Inglés (eng)
Palabras clave: Procesamiento del lenguaje natural (Informática) Red de computadoras Ciencias sociales Procesamiento del lenguaje natural (PNL) Redes de comunicación informática Aplicación informática en ciencias sociales y del comportamiento. Clasificación: 006.35 Resumen: Este libro constituye las actas arbitradas de la 10ª Conferencia Internacional de la Asociación CLEF, CLEF 2019, celebrada en Lugano, Suiza, en septiembre de 2019. La conferencia se centra claramente en la recuperación de información experimental, con especial atención a los desafÃos de la multimodalidad, el multilingüismo y la búsqueda interactiva, que abarca desde datos no estructurados hasta semiestructurados y estructurados. Los 7 artÃculos completos y los 8 artÃculos breves presentados en este volumen fueron cuidadosamente revisados ​​y seleccionados entre 30 presentaciones. Este año, muchas contribuciones abordan las redes sociales con la detección de posturas o la identificación temprana de signos de depresión en Twitter en un contexto interlingüÃstico. Además, este volumen presenta 7 artÃculos "lo mejor de los laboratorios" que se revisaron como una presentación de artÃculo completo con los mismos criterios de revisión. Los laboratorios representaron desafÃos cientÃficos basados ​​en nuevos conjuntos de datos y problemas del mundo real en el acceso a información multimodal y multilingüe. Además de esto, 9 laboratorios de evaluación comparativa informaron los resultados de sus actividades de un año en charlas generales y sesiones de laboratorio. Nota de contenido: What Happened in CLEF... For a While? -- Crosslingual depression detection in Twitter using bilingual word alignments -- Studying the Variability of System Setting Effectiveness by Data Analytics and Visualization -- Stance Detection in Web and Social Media : A Comparative Study -- TwitCID: a Collection of Data Sets for Studies on Information Diffusion on Social Networks -- Sonny, Cerca! Evaluating the Impact of Using a Vocal Assistant to Search at School -- Generating Cross-Domain Text Corpora from Social Media Comments -- Efficient Answer-Annotation for Frequent Questions -- Improving Ranking for Systematic Reviews Using Query Adaptation -- Analyzing the adequacy of readability indicators to a non-English language -- How many labels? Determining the Number of Labels in Multi-Label Text Classiï¬cation -- Using Audio Transformations to Improve Comprehension in Voice Question Answering -- A User Modeling Shared Challenge Proposal -- How Lexical Gold Standards Have Effects On The Usefulness Of Text Analysis Tools For Digital Scholarship -- Personality facets recognition from text -- Unsupervised System Combination for Set-based Retrieval with Expectation Maximization -- An Ensemble Approach to Cross-Domain Authorship Attribution -- Evaluation of Deep Species Distribution Models using Environment and Co-occurrences -- Interactive Learning-based Retrieval Technique for Visual Lifelogging -- An Effective Deep Transfer Learning and Information Fusion Framework for Medical Visual Question Answering -- Language Modeling in Temporal Mood Variation Models for Early Risk Detection on The Internet -- Medical Image Labeling and Semantic Understanding for Clinical Applications -- To Check or not to Check: Syntax, Semantics, and Context in the Language of Check-worthy Claims -- Overview of CENTRE@CLEF 2019: Sequel in the Systematic Reproducibility Realm -- Overview of the CLEF-2019 CheckThat!: Automatic Identiï¬cation and Veriï¬cation of Claims -- Overview of the CLEF eHealth Evaluation Lab 2019 -- Overview of eRisk 2019: Early Risk Prediction on the Internet -- ImageCLEF 2019: Multimedia Retrieval in Medicine, Lifelogging, Security and Nature -- Overview of LifeCLEF 2019: Identiï¬cation of Amazonian Plants, South & North American Birds, and Niche Prediction -- Overview of PAN 2019: Bots and Gender Proï¬ling, Celebrity Proï¬ling, Cross-domain Authorship Attribution and Style Change Detection -- Overview of the CLEF 2019 Personalised Information Retrieval Lab (PIR-CLEF 2019) -- Overview of CLEF 2019 Lab ProtestNews: Extracting Protests from News in a Cross-context Setting. Tipo de medio : Computadora Summary : This book constitutes the refereed proceedings of the 10th International Conference of the CLEF Association, CLEF 2019, held in Lugano, Switzerland, in September 2019. The conference has a clear focus on experimental information retrieval with special attention to the challenges of multimodality, multilinguality, and interactive search ranging from unstructured to semi structures and structured data. The 7 full papers and 8 short papers presented in this volume were carefully reviewed and selected from 30 submissions. This year, many contributions tackle the social networks with the detection of stances or early identiï¬cation of depression signs on Twitter in a cross-lingual context. Further this volume presents 7 "best of the labs" papers which were reviewed as a full paper submission with the same review criteria. The labs represented scientific challenges based on new data sets and real world problems in multimodal and multilingual information access. In addition to this, 9 benchmarking labs reported results of their yearlong activities in overview talks and lab sessions. Enlace de acceso : https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...]
TÃtulo : Machine Learning Methods for Stylometry : Authorship Attribution and Author Profiling Tipo de documento: documento electrónico Autores: Savoy, Jacques, Mención de edición: 1 ed. Editorial: [s.l.] : Springer Fecha de publicación: 2020 Número de páginas: XIX, 286 p. 111 ilustraciones, 101 ilustraciones en color. ISBN/ISSN/DL: 978-3-030-53360-1 Nota general: Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos. Idioma : Inglés (eng) Palabras clave: Procesamiento del lenguaje natural (Informática) Sistemas de almacenamiento y recuperación de información. LigüÃstica computacional Aprendizaje automático La ciencia de la biblioteca Procesamiento del lenguaje natural (PNL) Almacenamiento y recuperación de información Clasificación: 006.35 Resumen: Este libro presenta métodos y enfoques utilizados para identificar al verdadero autor de un documento o extracto de texto dudoso. Proporciona una amplia introducción a todos los problemas de categorización de textos (como atribución de autorÃa, rasgos psicológicos del autor, detección de noticias falsas, etc.) basados ​​en caracterÃsticas estilÃsticas. EspecÃficamente, se presentan en detalle los modelos de aprendizaje automático como herramientas valiosas para verificar hipótesis o revelar patrones significativos ocultos en conjuntos de datos. La estilometrÃa es un campo multidisciplinario que combina la lingüÃstica con la estadÃstica y la informática. El contenido se divide en tres partes. El primero, que consta de los tres primeros capÃtulos, ofrece una introducción general a la estilometrÃa, sus potenciales aplicaciones y limitaciones. Además, presenta el ejemplo en curso utilizado para ilustrar los conceptos discutidos a lo largo del resto del libro. Los cuatro capÃtulos de la segunda parte están más dedicados a la informática y se centran en los modelos de aprendizaje automático. Su principal objetivo es explicar modelos de aprendizaje automático para la resolución de problemas estilométricos. Se explican varias estrategias generales utilizadas para identificar, extraer, seleccionar y representar marcadores estilÃsticos. Dado que el aprendizaje profundo representa un campo de investigación activo, se proporciona información sobre modelos de redes neuronales e incrustaciones de palabras aplicadas a la estilometrÃa, asà como una introducción general al enfoque de aprendizaje profundo para resolver preguntas estilométricas. A su vez, la tercera parte ilustra la aplicación de los enfoques discutidos anteriormente en casos reales: un problema de atribución de autorÃa, que busca descubrir la mano secreta detrás del seudónimo de Elena Ferrante, escritora italiana mundialmente conocida por su saga Mi amigo brillante; elaboración de perfiles de autor para identificar si un conjunto de tweets fueron generados por un bot o un ser humano y en este segundo caso, si es un hombre o una mujer; y una exploración de las variaciones estilÃsticas a lo largo del tiempo utilizando discursos polÃticos estadounidenses que cubren un perÃodo de ca. 230 años. A lo largo del libro se adopta un enfoque basado en soluciones y las explicaciones están respaldadas por ejemplos escritos en R. Para complementar el contenido principal y las discusiones sobre modelos y técnicas estilométricas, los ejemplos y conjuntos de datos están disponibles gratuitamente en el sitio web Github del autor. Nota de contenido: Part I: Fundamental Concepts and Models -- 1. Introduction to Stylistic Models and Applications -- 2. Basic Lexical Concepts and Measurements -- 3. Distance-Based Approaches -- Part II: Advanced Models and Evaluation -- 4. Evaluation Methodology and Test Corpora -- 5. Features Identification and Selection -- 6. Machine Learning Models -- 7. Advanced Models for Stylometric Applications -- Part III: Cases Studies -- 8. Elena Ferrante: A Case Study in Authorship Attribution -- 9. Author Profiling of Tweets -- 10. Applications to Political Speeches -- 11. Conclusion. Tipo de medio : Computadora Summary : This book presents methods and approaches used to identify the true author of a doubtful document or text excerpt. It provides a broad introduction to all text categorization problems (like authorship attribution, psychological traits of the author, detecting fake news, etc.) grounded in stylistic features. Specifically, machine learning models as valuable tools for verifying hypotheses or revealing significant patterns hidden in datasets are presented in detail. Stylometry is a multi-disciplinary field combining linguistics with both statistics and computer science. The content is divided into three parts. The first, which consists of the first three chapters, offers a general introduction to stylometry, its potential applications and limitations. Further, it introduces the ongoing example used to illustrate the concepts discussed throughout the remainder of the book. The four chapters of the second part are more devoted to computer science with a focus on machine learning models. Their main aim is to explain machine learning models for solving stylometric problems. Several general strategies used to identify, extract, select, and represent stylistic markers are explained. As deep learning represents an active field of research, information on neural network models and word embeddings applied to stylometry is provided, as well as a general introduction to the deep learning approach to solving stylometric questions. In turn, the third part illustrates the application of the previously discussed approaches in real cases: an authorship attribution problem, seeking to discover the secret hand behind the nom de plume Elena Ferrante, an Italian writer known worldwide for her My Brilliant Friend's saga; author profiling in order to identify whether a set of tweets were generated by a bot or a human being and in this second case, whether it is a man or a woman; and an exploration of stylistic variations over time using US political speeches covering a period of ca. 230 years. A solutions-based approach is adopted throughout the book, and explanations are supported by examples written in R. To complement the main content and discussions on stylometric models and techniques, examples and datasets are freely available at the author's Github website. Enlace de acceso : https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...] Machine Learning Methods for Stylometry : Authorship Attribution and Author Profiling [documento electrónico] / Savoy, Jacques, . - 1 ed. . - [s.l.] : Springer, 2020 . - XIX, 286 p. 111 ilustraciones, 101 ilustraciones en color.
ISBN : 978-3-030-53360-1
Libro disponible en la plataforma SpringerLink. Descarga y lectura en formatos PDF, HTML y ePub. Descarga completa o por capítulos.
Idioma : Inglés (eng)
Palabras clave: Procesamiento del lenguaje natural (Informática) Sistemas de almacenamiento y recuperación de información. LigüÃstica computacional Aprendizaje automático La ciencia de la biblioteca Procesamiento del lenguaje natural (PNL) Almacenamiento y recuperación de información Clasificación: 006.35 Resumen: Este libro presenta métodos y enfoques utilizados para identificar al verdadero autor de un documento o extracto de texto dudoso. Proporciona una amplia introducción a todos los problemas de categorización de textos (como atribución de autorÃa, rasgos psicológicos del autor, detección de noticias falsas, etc.) basados ​​en caracterÃsticas estilÃsticas. EspecÃficamente, se presentan en detalle los modelos de aprendizaje automático como herramientas valiosas para verificar hipótesis o revelar patrones significativos ocultos en conjuntos de datos. La estilometrÃa es un campo multidisciplinario que combina la lingüÃstica con la estadÃstica y la informática. El contenido se divide en tres partes. El primero, que consta de los tres primeros capÃtulos, ofrece una introducción general a la estilometrÃa, sus potenciales aplicaciones y limitaciones. Además, presenta el ejemplo en curso utilizado para ilustrar los conceptos discutidos a lo largo del resto del libro. Los cuatro capÃtulos de la segunda parte están más dedicados a la informática y se centran en los modelos de aprendizaje automático. Su principal objetivo es explicar modelos de aprendizaje automático para la resolución de problemas estilométricos. Se explican varias estrategias generales utilizadas para identificar, extraer, seleccionar y representar marcadores estilÃsticos. Dado que el aprendizaje profundo representa un campo de investigación activo, se proporciona información sobre modelos de redes neuronales e incrustaciones de palabras aplicadas a la estilometrÃa, asà como una introducción general al enfoque de aprendizaje profundo para resolver preguntas estilométricas. A su vez, la tercera parte ilustra la aplicación de los enfoques discutidos anteriormente en casos reales: un problema de atribución de autorÃa, que busca descubrir la mano secreta detrás del seudónimo de Elena Ferrante, escritora italiana mundialmente conocida por su saga Mi amigo brillante; elaboración de perfiles de autor para identificar si un conjunto de tweets fueron generados por un bot o un ser humano y en este segundo caso, si es un hombre o una mujer; y una exploración de las variaciones estilÃsticas a lo largo del tiempo utilizando discursos polÃticos estadounidenses que cubren un perÃodo de ca. 230 años. A lo largo del libro se adopta un enfoque basado en soluciones y las explicaciones están respaldadas por ejemplos escritos en R. Para complementar el contenido principal y las discusiones sobre modelos y técnicas estilométricas, los ejemplos y conjuntos de datos están disponibles gratuitamente en el sitio web Github del autor. Nota de contenido: Part I: Fundamental Concepts and Models -- 1. Introduction to Stylistic Models and Applications -- 2. Basic Lexical Concepts and Measurements -- 3. Distance-Based Approaches -- Part II: Advanced Models and Evaluation -- 4. Evaluation Methodology and Test Corpora -- 5. Features Identification and Selection -- 6. Machine Learning Models -- 7. Advanced Models for Stylometric Applications -- Part III: Cases Studies -- 8. Elena Ferrante: A Case Study in Authorship Attribution -- 9. Author Profiling of Tweets -- 10. Applications to Political Speeches -- 11. Conclusion. Tipo de medio : Computadora Summary : This book presents methods and approaches used to identify the true author of a doubtful document or text excerpt. It provides a broad introduction to all text categorization problems (like authorship attribution, psychological traits of the author, detecting fake news, etc.) grounded in stylistic features. Specifically, machine learning models as valuable tools for verifying hypotheses or revealing significant patterns hidden in datasets are presented in detail. Stylometry is a multi-disciplinary field combining linguistics with both statistics and computer science. The content is divided into three parts. The first, which consists of the first three chapters, offers a general introduction to stylometry, its potential applications and limitations. Further, it introduces the ongoing example used to illustrate the concepts discussed throughout the remainder of the book. The four chapters of the second part are more devoted to computer science with a focus on machine learning models. Their main aim is to explain machine learning models for solving stylometric problems. Several general strategies used to identify, extract, select, and represent stylistic markers are explained. As deep learning represents an active field of research, information on neural network models and word embeddings applied to stylometry is provided, as well as a general introduction to the deep learning approach to solving stylometric questions. In turn, the third part illustrates the application of the previously discussed approaches in real cases: an authorship attribution problem, seeking to discover the secret hand behind the nom de plume Elena Ferrante, an Italian writer known worldwide for her My Brilliant Friend's saga; author profiling in order to identify whether a set of tweets were generated by a bot or a human being and in this second case, whether it is a man or a woman; and an exploration of stylistic variations over time using US political speeches covering a period of ca. 230 years. A solutions-based approach is adopted throughout the book, and explanations are supported by examples written in R. To complement the main content and discussions on stylometric models and techniques, examples and datasets are freely available at the author's Github website. Enlace de acceso : https://link-springer-com.biblioproxy.umanizales.edu.co/referencework/10.1007/97 [...]