Dr. phil. Olga Kellert
Privatdozentin am Seminar für Romanische Philologie der Universität Göttingen
Aktuelle Publikationen
- Use of NLP in the Context of Belief states of Ethnic Minorities in Latin America. Proceedings of ACL2023. with Mahmud Zaman.
- Using geolocated tweets for probing Language Geography and Migration. In: Multilingüismo y lingüística de la migración en la era de las humanidades digitales. Sandra Issel-Dombert, Ignacio Andrés Soria, Laura Morgenthaler García. De Gruyter.
- Probing Sociodemographic Influence on Code-Switching and Language Choice in Quebec with Geolocation of Tweets. Front. Psychol. Sec. Language Sciences. Volume 14 - 2023 | doi: 10.3389/fpsyg.2023.1137038.
- ‘Linguistic variation in Twitter: a case study of Italian loanwords in Spanish of South America’, in Natascha Pomino, Eva-Maria Remberger, Julia Zwink (eds.), From formal linguistic theory to the art of historical editions: The multifaceted dimensions of Romance linguistics, V&R unipress Publishers. 347-359.

Lehre im WiSe 2023: Soziale Medien und Linguistische Korpora
Projektarbeit zu Sprachmischungen (Code-Switching) in Twitter:


Untersuchte Sprachen
- Italienisch, Französisch und Spanisch in Forschung und Lehre (alte und moderne
Sprachstufen). - Beschreibung des altitalienischen Quantifizierungssystems und seines diachronen Wandels in Mittelalter und Renaissance. Ziel ist die Erstellung eines exhaustiven Inventars von Quantifizierern und hiermit in Verbindung stehenden Elementen sowie die detaillierte Analyse, insbesondere der internen und externen Syntax von Quantifiziererphrasen. Untersucht werden soll ihr Verhalten im Hinblick auf Wortstellung, Diskontinuität, Kongruenz-verhalten und Semantik
- Im Rahmen des Projekts wird das altitalienische Quantifizierersystem mit dem bereits sehr gut erforschten heutigen Standarditalienisch und mit entsprechenden Daten aus heutigen italienischen Dialekten verglichen. Wie das ASIt Projekt (Syntaktischer Sprachatlas italienischer Dialekte) bereits gezeigt hat, verhalten sich bare quantifiers heute vielfach anders als komplexe quantifizierende Ausdrücke. Es gilt im Rahmen des Projekts u.a. zu zeigen, ob ein solcher Unterschied auch im Altitalienischen festzustellen ist. Dieses Vorgehen basiert auf der Annahme, dass sich in einer bestimmten diachronen Sprachstufe vorhandene Phänomene später noch in diatopischen Varietäten nachweisen lassen. Die Integration von diachroner und synchroner Variation stellt einen wichtigen Mehrwert des Projekts dar.
Aktuelle Projekte
Sociolinguistic and sociocomputational project on belief states of vulnerable groups in crises in Latin America (with Prof. Dr. Skopeteas, 2nd PI and in cooperation with Mexico, Ecuador, Peru, Austria)Title: Belief states of vulnerable groups in crises in Latin America: sociolingustic and computational assessment
Aim of the project:
Indigenous people belong to the particularly vulnerable groups in the COVID-19 era and are disproportionally affected by epidemics and other crises, as acknowledged by the United Nations. Dissemination of reliable COVID-19- related information, adapted to cultural and linguistic background of indigenous peoples is a major priority in the current crisis. The major aim of the present project is to determine the role that the linguistic and cultural background of indigenous people from Latin America plays in processing of relevant information about COVID-19 disseminated by high-impact news outlets (henceforth Reference Corpus). This aim entails the development of interdisciplinary methods (including sociolinguistic and computational metrics) for assessing belief states and measuring the degree to which these belief states mirror the Reference Corpus.
Project on Geolocation of linguistic variation
Title: Geolocation differences of language use in urban areas
The explosion in the availability of natural language data in the era of social media has given rise to a host of applications such as sentiment analysis and opinion mining. Simultaneously, the growing availability of precise geolocation information is enabling visualization of global phenomena such as environmental changes and disease propagation. Opportunities for tracking spatial variations in language use, however, have largely been overlooked, especially on small spatial scales. Here we explore the use of Twitter data with precise geolocation information to resolve spatial variations in language use on an urban scale down to single city blocks. We identify several categories of language tokens likely to show distinctive patterns of use and develop quantitative methods to visualize the spatial distributions associated with these patterns. Our analysis concentrates on comparison of contrasting pairs of Tweet distributions from the same category, each defined by a set of tokens. Our work shows that analysis of small-scale variations can provide unique information on correlations between language use and social context which are highly valuable to a wide range of fields from linguistic science and commercial advertising to social services.
2022, Olga Kellert & Nicholas Matlis ‘Geolocation of multiple sociolinguistic markers in Buenos Aires’, PLOS One. 17(9):e0274114.
Projekte in der Endphase
„Variation and Change of Indefinites in Romance. A case study of degrammaticalization.“(mitfinanziert durch das Habilitationsabschlussstipendium der Philosophischen Fakultät der Universität Göttingen)
Ziel des Projekts ist die Untersuchung des Wandels und Variation von indefiniten/quantifizierenden Kategorien. Dabei wird vor allem die Frage untersucht, inwieweit der syntaktische, semantische und der pragmatische Kontext (z.B. Spezifizität, Tempus- und Modus des Verbs, pragmatische Implikaturen) den semantischen und syntaktischen Wandel von indefiniten Elementen zu graduierbaren Adjektiven vorantreiben. Untersucht werden Daten aus altromanischen und modernen Sprachstufen aus semantischer und syntaktischer Perspektive. Es werden Hypothesen in Bezug auf den Wandel mit Hilfe statistischer Tests überprüft.
DFG-Projekt „Quantification in Old Italian“
(mit Prof. Dr. Guido Mensching von der Universität Göttingen, Prof. Dr. Cecilia Poletto und Dr. Irene Franco von der Universität Frankfurt a.M.)
Hauptziele des Projekts:
Abgeschlossenes Projekt
„Prosodie von Satztypen“(Projekt mit Dr. Caterina Petrone (Univ. Aix-Marseille) und Dr. Daniele Panizza (Univ. Göttingen), im Rahmen des CRC Forschungszentrums „Textstrukturen“ der Universität Göttingen)
Das Projekt verfolgt folgende Ziele: Das erste Ziel des Projekts ist die akustische Analyse von morphosyntaktisch identischen exklamativen und interrogativen Äußerungen (z.B. italienisch Quanto è lungo!/? ‘Wie lang ist er?/Wie lang er ist!‘) anhand von Parametern wie Dauer und F0. Dabei gilt es, die Akzenttypen und die Akzentpositionen exklamativer Äußerungen von Akzenttypen und Akzentpositionen interrogativer Äußerungen zu unterscheiden. Die Zielsprache ist das in Cosenza gesprochene Regionalitalienisch. Der Schwerpunkt liegt auf einer Kombination der Erforschung von Produktion und Perzeption. Auf der Basis von Produktionsdaten werden Hypothesen für eine systematische Manipulation von Stimuli generiert, anhand derer sich die perzeptuelle Relevanz der phonetischen Parameter überprüfen lässt. Die ersten Produktionstests haben bereits einen signifikanten Unterschied in der nuklearen Intonationskontur sowie in den initialen und finalen Grenztönen gezeigt. Außerdem wurde ein signifikanter Unterschied in der Dauer der betonten Silbe festgestellt. Die Relevanz der besagten Parameter wird im nächsten Schritt auf der Ebene der Perzeption im Labor des CRC Forschungszentrums „Textstrukturen“ in Göttingen und im Labor der Universität Kalabrien getestet. Dabei werden psycholinguistische Experimente durchgeführt, in denen Reaktionszeiten von Versuchspersonen in unterschiedlichen Aufgaben, die der Satztypidentifizierung dienen, gemessen werden.