Advanced search

A corpus-driven study of the expression of modality in Luganda (Bantu, JE15)

Deo Kawalya (UGent)
(2017)
Author
Promoter
(UGent) and (UGent)
Organization
Abstract
This study is concerned with the expression of modality in Luganda, a Bantu language spoken in central Uganda. In Bantu languages, modality is not very well studied, as it is in, for instance, Indo-European languages. With regard to Luganda, although the language has a relatively rich research and publication background, studies on modality began with the start of this PhD research. This study, therefore, aims at describing the expression of modality in Luganda, and this using a corpus, with the long-term objective of laying the foundation for a more comprehensive corpus-driven grammar of Luganda. To facilitate these short and long term goals, a diachronic electronic text corpus was built and used as the main source of data for this study. The current 6-million-word corpus covers a time depth of 130 years and contains materials from 18 topics/genres. As a preliminary investigation to test the viability of the diachronic corpus, the semantic evolution of the possibility verb -sóból- was examined using a small corpus of 1.5 million words. The results of this investigation constitute the contents of Chapter 2. It is shown that in addition to being used outside double verb constructions to express lexical meanings, the verb -sóból- is also used in double verb constructions to express all sub-categories of dynamic possibility and deontic possibility. Over time, its lexical uses reduce and are currently almost disappearing, while its modal uses extend to include deontic possibility. This signals a correlation between grammaticalization whereby its syntactic independence reduces, and subjectification whereby its lexical meanings and the more objective grammatical meaning of dynamic possibility shift to the more subjective grammatical meaning of deontic possibility. The other chapters are based on an enlarged 4-million-word corpus, a pruning of the 6-million-word corpus (which was found to be unbalanced). Chapter 3 offers an analysis of the use and meaning of the verbal prefix -andi-. This prefix, which is commonly described as a conditional marker in the existing literature, is shown, through corpus evidence, to be mostly used in the expression of modal meanings at present, i.e. to signify deontic necessity and epistemic possibility. Diachronically, canonical conditional constructions in which -andi- expresses unreal conditionality, have reduced over time to give way to genuine single-clause constructions in which -andi- takes on a modal role, implying a correlation between the emergence and development of andi- as a modal marker with its growing use outside complex conditional constructions. In Chapter 4, a comparison is made of the three main possibility markers in Luganda, i.e. yînz-, sóból- and -andi- in order to examine the evolution of this semantic category in the language. Generally, -yînz- is the most common marker of possibility in terms of frequency, followed by sóból- and then -andi-. Diachronically, the use of -sóból- in the expression of possibility has grown exponentially, while that of -yînz- has reduced over time, although, overall, both markers’ modal uses have increased compared to over a century ago. The role of -yînz- in the more objective dynamic possibility subdomain has reduced compared to that of -sóból-, which has grown, implying that probably -yînz- is historically more established as a marker of possibility and is, therefore, likely to have been used to express modal meanings in earlier stages of the language when -sóból-, -andi- and likely other possibility markers, were still insignificant for these uses. In Chapter 5, we make a comparison of the expression of possibility in West Nyanza Bantu languages, to which Luganda belongs, with a view of reconstructing the origins of the two most important possibility markers in Luganda, i.e. -yînz- and -sóból-. It is shown that while yînz- only exists in Luganda, Lusoga and Lugwere, -sóból- is attested in these and all other West Nyanza languages as well as in other Great Lakes Bantu languages outside West Nyanza. Because the cognates of -sóból- in all Great Lakes Bantu languages carry a dynamic modal meaning ‘be able’ this suggests that its modal usage is older in any of these individual languages, contrary to what is shown by language-internal Luganda data, which portrays yînz- as an older modal marker. Chapter 6 offers an overview of the expression of necessity in Luganda. Three necessity markers, i.e. -téekw-, -lina and -andi- are described and compared. Overall, the auxiliary téekw- is more established as a necessity marker, as it is involved in all sub-categories except participant-inherent dynamic necessity. The auxiliary lina expresses only participant-imposed, situational and deontic necessity, while andi- is only used for deontic necessity. Comparison of corpus data with data from the oldest literature on Luganda shows that the more objective category of participant-inherent dynamic necessity, which is not associated with any of the three markers described, is perhaps put into words by less grammaticalized forms. These forms are also, together with still other grammaticalized forms that have become increasingly rare, assumed to be part of the devices that could have been responsible for conveying necessity in earlier stages of the language. ---------- Een corpus-gedreven studie van de uitdrukking van modaliteit in Luganda (Bantoe, JE15) Deze studie handelt over de uitdrukking van modaliteit in het Luganda, een Bantoetaal gesproken in Centraal-Oeganda. In de Bantoetalen is modaliteit als grammaticale categorie nauwelijks bestudeerd, zeker in vergelijking met de Indo-Europese talen. Voor wat het Luganda betreft is het zo dat studies over modaliteit eigenlijk maar aanvingen met de start van het onderzoek voor dit doctoraat, ook al is de taal voor de rest relatief goed bestudeerd. Daarom heeft de voorliggende studie als betrachting de uitdrukking van modaliteit in het Luganda te beschrijven en dit aan de hand van een corpus met als lange termijndoel de basis te leggen voor een grondige corpus-gedreven grammatica van het Luganda. Om deze korte en lange termijndoelen te dienen werd een digitaal diachronisch tekstcorpus gebouwd en gebruikt als belangrijkste gegevensbron voor deze studie. Het huidige corpus is 6 miljoen woorden groot, bestrijkt een tijdsdiepte van ongeveer 130 jaar en bevat materiaal dat gegroepeerd is volgens 18 verschillende onderwerpen/genres. Als een verkennend onderzoek om de haalbaarheid van het gebruik van een diachroon corpus te testen werd de semantische evolutie van het werkwoord -sóból-, dat mogelijkheid uitdrukt, onderzocht door gebruik te maken van een klein corpus van 1,5 miljoen woorden. De resultaten van dat onderzoek worden beschreven in Hoofstuk 2. Er wordt aangetoond dat, naast een gebruik buiten dubbele werkwoordconstructies om lexicale betekenissen uit te drukken, het werkwoord -sóból- ook gebruikt wordt in dubbele werkwoordconstructies om alle subcategorieën van dynamische mogelijkheid alsook deontische mogelijkheid uit te drukken. In de loop van de tijd loopt het lexicale gebruik van dit werkwoord terug en vandaag is het nagenoeg helemaal verdwenen. Tegelijk breiden de modale gebruiken zich uit, meer bepaald naar deontische mogelijkheid. Dit wijst op een correlatie tussen het in de eerst plaats formele proces van grammaticalisatie waarbij de syntactische onafhankelijkheid van het werkwoord vermindert, en het semantische proces van subjectificatie waarbij de lexicale betekenis en meer objectieve grammaticale betekenissen van dynamische mogelijkheid verschuiven naar de meer subjectieve grammaticale betekenis van deontische mogelijkheid. De andere hoofdstukken zijn gebaseerd op het uitgebreide corpus van 4 miljoen woorden, dat eigenlijk een ingekorte versie is van een groter corpus van 6 miljoen woorden dat gereduceerd werd wegens te onevenwichtig. Hoofdstuk 3 bestaat uit een analyse van het gebruik en de betekenis van het verbale prefix -andi-. Aan de hand van bewijsmateriaal uit het corpus wordt aangetoond dat dit prefix, dat in de bestaande literatuur gewoonlijk beschreven wordt als een morfeem dat voorwaardelijkheid uitdrukt, vandaag de dag het meest frequent gebruikt wordt om modaliteit uit te drukken, in het bijzonder deontische noodzaak en epistemische mogelijkheid. Diachronisch gezien werden complexe voorwaardelijke constructies waarin -andi- onwerkelijke voorwaardelijkheid uitdrukt steeds minder courant doorheen de tijd om uiteindelijk voorbijgestoken te worden door eenvoudige constructies die slechts uit een hoofdzin bestaan waarin -andi- een modale rol speelt, wat een correlatie impliceert tussen het ontstaan en de ontwikkeling van andi- als een modale marker en zijn toenemend gebruik buiten complexe conditionele constructies. In Hoofdstuk 4 wordt een vergelijking gemaakt tussen de drie belangrijkste markers van mogelijkheid in het Luganda, namelijk yînz-, -sóból- en -andi- om de evolutie van deze semantische categorie in de taal te kunnen bestuderen. Over het algemeen is -yînz- de meeste courante marker van mogelijkheid in termen van frequentie, gevolgd door -sóból- en dan door -andi-. Diachronisch gezien is het gebruik van -sóból- voor het uitdrukken van mogelijkheid exponentieel gegroeid, terwijl dat van -yînz- alleen maar afgenomen is doorheen de tijd, ook als zijn globaal gezien de modale gebruiken van beide markers alleen maar toegenomen in vergelijking met meer dan een eeuw geleden. De rol van -yînz- in het meer objectieve sub-domein van dynamische mogelijkheid is afgenomen in vergelijking met dat van -sóból-, dat toegenomen is, wat impliceert dat -yînz- wellicht historisch gezien de meer gevestigde marker van mogelijkheid is en daarom al in een vroeger stadia van de taal modale betekenissen had toen -sóból-, -andi- en mogelijk nog andere markers van mogelijkheid nog van weinig betekenis waren binnen deze semantische categorie. In Hoofdstuk 5 maken we een vergelijking van de uitdrukking van mogelijkheid in de West-Nyanza Bantoetalen, waartoe het Luganda behoort, met als doel de oorsprong van de twee belangrijkste markers van mogelijkheid in het Luganda, namelijk -yînz- en -sóból-, te reconstrueren. Er wordt aangetoond dat terwijl yînz- alleen bestaat in het Luganda, het Lusoga en het Lugwere, -sóból- voorkomt in deze en alle andere West-Nyanza Bantoetalen alsook in alle andere Bantoetalen van de Grote Meren buiten het West-Nyanza. Het feit dat de cognaten van -sóból- in alle Bantoetalen van de Grote Meren de dynamische modale betekenis ‘kunnen, in staat zijn’ hebben suggereert dat de individuele talen dit modaal gebruik geërfd hebben van hun gemeenschappelijke vooroudertaal, in tegenstelling tot wat de taal-interne data van Luganda laten vermoeden, namelijk dat yînz- de oudste marker van mogelijkheid zou zijn. Hoofdstuk 6 biedt een overzicht van de uitdrukking van noodzakelijkheid in het Luganda. Drie markers van noodzakelijkheid, namelijk -téekw-, -lina en -andi-, worden beschreven en vergeleken. Globaal gezien is het hulpwerkwoord téekw- de meest gevestigde marker van noodzakelijkheid, gelet op het feit dat het betrokken is in de uitdrukking van alle subcategorieën behalve participant-inherente dynamische noodzakelijkheid. Het hulpwerkwoord lina drukt enkel participant-opgelegde, situationele en deontische noodzakelijkheid uit, terwijl andi- enkel gebezigd wordt voor deontische noodzakelijkheid. Een vergelijking van de corpusdata met gegevens uit de oudste literatuur over het Luganda toont dat de meer objectieve categorie van participant-inherente dynamische noodzakelijkheid, die niet verbonden is met één van deze drie markers, wellicht weergegeven wordt door minder gegrammaticaliseerde vormen. Van deze vormen wordt verondersteld dat ze, samen met nog andere gegrammaticaliseerde vormen die steeds zeldzamer geworden zijn, deel uitmaakten van de middelen die de taal vroeger gebruikte om noodzakelijkheid uit te drukken.

Citation

Please use this url to cite or link to this publication:

Chicago
Kawalya, Deo. 2017. “A Corpus-driven Study of the Expression of Modality in Luganda (Bantu, JE15)”. Ghent: Ghent University.
APA
Kawalya, D. (2017). A corpus-driven study of the expression of modality in Luganda (Bantu, JE15). Ghent University, Ghent.
Vancouver
1.
Kawalya D. A corpus-driven study of the expression of modality in Luganda (Bantu, JE15). [Ghent]: Ghent University; 2017.
MLA
Kawalya, Deo. “A Corpus-driven Study of the Expression of Modality in Luganda (Bantu, JE15).” 2017 : n. pag. Print.
@phdthesis{8538416,
  abstract     = {This study is concerned with the expression of modality in Luganda, a Bantu language spoken in central Uganda. In Bantu languages, modality is not very well studied, as it is in, for instance, Indo-European languages. With regard to Luganda, although the language has a relatively rich research and publication background, studies on modality began with the start of this PhD research. This study, therefore, aims at describing the expression of modality in Luganda, and this using a corpus, with the long-term objective of laying the foundation for a more comprehensive corpus-driven grammar of Luganda. To facilitate these short and long term goals, a diachronic electronic text corpus was built and used as the main source of data for this study. The current 6-million-word corpus covers a time depth of 130 years and contains materials from 18 topics/genres. 

As a preliminary investigation to test the viability of the diachronic corpus, the semantic evolution of the possibility verb -s{\'o}b{\'o}l- was examined using a small corpus of 1.5 million words. The results of this investigation constitute the contents of Chapter 2. It is shown that in addition to being used outside double verb constructions to express lexical meanings, the verb -s{\'o}b{\'o}l- is also used in double verb constructions to express all sub-categories of dynamic possibility and deontic possibility. Over time, its lexical uses reduce and are currently almost disappearing, while its modal uses extend to include deontic possibility. This signals a correlation between grammaticalization whereby its syntactic independence reduces, and subjectification whereby its lexical meanings and the more objective grammatical meaning of dynamic possibility shift to the more subjective grammatical meaning of deontic possibility.

The other chapters are based on an enlarged 4-million-word corpus, a pruning of the 6-million-word corpus (which was found to be unbalanced). Chapter 3 offers an analysis of the use and meaning of the verbal prefix -andi-. This prefix, which is commonly described as a conditional marker in the existing literature, is shown, through corpus evidence, to be mostly used in the expression of modal meanings at present, i.e. to signify deontic necessity and epistemic possibility. Diachronically, canonical conditional constructions in which -andi- expresses unreal conditionality, have reduced over time to give way to genuine single-clause constructions in which -andi- takes on a modal role, implying a correlation between the emergence and development of  andi- as a modal marker with its growing use outside complex conditional constructions.

In Chapter 4, a comparison is made of the three main possibility markers in Luganda, i.e.  y{\^i}nz-,  s{\'o}b{\'o}l- and -andi- in order to examine the evolution of this semantic category in the language. Generally, -y{\^i}nz- is the most common marker of possibility in terms of frequency, followed by  s{\'o}b{\'o}l- and then -andi-. Diachronically, the use of -s{\'o}b{\'o}l- in the expression of possibility has grown exponentially, while that of -y{\^i}nz- has reduced over time, although, overall, both markers{\textquoteright} modal uses have increased compared to over a century ago. The role of -y{\^i}nz- in the more objective dynamic possibility subdomain has reduced compared to that of -s{\'o}b{\'o}l-, which has grown, implying that probably -y{\^i}nz- is historically more established as a marker of possibility and is, therefore, likely to have been used to express modal meanings in earlier stages of the language when -s{\'o}b{\'o}l-, -andi- and likely other possibility markers, were still insignificant for these uses. 

In Chapter 5, we make a comparison of the expression of possibility in West Nyanza Bantu languages, to which Luganda belongs, with a view of reconstructing the origins of the two most important possibility markers in Luganda, i.e. -y{\^i}nz- and -s{\'o}b{\'o}l-. It is shown that while  y{\^i}nz- only exists in Luganda, Lusoga and Lugwere, -s{\'o}b{\'o}l- is attested in these and all other West Nyanza languages as well as in other Great Lakes Bantu languages outside West Nyanza. Because the cognates of -s{\'o}b{\'o}l- in all Great Lakes Bantu languages carry a dynamic modal meaning {\textquoteleft}be able{\textquoteright} this suggests that its modal usage is older in any of these individual languages, contrary to what is shown by language-internal Luganda data, which portrays  y{\^i}nz- as an older modal marker. 

Chapter 6 offers an overview of the expression of necessity in Luganda. Three necessity markers, i.e. -t{\'e}ekw-, -lina and -andi- are described and compared. Overall, the auxiliary  t{\'e}ekw- is more established as a necessity marker, as it is involved in all sub-categories except participant-inherent dynamic necessity. The auxiliary  lina expresses only participant-imposed, situational and deontic necessity, while  andi- is only used for deontic necessity. Comparison of corpus data with data from the oldest literature on Luganda shows that the more objective category of participant-inherent dynamic necessity, which is not associated with any of the three markers described, is perhaps put into words by less grammaticalized forms. These forms are also, together with still other grammaticalized forms that have become increasingly rare, assumed to be part of the devices that could have been responsible for conveying necessity in earlier stages of the language. 

----------

Een corpus-gedreven studie van de uitdrukking van modaliteit in Luganda (Bantoe, JE15)

Deze studie handelt over de uitdrukking van modaliteit in het Luganda, een Bantoetaal gesproken in Centraal-Oeganda. In de Bantoetalen is modaliteit als grammaticale categorie nauwelijks bestudeerd, zeker in vergelijking met de Indo-Europese talen. Voor wat het Luganda betreft is het zo dat studies over modaliteit eigenlijk maar aanvingen met de start van het onderzoek voor dit doctoraat, ook al is de taal voor de rest relatief goed bestudeerd. Daarom heeft de voorliggende studie als betrachting de uitdrukking van modaliteit in het Luganda te beschrijven en dit aan de hand van een corpus met als lange termijndoel de basis te leggen voor een grondige corpus-gedreven grammatica van het Luganda. Om deze korte en lange termijndoelen te dienen werd een digitaal diachronisch tekstcorpus gebouwd en gebruikt als belangrijkste gegevensbron voor deze studie. Het huidige corpus is 6 miljoen woorden groot, bestrijkt een tijdsdiepte van ongeveer 130 jaar en bevat materiaal dat gegroepeerd is volgens 18 verschillende onderwerpen/genres. 

Als een verkennend onderzoek om de haalbaarheid van het gebruik van een diachroon corpus te testen werd de semantische evolutie van het werkwoord -s{\'o}b{\'o}l-, dat mogelijkheid uitdrukt, onderzocht door gebruik te maken van een klein corpus van 1,5 miljoen woorden. De resultaten van dat onderzoek worden beschreven in Hoofstuk 2. Er wordt aangetoond dat, naast een gebruik buiten dubbele werkwoordconstructies om lexicale betekenissen uit te drukken, het werkwoord -s{\'o}b{\'o}l- ook gebruikt wordt in dubbele werkwoordconstructies om alle subcategorie{\"e}n van dynamische mogelijkheid alsook deontische mogelijkheid uit te drukken. In de loop van de tijd loopt het lexicale gebruik van dit werkwoord terug en vandaag is het nagenoeg helemaal verdwenen. Tegelijk breiden de modale gebruiken zich uit, meer bepaald naar deontische mogelijkheid. Dit wijst op een correlatie tussen het in de eerst plaats formele proces van grammaticalisatie waarbij de syntactische onafhankelijkheid van het werkwoord vermindert, en het semantische proces van subjectificatie waarbij de lexicale betekenis en meer objectieve grammaticale betekenissen van dynamische mogelijkheid verschuiven naar de meer subjectieve grammaticale betekenis van deontische mogelijkheid.

De andere hoofdstukken zijn gebaseerd op het uitgebreide corpus van 4 miljoen woorden, dat eigenlijk een ingekorte versie is van een groter corpus van 6 miljoen woorden dat gereduceerd werd wegens te onevenwichtig. Hoofdstuk 3 bestaat uit een analyse van het gebruik en de betekenis van het verbale prefix -andi-. Aan de hand van bewijsmateriaal uit het corpus wordt aangetoond dat dit prefix, dat in de bestaande literatuur gewoonlijk beschreven wordt als een morfeem dat voorwaardelijkheid uitdrukt, vandaag de dag het meest frequent gebruikt wordt om modaliteit uit te drukken, in het bijzonder deontische noodzaak en epistemische mogelijkheid. Diachronisch gezien werden complexe voorwaardelijke constructies waarin -andi- onwerkelijke voorwaardelijkheid uitdrukt steeds minder courant doorheen de tijd om uiteindelijk voorbijgestoken te worden door eenvoudige constructies die slechts uit een hoofdzin bestaan waarin -andi- een modale rol speelt, wat een correlatie impliceert tussen het ontstaan en de ontwikkeling van  andi- als een modale marker en zijn toenemend gebruik buiten complexe conditionele constructies.

In Hoofdstuk 4 wordt een vergelijking gemaakt tussen de drie belangrijkste markers van mogelijkheid in het Luganda, namelijk  y{\^i}nz-, -s{\'o}b{\'o}l- en -andi- om de evolutie van deze semantische categorie in de taal te kunnen bestuderen. Over het algemeen is -y{\^i}nz- de meeste courante marker van mogelijkheid in termen van frequentie, gevolgd door -s{\'o}b{\'o}l- en dan door -andi-. Diachronisch gezien is het gebruik van -s{\'o}b{\'o}l- voor het uitdrukken van mogelijkheid exponentieel gegroeid, terwijl dat van -y{\^i}nz- alleen maar afgenomen is doorheen de tijd, ook als zijn globaal gezien de modale gebruiken van beide markers alleen maar toegenomen in vergelijking met meer dan een eeuw geleden. De rol van -y{\^i}nz- in het meer objectieve sub-domein van dynamische mogelijkheid is afgenomen in vergelijking met dat van -s{\'o}b{\'o}l-, dat toegenomen is, wat impliceert dat -y{\^i}nz- wellicht historisch gezien de meer gevestigde marker van mogelijkheid is en daarom al in een vroeger stadia van de taal modale betekenissen had toen -s{\'o}b{\'o}l-, -andi- en mogelijk nog andere markers van mogelijkheid nog van weinig betekenis waren binnen deze semantische categorie.

In Hoofdstuk 5 maken we een vergelijking van de uitdrukking van mogelijkheid in de West-Nyanza Bantoetalen, waartoe het Luganda behoort, met als doel de oorsprong van de twee belangrijkste markers van mogelijkheid in het Luganda, namelijk -y{\^i}nz- en -s{\'o}b{\'o}l-, te reconstrueren. Er wordt aangetoond dat terwijl  y{\^i}nz- alleen bestaat in het Luganda, het Lusoga en het Lugwere, -s{\'o}b{\'o}l- voorkomt in deze en alle andere West-Nyanza Bantoetalen alsook in alle andere Bantoetalen van de Grote Meren buiten het West-Nyanza. Het feit dat de cognaten van -s{\'o}b{\'o}l- in alle Bantoetalen van de Grote Meren de dynamische modale betekenis {\textquoteleft}kunnen, in staat zijn{\textquoteright} hebben suggereert dat de individuele talen dit modaal gebruik ge{\"e}rfd hebben van hun gemeenschappelijke vooroudertaal, in tegenstelling tot wat de taal-interne data van Luganda laten vermoeden, namelijk dat  y{\^i}nz- de oudste marker van mogelijkheid zou zijn. 

Hoofdstuk 6 biedt een overzicht van de uitdrukking van noodzakelijkheid in het Luganda. Drie markers van noodzakelijkheid, namelijk -t{\'e}ekw-, -lina en -andi-, worden beschreven en vergeleken. Globaal gezien is het hulpwerkwoord  t{\'e}ekw- de meest gevestigde marker van noodzakelijkheid, gelet op het feit dat het betrokken is in de uitdrukking van alle subcategorie{\"e}n behalve participant-inherente dynamische noodzakelijkheid. Het hulpwerkwoord  lina drukt enkel participant-opgelegde, situationele en deontische noodzakelijkheid uit, terwijl  andi- enkel gebezigd wordt voor deontische noodzakelijkheid. Een vergelijking van de corpusdata met gegevens uit de oudste literatuur over het Luganda toont dat de meer objectieve categorie van participant-inherente dynamische noodzakelijkheid, die niet verbonden is met {\'e}{\'e}n van deze drie markers, wellicht weergegeven wordt door minder gegrammaticaliseerde vormen. Van deze vormen wordt verondersteld dat ze, samen met nog andere gegrammaticaliseerde vormen die steeds zeldzamer geworden zijn, deel uitmaakten van de middelen die de taal vroeger gebruikte om noodzakelijkheid uit te drukken. 
},
  author       = {Kawalya, Deo},
  language     = {eng},
  pages        = {272},
  publisher    = {Ghent University},
  school       = {Ghent University},
  title        = {A corpus-driven study of the expression of modality in Luganda (Bantu, JE15)},
  year         = {2017},
}