- Author
- Maarten De Raedt
- Promoter
- Chris Develder (UGent) , Thomas Demeester (UGent) and Fréderic Godin
- Organization
- Abstract
- Recente vooruitgang in taalmodellering, vooral met grote taalmodellen (LLMs) zoals ChatGPT, heeft de capaciteiten van chatbots aanzienlijk verbeterd. Deze chatbots worden grofweg ingedeeld in open-domein chatbots die algemene gesprekken voeren, en taakgerichte chatbots, die gebruikers helpen bij specifieke taken zoals het boeken van vluchten of het afhandelen van klantensupport. Deze thesis richt zich op het democratiseren van taakgerichte chatbots door hun computationele en data-efficiëntie te verbeteren. De thesis introduceert innovatieve methoden voor twee belangrijke taken van chatbots: 1) Automatische data-annotatie: Deze techniek gebruikt unsupervised learning om klantenvragen automatisch in specifieke onderwerpen te categoriseren, waardoor de behoefte aan handmatige geannoteerde trainingsdata wordt verminderd. 2) Data-augmentatie: We presenteren methoden om extra trainingsvoorbeelden te genereren door bestaande voorbeelden systematisch te transformeren. Deze aanpak verhoogt de diversiteit in de trainingsdata en verbetert daarmee de robuustheid van chatbots tegen ruis in de data, wat vaak voorkomt in de praktijk Met deze methodes streven we ernaar de computationele middelen en data-vereisten voor het trainen van chatbots te verminderen, waardoor geavanceerde chatbots toegankelijker en praktischer worden voor breed gebruik in verschillende industrieën.
Downloads
-
phdfinal-maartenderaedt.pdf
- full text (Published version)
- |
- open access
- |
- |
- 3.55 MB
Citation
Please use this url to cite or link to this publication: http://hdl.handle.net/1854/LU-01J2DMDT3X23RB3ET1EHH79EYP
- MLA
- De Raedt, Maarten. Resource-Efficient Data Annotation and Augmentation Methods for Conversational Agents. Ghent University. Faculty of Engineering and Architecture, 2024.
- APA
- De Raedt, M. (2024). Resource-efficient data annotation and augmentation methods for conversational agents. Ghent University. Faculty of Engineering and Architecture, Ghent, Belgium.
- Chicago author-date
- De Raedt, Maarten. 2024. “Resource-Efficient Data Annotation and Augmentation Methods for Conversational Agents.” Ghent, Belgium: Ghent University. Faculty of Engineering and Architecture.
- Chicago author-date (all authors)
- De Raedt, Maarten. 2024. “Resource-Efficient Data Annotation and Augmentation Methods for Conversational Agents.” Ghent, Belgium: Ghent University. Faculty of Engineering and Architecture.
- Vancouver
- 1.De Raedt M. Resource-efficient data annotation and augmentation methods for conversational agents. [Ghent, Belgium]: Ghent University. Faculty of Engineering and Architecture; 2024.
- IEEE
- [1]M. De Raedt, “Resource-efficient data annotation and augmentation methods for conversational agents,” Ghent University. Faculty of Engineering and Architecture, Ghent, Belgium, 2024.
@phdthesis{01J2DMDT3X23RB3ET1EHH79EYP,
abstract = {{Recente vooruitgang in taalmodellering, vooral met grote taalmodellen (LLMs) zoals ChatGPT, heeft de capaciteiten van chatbots aanzienlijk verbeterd. Deze chatbots worden grofweg ingedeeld in open-domein chatbots die algemene gesprekken voeren, en taakgerichte chatbots, die gebruikers helpen bij specifieke taken zoals het boeken van vluchten of het afhandelen van klantensupport. Deze thesis richt zich op het democratiseren van taakgerichte chatbots door hun computationele en data-efficiëntie te verbeteren. De thesis introduceert innovatieve methoden voor twee belangrijke taken van chatbots: 1) Automatische data-annotatie: Deze techniek gebruikt unsupervised learning om klantenvragen automatisch in specifieke onderwerpen te categoriseren, waardoor de behoefte aan handmatige geannoteerde trainingsdata wordt verminderd. 2) Data-augmentatie: We presenteren methoden om extra trainingsvoorbeelden te genereren door bestaande voorbeelden systematisch te transformeren. Deze aanpak verhoogt de diversiteit in de trainingsdata en verbetert daarmee de robuustheid van chatbots tegen ruis in de data, wat vaak voorkomt in de praktijk Met deze methodes streven we ernaar de computationele middelen en data-vereisten voor het trainen van chatbots te verminderen, waardoor geavanceerde chatbots toegankelijker en praktischer worden voor breed gebruik in verschillende industrieën.}},
author = {{De Raedt, Maarten}},
isbn = {{9789463558600}},
language = {{eng}},
pages = {{XXII, 188}},
publisher = {{Ghent University. Faculty of Engineering and Architecture}},
school = {{Ghent University}},
title = {{Resource-efficient data annotation and augmentation methods for conversational agents}},
year = {{2024}},
}