Advanced search
1 file | 3.55 MB Add to list

Resource-efficient data annotation and augmentation methods for conversational agents

(2024)
Author
Promoter
(UGent) , (UGent) and
Organization
Abstract
Recente vooruitgang in taalmodellering, vooral met grote taalmodellen (LLMs) zoals ChatGPT, heeft de capaciteiten van chatbots aanzienlijk verbeterd. Deze chatbots worden grofweg ingedeeld in open-domein chatbots die algemene gesprekken voeren, en taakgerichte chatbots, die gebruikers helpen bij specifieke taken zoals het boeken van vluchten of het afhandelen van klantensupport. Deze thesis richt zich op het democratiseren van taakgerichte chatbots door hun computationele en data-efficiëntie te verbeteren. De thesis introduceert innovatieve methoden voor twee belangrijke taken van chatbots: 1) Automatische data-annotatie: Deze techniek gebruikt unsupervised learning om klantenvragen automatisch in specifieke onderwerpen te categoriseren, waardoor de behoefte aan handmatige geannoteerde trainingsdata wordt verminderd. 2) Data-augmentatie: We presenteren methoden om extra trainingsvoorbeelden te genereren door bestaande voorbeelden systematisch te transformeren. Deze aanpak verhoogt de diversiteit in de trainingsdata en verbetert daarmee de robuustheid van chatbots tegen ruis in de data, wat vaak voorkomt in de praktijk Met deze methodes streven we ernaar de computationele middelen en data-vereisten voor het trainen van chatbots te verminderen, waardoor geavanceerde chatbots toegankelijker en praktischer worden voor breed gebruik in verschillende industrieën.

Downloads

  • phdfinal-maartenderaedt.pdf
    • full text (Published version)
    • |
    • open access
    • |
    • PDF
    • |
    • 3.55 MB

Citation

Please use this url to cite or link to this publication:

MLA
De Raedt, Maarten. Resource-Efficient Data Annotation and Augmentation Methods for Conversational Agents. Ghent University. Faculty of Engineering and Architecture, 2024.
APA
De Raedt, M. (2024). Resource-efficient data annotation and augmentation methods for conversational agents. Ghent University. Faculty of Engineering and Architecture, Ghent, Belgium.
Chicago author-date
De Raedt, Maarten. 2024. “Resource-Efficient Data Annotation and Augmentation Methods for Conversational Agents.” Ghent, Belgium: Ghent University. Faculty of Engineering and Architecture.
Chicago author-date (all authors)
De Raedt, Maarten. 2024. “Resource-Efficient Data Annotation and Augmentation Methods for Conversational Agents.” Ghent, Belgium: Ghent University. Faculty of Engineering and Architecture.
Vancouver
1.
De Raedt M. Resource-efficient data annotation and augmentation methods for conversational agents. [Ghent, Belgium]: Ghent University. Faculty of Engineering and Architecture; 2024.
IEEE
[1]
M. De Raedt, “Resource-efficient data annotation and augmentation methods for conversational agents,” Ghent University. Faculty of Engineering and Architecture, Ghent, Belgium, 2024.
@phdthesis{01J2DMDT3X23RB3ET1EHH79EYP,
  abstract     = {{Recente vooruitgang in taalmodellering, vooral met grote taalmodellen (LLMs) zoals ChatGPT, heeft de capaciteiten van chatbots aanzienlijk verbeterd. Deze chatbots worden grofweg ingedeeld in open-domein chatbots die algemene gesprekken voeren, en taakgerichte chatbots, die gebruikers helpen bij specifieke taken zoals het boeken van vluchten of het afhandelen van klantensupport. Deze thesis richt zich op het democratiseren van taakgerichte chatbots door hun computationele en data-efficiëntie te verbeteren. De thesis introduceert innovatieve methoden voor twee belangrijke taken van chatbots: 1) Automatische data-annotatie: Deze techniek gebruikt unsupervised learning om klantenvragen automatisch in specifieke onderwerpen te categoriseren, waardoor de behoefte aan handmatige geannoteerde trainingsdata wordt verminderd. 2) Data-augmentatie: We presenteren methoden om extra trainingsvoorbeelden te genereren door bestaande voorbeelden systematisch te transformeren. Deze aanpak verhoogt de diversiteit in de trainingsdata en verbetert daarmee de robuustheid van chatbots tegen ruis in de data, wat vaak voorkomt in de praktijk Met deze methodes streven we ernaar de computationele middelen en data-vereisten voor het trainen van chatbots te verminderen, waardoor geavanceerde chatbots toegankelijker en praktischer worden voor breed gebruik in verschillende industrieën.}},
  author       = {{De Raedt, Maarten}},
  isbn         = {{9789463558600}},
  language     = {{eng}},
  pages        = {{XXII, 188}},
  publisher    = {{Ghent University. Faculty of Engineering and Architecture}},
  school       = {{Ghent University}},
  title        = {{Resource-efficient data annotation and augmentation methods for conversational agents}},
  year         = {{2024}},
}