Advanced search
1 file | 3.19 MB Add to list

Improving the efficiency of knowledge graph construction from heterogeneous data sources

(2024)
Author
Promoter
(UGent) and Anastasia Dimou
Organization
Abstract
Wanneer informatie moet worden samengesteld uit verschillende databronnen komt men data-integratieproblemen tegen. Integratie van verschillende databronnen vereist een uitgebreide kennis van deze bronnen en de mogelijke relaties ertussen. Deze relaties kunnen worden uitgedrukt dankzij de technologie van kennisgrafen, zoals het Resource Description Framework (RDF). Daarbij worden de data een graafstructuur met knopen met relaties tussen. Om heterogene bronnen die vaak nog niet beschikbaar zijn in RDF te vertalen naar zo’n graafstructuur bestaat er een taal: de RDF Mapping Language (RML). Diverse processoren interpreteren RML-documenten, lezen de brondata, en vertalen die zo in een kennisgraaf. In dit doctoraat bestuderen en verbeteren we de efficiëntie om kennisgrafen te genereren op vlak van uitvoeringstijd, opslag, CPU-tijd en benodigd werkgeheugen. Hiervoor bestudeerde ik zowel technieken die werken op basis van een materialisatie van de graaf, als technieken die de graaf virtualiseren bovenop een niet RDF-systeem. Op die wijze vond ik een manier om bestaande materialisatiesystemen te optimaliseren door grafen incrementeel te genereren naar gelang ze veranderen in de tijd. Daarnaast heb ik ook ondersteuning voor nieuwe databronnen zoals Web API’s en datastromen toegevoegd zodat de reproduceerbaarheid van kennisgraaf-generatie werd verbeterd.

Downloads

  • (...).pdf
    • full text (Published version)
    • |
    • UGent only (changes to open access on 2029-11-29)
    • |
    • PDF
    • |
    • 3.19 MB

Citation

Please use this url to cite or link to this publication:

MLA
Van Assche, Dylan. Improving the Efficiency of Knowledge Graph Construction from Heterogeneous Data Sources. Ghent University. Faculty of Engineering and Architecture, 2024.
APA
Van Assche, D. (2024). Improving the efficiency of knowledge graph construction from heterogeneous data sources. Ghent University. Faculty of Engineering and Architecture, Ghent, Belgium.
Chicago author-date
Van Assche, Dylan. 2024. “Improving the Efficiency of Knowledge Graph Construction from Heterogeneous Data Sources.” Ghent, Belgium: Ghent University. Faculty of Engineering and Architecture.
Chicago author-date (all authors)
Van Assche, Dylan. 2024. “Improving the Efficiency of Knowledge Graph Construction from Heterogeneous Data Sources.” Ghent, Belgium: Ghent University. Faculty of Engineering and Architecture.
Vancouver
1.
Van Assche D. Improving the efficiency of knowledge graph construction from heterogeneous data sources. [Ghent, Belgium]: Ghent University. Faculty of Engineering and Architecture; 2024.
IEEE
[1]
D. Van Assche, “Improving the efficiency of knowledge graph construction from heterogeneous data sources,” Ghent University. Faculty of Engineering and Architecture, Ghent, Belgium, 2024.
@phdthesis{01JD75M0FX2PKCTPP2J33GB0HA,
  abstract     = {{Wanneer informatie moet worden samengesteld uit verschillende databronnen komt men data-integratieproblemen tegen. Integratie van verschillende databronnen vereist een uitgebreide kennis van deze bronnen en de mogelijke relaties ertussen. Deze relaties kunnen worden uitgedrukt dankzij de technologie van kennisgrafen, zoals het Resource Description Framework (RDF). Daarbij worden de data een graafstructuur met knopen met relaties tussen. Om heterogene bronnen die vaak nog niet beschikbaar zijn in RDF te vertalen naar zo’n graafstructuur bestaat er een taal: de RDF Mapping Language (RML). Diverse processoren interpreteren RML-documenten, lezen de brondata, en vertalen die zo in een kennisgraaf. In dit doctoraat bestuderen en verbeteren we de efficiëntie om kennisgrafen te genereren op vlak van uitvoeringstijd, opslag, CPU-tijd en benodigd werkgeheugen.

Hiervoor bestudeerde ik zowel technieken die werken op basis van een materialisatie van de graaf, als technieken die de graaf virtualiseren bovenop een niet RDF-systeem. Op die wijze vond ik een manier om bestaande materialisatiesystemen te optimaliseren door grafen incrementeel te genereren naar gelang ze veranderen in de tijd. Daarnaast heb ik ook ondersteuning voor nieuwe databronnen zoals Web API’s en datastromen toegevoegd zodat de reproduceerbaarheid van kennisgraaf-generatie werd verbeterd.}},
  author       = {{Van Assche, Dylan}},
  isbn         = {{9789463559270}},
  language     = {{eng}},
  pages        = {{XXVI, 183}},
  publisher    = {{Ghent University. Faculty of Engineering and Architecture}},
  school       = {{Ghent University}},
  title        = {{Improving the efficiency of knowledge graph construction from heterogeneous data sources}},
  year         = {{2024}},
}