Yacht Freelance

Freelance Data engineer Centraal Toegangspunt Data (ZZP)

Geplaatst 9 jul. 2024
Project ID: 9161739
Plaats
Utrecht, Hybride
Uren
36 Uur/week
Periode
4 maanden
Start: 9 jul. 2024
Einde: 1 nov. 2024
Tarief
70 - 94 €/uur
Uiterste voorsteldatum: 14 jul. 2024 12:00

Opdrachtomschrijving:


Rijkswaterstaat wil haar data centraal toegankelijk maken. Om dit te bereiken ontwikkelt Rijkswaterstaat het Centraal Toegangspunt Data (CTD). Hiermee krijgt het de beschikking over drie nieuwe (data) functies die aansluiten op de uitgangspunten van de datastrategie en de i-strategie van RWS. Voor het CTD is er behoefte aan een meer geautomatiseerde aanpak voor het creëren en toepassen van metadata. D.m.v. trefwoord extractie (NLP) dienen de belangrijkste woorden of woordgroepen uit de verschillende databronnen te worden geïdentificeerd en geëxtraheerd. Met de geëxtraheerde trefwoorden worden de belangrijkste onderwerpen en thema's binnen een databron geïdentificeerd. Met deze trefwoorden (incl. synoniemen) wordt de beschikbare metadata van de verschillende databronnen verrijkt. Het uiteindelijke doel van deze opdracht is het beter vindbaar maken van de metadata.


Werkzaamheden:


De opdracht achter deze inhuur is te komen tot een meer geautomatiseerde aanpak voor het creëren en toepassen van metadata. Om dit te realiseren is (op hoofdlijnen) de volgende functionaliteit benodigd:



  1. Tooling voor het geautomatiseerd genereren van metadata van de content in het CTD en voor het beschikbaar maken hiervan voor het verwerken in de metadata catalogus (Data 360). Dit betreft specifiek het koppelen van data-assets (databronnen, tabellen, datasets en dataproducten) aan twee zoekbomen. Eén zoekboom heeft de OTL als basis en de andere heeft een vakinhoudelijke indeling.

  2. Tooling voor het indexeren van data in het CTD en deze trefwoorden opslaan in de metadata-catalogus (Data 360), zodat ook op deze trefwoorden gezocht kan worden. Deze tooling geeft aan welke velden geïndexeerd moeten worden.

  3. Een geautomatiseerd proces om op basis van (1) periodiek nieuwe metadata van databronnen in het CTD te kunnen genereren.

  4. Advies over hoe het CTD de gebruiker beter kan bedienen en zo mogelijk dit advies om te zetten in bruikbare producten.

  5. Documentatie van ontwikkelde producten ten behoeve van overdracht naar beheerders en gebruikers.

     


Meest essentiële competenties:


  • Is analytisch

  • Is klantgericht

  • Is gericht op samenwerken

  • Is RADIO-V: resultaatgedreven, aanspreekbaar, dienstverlenend, integer, ondernemend en verbindend



De ideale kandidaat voldoet aan de volgende eisen:


  • De aangeboden kandidaat beschikt over een afgeronde WO/PhD opleiding in de richting van software engineering.

  • De aangeboden kandidaat heeft tenminste 5 jaar ervaring op het gebied van software engineering.

  • De aangeboden kandidaat heeft tenminste 3 jaar ervaring met het schrijven van kwaliteit Python code volgens strikte kwaliteitseisen zoals PEP, Flake8, unit tests, security e.a. incl. CI/CD pipelines.

  • De aangeboden kandidaat heeft tenminste 3 jaar ervaring in een Agile setting, ervaring in het robuust, schaalbaar, testbaar en reproduceerbaar ontwikkelen van software binnen innovatieve data projecten met een data science component.

  • Ervaring met NLP (Natural Language Processing) en specifiek het extraheren van trefwoorden uit databronnen met het oog deze beter vindbaar te maken



Wensen:


  • Mate waarin de kandidaat ervaring heeft met Python, Postgres, Greenplum, containerization, continuous integration en unit testing.

  • Mate waarin de kandidaat aantoonbaar beschikt over de volgende competenties competenties (toetsbaar middels CV, motivatie en/of gesprek):


       

    • Is analytisch

    • Is klantgericht

    • Is gericht op samenwerken

    • Is RADIO-V: resultaatgedreven, aanspreekbaar, dienstverlenend, integer, ondernemend en verbindend


       

  • De aangeboden kandidaat beheerst de Nederlandse taal in woord en geschrift goed.

Soortgelijke projecten

+ Bekijk alle projecten