Référentiel DataStudio – petit nettoyage de printemps

Supprimer les jobs « fantômes » du référentiel

Les projets décisionnels ayant un long cycle de vie, il est fortement recommandé de
nettoyer et réorganiser régulièrement le référentiel DataStudio.
(Le référentiel DataStudio est un ensemble de tables sur une base de données – en l’occurence ici sur Oracle. Le référentiel contient le paramétrage des données et des traitements de DataStudio.)

Nettoyer le référentiel DataStudioUne des étapes est de repérer les jobs non reliés à des projets pour identifier des jobs « fantômes » qui ne servent plus. En effet, Au fur et à mesure des développements, on n’utilise plus certains jobs dans les projets DataStudio, mais ces traitements restent présents dans la liste des jobs.
Plutôt que d’essayer de les pointer manuellement dans DataStudio, on va le faire par requête sur le référentiel.
On va ainsi d’abord identifier ces jobs (requêtes Oracle) non inclus dans des projets (plus précisément dans des folder) DataStudio et qui ne sont pas chargés par une instruction include dans d’autres jobs.


create table TMP_JOBS_TO_DELETE
as   select JOBCODE
from
(
select JOBCODE
from JOB
minus
select JOBCODE
from FOLDDEF
) jf
where not exists
-- on vérifie que le job ne se trouve pas dans un include d'un script d'un autre job
(
select 1
from SCRIPTSR s
where s.INSTRUCT LIKE 'include%'
and s.INSTRUCT LIKE '%' || jf.JOBCODE || '%'
)
;

Ensuite, dans cette table TMP_JOBS_TO_DELETE on va supprimer manuellement les jobs qu’on souhaite éventuellement garder, puis lancer une requête de suppression dans la table qui contient la liste des jobs du référentiel :

delete from JOB
where JOBCODE in
(
select JOBCODE
from TMP_JOBS_TO_DELETE
)
;

commit;

Enfin on va dropper la table temporaire :

drop table TMP_JOBS_TO_DELETE;

Bien sûr ce genre de manipulation est délicat ; il est donc nécessaire d’avoir auparavant fait un export XML du workspace DataStudio en cas d’erreur de manipulation.

Si vous ne connaissez pas encore l’excellent ETL DataStudio, lisez les 10 raisons de choisir DataStudio et Données : 12 façons de faire l’impossible avec l’ETL DataStudio.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *