Handleiding OpenClinica – Zorgpad

Handleiding SPSS voor OpenClinica Exports
Inhoudsopgave
1.
2.
3.
4.
5.
6.
Inleiding .......................................................................................................................... 2
Tips bij het ontwerp van de studie .................................................................................. 2
Vóór het exporteren van de SPSS bestanden ................................................................ 3
Exporteren van de SPSS bestanden .............................................................................. 4
Inlezen van de SPSS bestanden .................................................................................... 4
Bestand klaarmaken voor analyse in SPSS.................................................................... 5
6.a. Repeating Events in de studie ................................................................................. 5
6.b. Lengte tekstvelden vast zetten ................................................................................ 6
6.c. Samenvoegen data van hetzelfde CRF uit verschillende visites .............................. 6
7. Error meldingen en wat te doen...................................................................................... 6
8. Andere problemen en wat te doen .................................................................................. 8
8.a. Decimale getallen missen in de gegevens. .............................................................. 8
8.b. SPSS toont veel meer kolommen dan verwacht. ..................................................... 8
8.c. Items in een RepeatedItemGroup............................................................................ 9
8.d. SPSS toont bij items meerdere waarden gescheiden door comma’s ......................10
8.e. Er missen gegevens in export naar STATA. ...........................................................11
Appendix 1. Data van eerdere versies van OpenClinica .......................................................12
SPSS met OpenClinica.nl
Versie 0.1
1. Inleiding
Deze handleiding geeft hulp bij het inlezen in SPSS van data die verzameld is met
OpenClinica. Het beschrijft ook hoe exports voor SPSS gemaakt moeten worden. Het gaat
uit van versie 3.1.4.1 van OpenClinica.
In de OpenClinica Reference guide op https://docs.openclinica.com/3.1/openclinica-userguide staat beschreven hoe je data uit OpenClinica kunt exporteren. Er is ook een beknopte
TraIT export manual geschreven die te downloaden is vanuit TOPdesk.
2. Tips bij het ontwerp van de studie
Als een studie met SPSS zal worden geanalyseerd is het handig met een aantal aspecten
rekening te houden bij het maken van de studie
1. Bij de SPSS export wordt de itemnaam gebruikt om variabelen aan te duiden.
Bij het maken van een CRF in OpenClinica moeten de itemnamen per CRF
uniek zijn. Hierbij is OpenClinica kritischer dan SPSS, want OpenClinica
maakt onderscheid tussen hoofd en kleine letters bij item namen, maar SPSS
doet dit niet.
Een itemnaam mag alleen letters en cijfers en _ (= underscore) bevatten en
geen spaties (gebruik hiervoor underscores) en vreemde tekens bevatten
(zoals % etc.). Is het mogelijk om een volledige lijst te geven (of naar te
refereren) van tekens die niet zijn toegestaan?
Let er dus op dat in de CRF al de itemnamen uniek zijn onafhankelijk van hoofd en kleine
letter gebruik.
2. De maximale lengte van een itemnaam in OpenClinica is 255 karakters, maar
SPSS staat maximaal 64 karakters toe. Bovendien plaatst OpenClinica in de
SPSS export achter de itemnamen nog codes om te wijzen naar Event, CRF
en eventuele itemgroep.
Let er dus op dat in de CRF de itemnamen maximaal 50 karakters zijn.
3. Een item van het type radio of single-select zal als
RESPONSE_VALUES_OR_CALCULATIONSvaak getallen zoals 1,2,3
bevatten. Het is sterk aan te raden het DATA_TYPE van het item INT te
maken. Dit is vooral belangrijk als de export eerst naar SPSS gedaan wordt en
later door STATA verwerkt zal worden.
Let er in het algemeen op om numerieke velden data type INT of REAL te
maken.
Let er dus op dat in de CRF de itemnamen van type radio en single-select van het data-type
INT zijn als er alleen getallen in de waarden staan die opgeslagen worden.
4. Een item van het type checkbox of multi-select kan meerdere keuzen opslaan.
Het systeem combineert alle antwoorden in een veld, elke optie gescheiden
door een komma (SPSS heeft hier geen type voor). Bij de verwerking in SPSS
zal dit omgezet moeten worden zodat elke waarde in een apart veld (SPSS
kolom) terecht komt.
- Er kan via de TraIT servicedesk s een standaard script verkregen worden om
Pagina 2 van 12
SPSS met OpenClinica.nl
Versie 0.1
de multi-select export aan te passen voor analyse in SPSS.
- Als alternatief is het te overwegen aparte vragen te formuleren, bijvoorbeeld
met een keuze tussen ja en nee.
Bedenk goed of de checkbox of multi-select de beste manier is om je data te verzamelen.
5. In een OpenClinica-CRF kan gebruik worden gemaakt van een
RepeatingItemGroup. Hierbij worden meerdere regels met dezelfde items
ingevuld. In de SPSS-export zullen deze waarden “horizontaal” worden
weergegeven. Wanneer het voor de analyse gewenst is dat deze gegevens in
SPSS “verticaal” worden weergegeven, dus per Subject meerdere regels, dan
zul je hiervoor zelf een SPSS-syntax-script moeten schrijven.
Bedenk van tevoren hoe je de gegevens in SPSS wilt gaan analyseren en test of de wijze
van data verzamelen in OpenClinica hierop aansluit.
6. OpenClinica exporteert data gegroepeerd per CRF versie. Daardoor kan een
wijziging in een of meerdere CRFs in de looptijd van een studie potentieel veel
bewerkingen geven in SPSS. Voorkom zoveel mogelijk dergelijke
aanpassingen door onder andere:
- eventuele anderen die moeten invoeren eerst feedback te vragen voor de
overgang naar productie.
- alle scenario’s van de betrokken CRFs te controleren en een keer in te
voeren,
- een export te maken voor de analyse van alle hiervoor gemaakte invoer en
te kijken of dit goed te analyseren is.
Probeer dus te voorkomen dat de CRFsgewijzigd moeten worden terwijl ze in productie
zijn.
NB: OpenClinica biedt de mogelijkheid om gegevens die in een oudere CRF versie zijn
ingevoerd te migreren naar een nieuwe CRF versie (zie paragraaf 3). Hiermee kan
bovengenoemd probleem voorkomen worden.
7. Wanneer de “nullvalues” optie van OpenClinica wordt gebruikt, zullen
nullvalues in de export terecht komen als text(bijv UNK voor unknown). In het
geval van numerieke en datumvelden wordt dit bij export naar SPSS omgezet
naar “system missing”. Wanneer het relevant is om het type nullvalue in SPSS
terug te zien, is het beter om de nullvalues op te nemen bij de antwoordopties
van de vraag.
Zie hiervoor ook de TraIT OpenClinicaNull Value guidance volgt binnenkort.
3. Vóór het exporteren van de SPSS bestanden
OpenClinica exporteert alleen variabelen waar gegevens voor zijn ingevoerd in het CRF.
Maak daarom tijdens de ontwikkel fase in de TraIT OpenClinica sandbox omgeving een test
site met een test subject aan en vul gegevens in voor alle items. Eventueel zijn er meer
subjecten nodig om alle mogelijke scenario’s af te lopen. Controleer of alle variabelen (items)
in de export voorkomen.
Neem de export (evt. met een analist) goed door en test of analyse in SPSS mogelijk is.
Dit is vooral van belang bij “RepeatingItemGroup” vragen die later voor de analyse
‘georganiseerd’ moeten worden (bijvoorbeeld medicatie en AEs). Zelfs als dit gedaan is kan
het zijn dat voor de analyse extra aanpassingen nodig zijn omdat er meer herhaalde regels
Pagina 3 van 12
SPSS met OpenClinica.nl
Versie 0.1
zijn dan verwacht. (bijvoorbeeld doordat een patiënt 6 AEs heeft, maar de test patiënt maar
5).
Mochten er onverhoopt meerdere versies van CRF’s zijn met gegevens van subjects, dan is
het verstandig te kijken of subjecten met data op een oude versie van een CRF handmatig
gemigreerd kunnen worden naar een nieuwe versie (reden hiervan is eerder uitgelegd bij
2.6).
Per subject kies je voor “View this Subject’s Record”, Een lijst met events en CRF wordt
getoond. Per CRF kan de versie gemigreerd worden door te klikken op het laatste icoon
(Reassign CRF to a New Version). Selecteer de nieuwe versie. LET OP: het systeem zal
laten zien hoe het data van de ene versie naar de andere verplaatst. Als itemnamen
veranderd moesten worden tussen 2 versies dan moeten er handmatige correcties gedaan
worden. Het wordt aangeraden om aanmaken van nieuwe CRF versie en migratie van
gegevens van oude naar nieuwe versie eerst te testen in de sandbox omgeving.
Zijn het erg veel subjects dan is de overzetting anders te doen, zie
http://www.trialdatasolutions.com/tds/howto/transferdatanewversion.jsp of benader hiervoor
de TraIT servicedesk. Het kan eventueel ook verwerkt worden na de SPSS export.
4. Exporteren van de SPSS bestanden
De eerste stap is het creëren van een dataset.
Dit gaat als volgt:
1. Ga naar Tasks
2. Onder Extract Data kies Create Dataset.
Kies de elementen van de dataset bij events CRF en items.
3. Kies de “scope”van de dataset door een periode voor de events te kiezen
waarvan de data geëxporteerd moeten worden. Als niets ingevuld wordt,
worden alle data gekozen.
4. Kies wat in het extract moet zitten: alle CRF, alleen de “marked complete”
CRF, ofalleen“notmarked complete”.
5. Geef een naam aan de dataset
Als de dataset gecreëerd is kan de datageëxporteerd worden.
Dit gaat als volgt:
1. Ga naar Tasks
2. Onder Extract Data kies View Dataset.
3. Op de regel van de dataset die geëxporteerd moet worden kies onder actions
het laatste icoon (pagina met een pijl naar rechts): Export Dataset.
4. Kies op de volgende pagina Run Now achter SPSS data and syntax
5. Wacht eventueel op een email met het bericht dat het extract klaarstaat en klik
op de link in de mail om naar de pagina te gaan waar het bestand klaar staat
of kies View Dataset om te controleren of de dataset al klaar staat.
6. Kies Download (icoon met pijl naar beneden) van het bestand dat klaargezet
is. Bewaar het bestand.
5. Inlezen van de SPSS bestanden
Open het zip bestand dat OpenClinica gecreëerd heeft.
Er zijn 2 bestanden:
1. SPSS_SPS.spsheeft de definitie en structuur voor SPSS
2. SPSS_DAT.datheeft de data
Pagina 4 van 12
SPSS met OpenClinica.nl
Versie 0.1
Extraheerbeide bestanden in een directory, bijvoorbeeld c:\spss\mijnstudie.
Verander de naam vandebestandennaar een toepasselijke naambijvoorbeeld: mijnstudie.sps
en mijnstudie.dat.
In SPSS kies File, Open, Syntax, kies het .spsbestand.
Op de eerste regel moet een aanpassing gemaakt worden: De plaats en naam moeten
gecorrigeerd voor de plaats waar het .dat bestand staat. Bijvoorbeeld: FILE =
'SPSS_DAT.dat’ wordt vervangen door FILE = 'c:\spss\mijnstudie\mijnstudie.dat’.
Kies nu alle regels in het .sps bestand (Ctrl-A).
Kies run
Alle data zullen in SPSS gelezen worden.
Er zijn 3 SPSS windows:
1. SPSS Viewer met een log van derun (toont bestanden met extensie .spo).
2. Syntax editorwindow (extensie .sps) en
3. Statistics Data Editor (extensie .sav). Dit windows heeft 2 views: Data View
and Variable View.
In het Data View window staat de data. Boven de kolommen staan de itemnamen. Deze zijn
uitgebreid met letters.
Deze letters zijn een vertaling van Event en CRF namen.
E is altijd een Event, de events worden genummerd
C is altijd een CRF, ook de CRF worden genummerd.
De export zal in de itemnamen een indicatie voor het event opnemen. E1 is voor het eerste
event. Eventueel kan in het .sps bestand de naam aangepast worden zodat een
betekenisvollere naam gegeven wordt. Om te voorkomen dat E1 op andere plekken
vervangen worden, kun je het beste alle _E1 vervangen. Doe dit zowel voor de sectie GET
DATA als voor VARIABLE LABELS en VALUE LABELS. Pas echter op dat de maximale
lengte van de itemnaam niet overschreden wordt.
6. Bestand klaarmaken voor analyse in SPSS
Een eerste versie van het SPSS bestand is vaak nog niet geschikt om analyses mee te
doen.
Vooraf is belangrijk te weten dat:
- Per SPSS bestand is er 1 rij per patiënt ongeacht van de CRF opbouw zoals
RepeatingItemGroupvragen, meerdere visites met dezelfde CRF pagina. Open
Clinicaonderscheid herhalende elementen door aan de gekozen itemnaam extra letters en
cijfers toe te voegen voor het event nummer, het “occurence” nummer van de Event, het
CRFversie nummer, en eventuele rij nummer. Bijvoorbeeld de “AE_start_date” wordt dan
“AE_start_date_E5_C1_1”. E5 staat voor het Event nummer, C geeft een versie nummer van
een CRF aan, het losse nummer is de regelnummer van het item
- Bij tekstvelden wordt de lengte in SPSS bepaald door de ingevoerde waarde met de
grootste lengte (zie sectie6.b).
6.a. Repeating Events in de studie
Events kunnen repeatingzijn. VALUE LABELS van items in een repeating event worden niet
opgenomen in het syntax bestand.
Pagina 5 van 12
SPSS met OpenClinica.nl
Versie 0.1
Bijvoorbeeld.
Stel dat event E1 twee keer is voorgekomen. Dan zullen er 2 SPSS variabelen zijn voor
bijvoorbeeld het CRF item: RADIO_ITEM namelijk: RADIO_ITEM_E4_1_C1 en
RADIO_ITEM_E4_2_C1.
RADIO_ITEM_E4_1_C1 is het item RADIO_ITEM in het eerste Event.
RADIO_ITEM_E4_2_C1 is het item RADIO_ITEM in het tweede Event.
Om SPSS dit te laten verwerken moet bij VALUE LABELS de syntax handmatig worden
aangepast in het .sps bestand.
Bijvoorbeeld
RADIO_ITEM_E4_1_C1
'1' "Yes"
'0' "No"
/
Moet aangepast worden naar:
RADIO_ITEM_E4_1_C1,RADIO_ITEM_E4_2_C1
'1' "Yes"
'0' "No"
/
Als dit niet gebeurd zal het geen foutmelding tot gevolg hebben, maar de labels zullen niet
getoond worden.
6.b. Lengte tekstvelden vast zetten
De grootte van tekstvelden wordt in SPSS gesteld op de lengte van het langst ingevoerde
antwoord. Dit kan problemen geven, bijvoorbeeld in het geval dat de data anders
georganiseerd moet worden voor de analyse. Ook bij het hergebruiken van een aangepaste
syntax bij nieuwe data exports (bijvoorbeeld doordat in een “specify” veld nu voor een patiënt
een tekst met lengte 145 tekens is ingevoerd, terwijl voorheen het maximaal ingevoerde
tekens 123 was).
Zet daarom het format eenmalig op het maximaal te verwachten waarde voor deze velden:
A255. Dit is de maximale toegestane waarde in normale velden.
Controleer eventueel of in de CRF’s geen langere antwoorden zijn gegeven; soms wordt
bijvoorbeeld een discrepancynote aanmaakt om meer informatie te geven dan in het veld is
toegestaan.
6.c. Samenvoegen data van hetzelfde CRF uit verschillende visites
Als een (zelfde) CRF in meerdere visites voorkomt, dan zal een export vanuit Open Clinica
alle metingen achter elkaar i.p.v. onder elkaar tonen.
Soms is het beter voor de analyse de data uit de verschillende visites onder elkaar te
hebben. Ga dan als volgt te werk:
 Exporteer de CRF data vanuit Open Clinica per visite als aparte datasets.
 Voeg in SPSS syntax een variabele “visit” toe met de visite aanduiding (waarde
hetzelfde voor alle rijen in dat bestand): COMPUTE VISIT=1. EXECUTE.
 Verander de namen van de variabelen in algemene namen (bijv. Blood_pres_E1_C6
wordt Blood_pres). Doe dit consequent hetzelfde voor alle visites en voeg
vervolgens de verschillende SPSS bestanden samen.
 De visites staan nu onder elkaar.
7. Error meldingen en wat te doen
Error # 105. Command name: EXECUTE>This command is not valid before a working file
has been defined. >Execution of thiscommandstops.
Pagina 6 van 12
SPSS met OpenClinica.nl
Versie 0.1
Wat te doen:
Controleer in het .sps bestand of het pad achter ‘FILE =’ correct is en pas deze aan
Als dit niet helpt dan:
Kies in SPSS: Edit, Options, kies de tab File Locations, zorg dat alle locaties op de
pagina ook daadwerkelijk bestaan.
Als dit niet helpt kies in de syntax editor de regel GET DATA en kies Run
Er zullen een of meer regels met fouten komen.
(2265) Unrecognized or invalid variable format. The format is invalid.
numeric formats, the width or decimals value may be invalid.
For
OpenClinica geeft een foute Fn.d voor items met enkele specifieke WIDTH_DECIMAL
Het gaat om
1. items met een WIDTH_DECIMAL van het type real waarbij het aantal cijfers
achter de komma als 0 is gedefinieerd is, bijvoorbeeld 5(0)
2. items van het type REAL meteen WIDTH_DECIMALwaarbijeen maximale
breedte als (d) is opgegeven bijvoorbeeld 4(d)
3. WIDTH_DECIMAL aangegeven als een simpel getal bijvoorbeeld 4. Dit is
tegen de OpenClinica gedefinieerde syntax, maar wordt geaccepteerd en ook
bij het invullen van vragen wordt er gecontroleerd dat de invoer niet groter is
dan het gegeven getal.
(een real zonder WIDTH_DECIMAL gaat wel goed)
Wat te doen:
Zoek itemnamen in je CRF die deze WIDTH_DECIMAL instellingen hebben en vervang
in de SPSS syntax editor bij sectie GET DATA voor deze itemnamen de waarde achter F
door x.0, waarbij x de waarde is die OpenClinica al neergezet heeft. Bijvoorbeeld als de
WIDTH_DECIMAL 5(0) is zet OpenClinica F5.6, vervang dit door F4.0
(2272) Duplicate variable name (only first 64 characters are counted):
Wat te doen:
Pas in het .sps en in het .dat bestand de dubbele variabele namen aan en maak unieke
namen. OpenClinica maakt onderscheid tussen hoofd en kleine letters, maar SPSS niet.
Open het .dat bestand in Excel om het aan te passen. Bij het bewaren van het bestand
moet de indeling behouden blijven.
2278) A variable name does not conform to the rules for variable names. adExecution of this command stops.
Wat te doen:
Controleer het .sps bestand op itemnamen met een -. Deze zijn na versie 3.04 in
OpenClinica niet meer toegestaan, maar CRF gemaakt in eerdere versie klaagden hier
niet over. SPSS kan niet met dergelijke namen omgaan. Pas in het .sps en in het .dat
bestand de variabele namen aan (zorg dat de namen uniek blijven). Open het .dat
bestand in Excel om het aan te passen. Bij het bewaren van het bestand moet de
indeling behouden blijven.
Pagina 7 van 12
SPSS met OpenClinica.nl
Versie 0.1
8. Andere problemen en wat te doen
8.a. Decimale getallen missen in de gegevens.
SPSS toont geen getallen in de Data View voor var die in OpenClinica van het type REAL
zijn en getallen achter de komma bevatten. De data van OpenClinica wordt geëxporteerd in
een US formaat. Als SPSS een Nederlandse versie is, dan kan moet SPSS geïnstrueerd
worden in welk formaat de data die geïmporteerd wordt staat.
Wat te doen:
Nadat in SPSS het sps bestand geopend is, moet voor de eerste regel die begint met
GET DATA een regel toegevoegd worden:
SET LOCALE = 'en_US.windows-1252'.
(let op dat er een punt achter staat).
Na het inlezen kan SPSS voor de analyse weer terug gezet worden in de Nederlandse
representatie van de Data door
SET LOCALE = 'nl_nl'.
aan het eind toe te voegen
Daarna kunnen de alle regels uitgevoerd worden.
Controleer eventueel wat de setting is:
SHOW LOCALE.
8.b. SPSS toont veel meer kolommen dan verwacht.
Bij diepere analyse lijken er extra kolommen te zijn voor meerdere versies van sommige
CRF’s.
Zoals beschreven in paragraaf 3 kan het zijn dat het CRF tussentijds is gewijzigd en er zijn
sommige subjecten met gegevens in de ene versie en andere subjecten met gegevens in de
andere versie van de CRF, de itemnamen verschillen niet. Dit is te zien als er in het SPSS
.sps bestand bij het onderdeel Get DATA in te namenlijst namen staan waarin ook Ex_Cx
voorkomt, waarbij x een getal is. Bijvoorbeeld: E1_C1, E1_C2 , E1_C3.
In paragraaf 3 is uitgelegd hoe je binnen OpenClinica gegevens naar de laatste CRF versie
kan migreren. Mocht je dat niet in OpenClinica willen of kunnen doen, dan kan het ook
binnen SPSS worden gedaan.
Hoe dit te doen binnen SPSS:
Hiervoor is een programmaatje geschreven dat TraIT beschikbaar stelt in de Knowledge
base van TOPdesk. Het betreft een MS Access bestand: CRFversies_SPSS.mdb. De
volgende handelingen zijn nodig:
1. Open CRFversies_SPSS.mdb.
2. Het formulier met de titel “repairan SPSS-syntax file” is geopend. Is dit niet het
geval ga dan in de linker kolom naar het onderdeel formulieren (in een
Engelse MS Access heet dit forms). Dubbelklik op “frmGetSyntaxFile”.
3. Klik op de knop browse, open van de SPSS export het .sps bestand.
4. Klik op de knop repair-script. Dit genereert een SPSS script om het probleem
te repareren voor items met dezelfde naam in de verschillende versies in het
CRF.
Pagina 8 van 12
SPSS met OpenClinica.nl
Versie 0.1
Er verschijnt een boodschap: a new file was created, named: …… (dit bevat
zowel de locatie als de bestandsnaam van het gemaakte bestand)
5. Als SPSS niet meer open staat met het bestand met alle verwerkte data zoals
beschreven in Inlezen van de SPSS bestanden, start dan opnieuw SPSS en
voer het inlezen en genereren van de data uit.
6. Open in SPSS het gegenereerde repair script door File, Open, Syntax,
7. Selecteer alle regels (Ctrl-A)
8. Kies Run (groene pijl)
9. Alle data staat nu in het eerste voorkomen van elk item in de eerste versie van
het CRF.
10. Bewaar het SPSS bestand met de data onder een andere naam door: File,
Save as… Kies type SPSS Statistics (*.sav).
11. Ga terug naar het MS Access bestand
12. Klik op de knop clean-script. Dit genereert een script om de kolommen zonder
data weg te gooien. Er verschijnt een boodschap: a new file was created,
named: …… (dit bevat zowel de locatie als de bestandsnaam van het
gemaakte bestand)
13. Ga terug naar SPSS
14. Kies File, New
15. Sluit het bewaarde .sav bestand.
16. Open het gegenereerde clean script door File, Open, Syntax,
17. In de eerste regel wijzig
GET FILE = 'c:\oc\trait\topdesk\robin\robin_edit_20131213.sav'
en vervang dit door het bestand met de locatie en naam die in stap 10
gemaakt is
18. Selecteer alle regels (Ctrl-A)
19. Kies Run (groene pijl). Nu worden alle extra kolommen verwijderd.
20. Bewaar het bestand als de basis voor verdere analyse.
Opmerkingen:
Als een CRF versie verwijderd is zal de data die voor subjecten is ingevoerd niet
geëxporteerd worden! Zorg dat deze data handmatig gemigreerd wordt, of reactiveer
de CRF versie
8.c. Items in eenRepeatedItemGroup
In SPSS is het voor sommige analysis juist handig als er niet één rij per patiënt is,
bijvoorbeeld bij AEs en medicatie. Als deze pagina’s zijn opgezet als
RepeatingItemGroupvragen, dan kunnen er problemen ontstaan bij het variables to cases
proces.
Het definitief voorbereiden van de analyse scripts is lastig, omdat het aantal rijen dat in de
data zal komen niet vaststaat.
Een ander probleem is dat kolommen waarin nog geen data zijn ingevoerd niet voorkomen in
de export.
Voor het proces variables to cases moet van ieder uiteindelijke variabele evenveel
beginvariabelen aanwezig zijn. Dus als er items in een RepeatingItemGroupstaan dan moet
voor elk item in elk geval in één van regels ergens data ingevuld zijn.
Wat te doen:
Maak - ter voorkoming van problemen - in een test site voor alle CRF met
RepeatingItemGroups een of meer subjecten aan waarbij elk item in elk geval op een
van de regels een keer ingevuld is. Dan zullen onafhankelijk van het aantal regels die bij
Pagina 9 van 12
SPSS met OpenClinica.nl
Versie 0.1
andere subjecten worden ingevuld, genoeg items gegenereerd worden om het variables
to cases proces uit te voeren.
8.d. SPSS toont bij items meerdere waarden gescheiden door komma’s
Voor items van het type checkbox of multi-select worden meerdere waarden in een item
getoond. In SPSS staan alle gegevens van één item in een kolom met komma’s
gescheiden.
Wat te doen:
Er zijn twee mogelijkheden.
TraIT heeft een tooltje (Checkbox_utility_ SPSS) om dit automatisch te verwerken. Als dit
tooltje wordt gerund, zal voor elke respons optie een aparte kolom worden aangemaakt
en de geselecteerde respons zal in de betreffende kolom worden geplaatst.
Je kunt dit hulpmiddel downloaden uit de Knowledge base van TOPdesk.
Ook kun je ervoor kiezen om zelf extra variabele namen te maken en deze met behulp
van SPSS om te zetten.
Voor elke variabele met dergelijke inhoud zouden zoveel nieuwe variabelen gemaakt
moeten worden als er opties zijn. Elke optie die gekozen wordt krijgt dan een waarde bij
de betreffende variabele.
In het onderstaande voorbeeld worden bij een checkbox item met de naam
OPEN_CLIN_VRAAG 5 nieuwe variabelen aangemaakt, evenveel als er antwoord opties
zijn bij het checkbox item. Dit gebeurt met behulp van de volgende SPSS syntax.
COMPUTE ANTWOORDOPTIE1=0.
COMPUTE ANTWOORDOPTIE2=0.
COMPUTE ANTWOORDOPTIE3=0.
COMPUTE ANTWOORDOPTIE4=0.
COMPUTE ANTWOORDOPTIE5=0.
EXECUTE.
Er zijn nu 5 nieuwe variabelen die de waarde 0 hebben.
Vervolgens moet geëvalueerd worden welke antwoordopties gekozen zijn per subject.
Dit gebeurt met onderstaande syntax.
IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'1')>0) ANTWOORDOPTIE1=1.
IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'2')>0) ANTWOORDOPTIE2=1.
IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'3')>0) ANTWOORDOPTIE3=1.
IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'4')>0) ANTWOORDOPTIE4=1.
IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'5')>0) ANTWOORDOPTIE5=1.
EXECUTE.
De functie “CHAR.INDEX” geeft de positie binnen “OPEN_CLIN_VRAAG” waarop de
opgegeven code tekst zich begint. Wanneer de positie groter is dan 0 is deze antwoord
optie gekozen en zal de variabele op 1 gezet worden.
Stel dat voor een subject de waarde van “OPEN_CLIN_VRAAG” is “1,2,4”, dit betekent
dat de opties 1, 2 en 4 aangekruist zijn. Wanneer SPSS de regel
IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'4')>0) ANTWOORDOPTIE4=1.
uitvoert, zal CHAR.INDEX(OPEN_CLIN_VRAAG,'4' de waarde 5 hebben.
Omdat dit groter is dan 0 zal ANTWOORDOPTIE4 de waarde 1 krijgen
Pagina 10 van 12
SPSS met OpenClinica.nl
Versie 0.1
Geef de variabelen nieuw valuelabels via:
VALUE LABELS ANTWOORDOPTIE1 ANTWOORDOPTIE2 ANTWOORDOPTIE3
ANTWOORDOPTIE4 ANTWOORDOPTIE5
0 "No"
1 "Yes"
8.e. Er missen gegevens in export naar STATA.
Bij het bewaren van SPSS gegevens naar STATA-bestand wordt een deel van de data niet
meegeleverd. De valuelabels komen alleen mee als de variabelen in SPSS zijn getypeerd
als een number i.p.v. een string. Tijdens de bouw van het CRF is een item van het type radio
of single-select gemaakt en met een data_type ST. Echter de waarden die opgeslagen
worden zijn alleen getallen. SPSS zelf kan hier wel analyses mee uitvoeren, dit probleem is
alleen relevant voor STATA exports.
Het is te zien aan het .sps bestand dat bij elke variabele waarbij zich dit voordoet achter de
naam in het onderdeel GET DATA een A1 staat.
Wat te doen:
Een mogelijkheid is het handmatig aanpassen van de data.
Een alternatief is het gebruik van een hulpmiddel die TraIT beschikbaar stelt.
Het betreft een MS Access bestand: “ST_naar_INT_SPSS_20131108.mdb”. De
volgende handelingen zijn nodig
1. Voordat dit hulpmiddel gebruikt kan worden moet eerst een extra export van
OpenClinica gedraaid worden in een ander formaat dan SPSS.
2. Kies in OpenClinica Tasks, View Datasets, Export DataSet op de regel van de
dataset die gebruikt wordt voor de analyse.
3. Kiesbij CDISC ODM XML 1.3 Clinical Data : Run Now
4. Kies Back to Dataset.
5. Er moet een bestand gemaakt zijn dat begint met de naam odm1.3 (is die er
nog niet dan duurt het even voor het bestand klaar is)
6. Download het bestand en extract de gegevens uit het .zip bestand.
7. OpenST_naar_INT_SPSS_20131108.mdb.
8. Het formulier met de titel ‘Get studyMetadataandClinicalDatafroman ODM file”
is geopend.Is dit niet het geval ga dan in de linker kolom naar het onderdeel
formulieren (in een Engelse MS Access heet ditforms). Dubbelklik op
“frmGetClinicalData”.
9. Klik op de knop browse, open het odm bestand met de extensie.xml.
10. Klik op de knop getmetadata.
11. Als het programma klaar is klik dan op de knop remove HTML-tags.
12. Zoek in de linker kolom bij het onderdeel formulieren (in een Engelse MS
Access heet ditforms). Dubbelklik op “frmGetSyntaxFile”.
13. Het formulier “repair an SPSS-syntax file” is geopend.
14. Klik op de knop browse, open van de SPSS export het .sps bestand.
15. Klik op de knoprepair-script. Dit genereert een SPSS script om het probleem
te repareren voor items met dezelfde naam in de verschillende versies in het
CRF.
Er verschijnt een boodschap: a new file was created, named: …… (dit bevat
zowel de locatie als de bestandsnaam van het gemaakte bestand)
16. Start SPSS met hetrepair script in plaats van het door OpenClinica gemaakte
script. Pas de regel achter FILE = aan met de locatie en de bestandsnaam
van het spss dat bestand. En genereer de data.
17. Deze is nu wel te bewaren als STATA
Pagina 11 van 12
SPSS met OpenClinica.nl
Versie 0.1
Appendix1. Data van eerdere versies van OpenClinica
OpenClinica.nl draait versie 3.1.4.1. Als er nog data ingelezen moet worden die uit eerdere
versies van OpenClinica geëxporteerd zijn of bij studies die in eerdere versies van
OpenClinica gecreëerd zijn, dan kan het zijn dat er wat extra handelingen gedaan moeten
worden.Bij het .sps bestand moeten enkele extra zaken veranderd worden:
1. De date velden moeten veranderd worden, de SPSS export van OpenClinicastaat
niet in de Amerikaanse notatie. Doe een zoek ADATE10 en vervang alle door
SDATE10 (American date versus standarddate)
2. Om te corrigeren voor het gebruik van decimalen moet de volgende regel toegevoegd
wordenaan het begin van de syntax (voor het binnen halen van de data):
SET LOCALE = 'en_US.windows-1252'.
SHOW LOCALE.
Aan het eind kun je opnemen:
SET LOCALE='nl_NL'.
SHOW LOCALE.
3. Verwijder in het SPSS syntaxbestand alle woorden BLANKS.
4. Studies die gemaakt zijn in eerdere versies OpenClinica kunnen itemnamen hebben
met een -. SPSS zal een error geven: illegalvariable name. Verwijder dan alle
streepjes
Pagina 12 van 12