Nella sezione OpenICCD del Catalogo Generale dei Beni Culturali sono stati pubblicati da poco i primi dataset, che comprendono principalmente schede OA e RA nelle versioni 2.00 e 3.00.
I dati sono in formato tabellare, scaricabili come CSV o interrogabili tramite API (la piattaforma è basata su DKAN), quindi per ogni combinazione di regione e versione di scheda si avrà una risorsa separata.
Quanti dati sono? Non pochi! Ad oggi si tratta di 128782 record, che non sono esattamente big data ma nemmeno un’inezia. La ripartizione geografica che ho ricavato interrogando la API è la seguente:
Friuli-Venezia Giulia 62
Liguria 80
Emilia Romagna 484
Umbria 531
Veneto 538
Piemonte 1099
Puglia 1474
Marche 1740
Basilicata 2458
Molise 3940
Toscana 5287
Lombardia 7415
Campania 8208
Calabria 11325
Sardegna 14454
Abruzzo 29815
Lazio 39872
So per certo che i dati sono parziali e riguardano solo le schede pubbliche, quindi è molto probabile che la quantità di schede disponibili aumenterà.
Un esempio dei dati si trova qui (prendo la Sardegna come buon auspicio per il prossimo ArcheoFOSS): http://www.catalogo.beniculturali.it/opendata/?q=dataset/regione-sardegna/resource/2462185f-7f41-4280-9c81-9299c3dd05f5 e come vedete include anche le immagini. È probabilmente un po’ strano che i dati non siano forniti nel formato di interscambio ufficiale di ICCD, ma immagino che questo dipenda dal fatto che si tratta di un sistema di pubblicazione separato da SIGEC. Per lo stesso motivo, non è presente un identificativo univoco per ogni record, anche se è implicitamente ricavabile dalla URL dell’immagine associata (ogni scheda in SIGEC ha un identificativo “ICCD” diverso dal NCT, che invece è presente). Sarà interessante andare a verificare nel dettaglio quali interrogazioni sono possibili, ad esempio per ambito cronologico o per materiale, mentre è già facilmente utilizzabile la localizzazione geografica con i due campi appositi.
La licenza di questi dati è Creative Commons - Attribution - Share Alike e mi sembra una ottima base di partenza.
Sarebbe molto interessante approfittare di questi dati durante i workshop ArcheoFOSS, anche per incoraggiarne la manutenzione e moltiplicazione.