OpenICCD: i primi dati aperti ci sono!


(Stefano Costa) #1

Nella sezione OpenICCD del Catalogo Generale dei Beni Culturali sono stati pubblicati da poco i primi dataset, che comprendono principalmente schede OA e RA nelle versioni 2.00 e 3.00.

I dati sono in formato tabellare, scaricabili come CSV o interrogabili tramite API (la piattaforma è basata su DKAN), quindi per ogni combinazione di regione e versione di scheda si avrà una risorsa separata.

Quanti dati sono? Non pochi! Ad oggi si tratta di 128782 record, che non sono esattamente big data ma nemmeno un’inezia. La ripartizione geografica che ho ricavato interrogando la API è la seguente:

Friuli-Venezia Giulia 62
Liguria 80
Emilia Romagna 484
Umbria 531
Veneto 538
Piemonte 1099
Puglia 1474
Marche 1740
Basilicata 2458
Molise 3940
Toscana 5287
Lombardia 7415
Campania 8208
Calabria 11325
Sardegna 14454
Abruzzo 29815
Lazio 39872

So per certo che i dati sono parziali e riguardano solo le schede pubbliche, quindi è molto probabile che la quantità di schede disponibili aumenterà.

Un esempio dei dati si trova qui (prendo la Sardegna come buon auspicio per il prossimo ArcheoFOSS): http://www.catalogo.beniculturali.it/opendata/?q=dataset/regione-sardegna/resource/2462185f-7f41-4280-9c81-9299c3dd05f5 e come vedete include anche le immagini. È probabilmente un po’ strano che i dati non siano forniti nel formato di interscambio ufficiale di ICCD, ma immagino che questo dipenda dal fatto che si tratta di un sistema di pubblicazione separato da SIGEC. Per lo stesso motivo, non è presente un identificativo univoco per ogni record, anche se è implicitamente ricavabile dalla URL dell’immagine associata (ogni scheda in SIGEC ha un identificativo “ICCD” diverso dal NCT, che invece è presente). Sarà interessante andare a verificare nel dettaglio quali interrogazioni sono possibili, ad esempio per ambito cronologico o per materiale, mentre è già facilmente utilizzabile la localizzazione geografica con i due campi appositi.

La licenza di questi dati è Creative Commons - Attribution - Share Alike e mi sembra una ottima base di partenza.

Sarebbe molto interessante approfittare di questi dati durante i workshop ArcheoFOSS, anche per incoraggiarne la manutenzione e moltiplicazione.


OpenICCD - thread su SOD
(P L Buttiglione ) #2

Stefano ho letto ora questo thread altrimenti non ne avrei aperto un altro thread su argomento uguale. Comunque ti risulterà senza dubbio interessante il thread che ho segnalato su SOD.


(P L Buttiglione ) #3

Ciao a tutti,
segnalo questo thread su Spaghetti Open Data
https://groups.google.com/forum/#!topic/spaghettiopendata/NxB-t9WWEts
in cui Andrea Borruso ed altri riferiscono di alcune criticità del catalogo di dati aperti rilasciato dall’ICCD.
Sembra che ci si occupa del mantenimento ed aggiornamento di questo catalogo sia disponibile a ricevere segnalazioni per miglioramenti e suggerimenti. Dovremmo vederci ogni tanto per giocare con dati aperti sul Patrimonio Culturale disponibili! :slight_smile:


(Stefano Costa) #4

Lo script che ho usato per ricavare i conteggi è qui:

Penso che possa essere utile anche come esempio di come interrogare la API (chiaramente migliorabile!) :wink:


(Stefano Costa) #5

Ovviamente sono benvenuti commenti da parte di @piersoft2 @aboruso @marco.montanari :eyeglasses:


(Andrea Borruso) #6

Ovviamente ci tengo a dirvi che è un piacere avere messo il nasone qui dentro :slight_smile:


(marco.montanari) #7

Grazie @steko per averci coinvolti!! :smiley:

Visto che il dataset è aperto e ad esempio in moltissimi casi manca la collocazione geografica del rilevamento, si potrebbe immaginare un percorso di miglioramento partecipato per collocare gli elementi nelle loro posizioni? Sarebbe una bella iniziativa per coinvolgere appassionati e (perchè no) scuole, sulla falsa riga di ASOC e di Monithon…


(P L Buttiglione ) #8

Marco ing. buongiorno! Che immenso piacere ritrovarsi anche qui. In che modo coinvolgeresti appassionati nel miglioramento della georeferenziazione? Negli scorsi anni sono stati avviati diversi progetti archeologici portati avanti anche con il contributo degli utenti, ad esempio in Inghilterra dall’Arts and Humanities Research Council (qui un bando di non troppo tempo fa, 2013-2015). Uno in particolare, Heritage Together aveva come obiettivo la produzione di dati storici in collaborazione con le comunità locali: i ricercatori hanno lavorato con il pubblico per fotografare menhir e tumuli funerari nella zona di Gwynedd, ma non solo, per poi elaborarne modelli 3D.

Ho notato anche io che su molti dei record openICCD manca la georeferenziazione. Stavo ad esempio dando uno sguardo a questo dataset su reperti archeologici della Sardegna. Il motivo per cui ho scaricato questo in particolare è che il prossimo convegno ArcheoFOSS sarà ospitato a Cagliari e volevo informarmi su che dati archeologici sono pubblicati in giro per il web con licenze e formati “opportuni” per un loro eventuale riuso sulla Sardegna. Sono indicati i luoghi di rinvenimento, mancano del tutto le georeferenziazioni.


(marco.montanari) #9

Carissima :smiley:
come ASOC porta un percorso attorno a OC, sarebbe da immaginare in base al territorio un a serie di percorsi magari per le prime e le seconde superiori che consenta di valorizzare i dati, costruire percorsi educativi e da lì raccogliere il dataset “pimpato” prodotto da appassionati e fans… Magari con una piattaforma equivalente a Monithon per questo ambito specifico…


(Anna Maria Marras) #10

Ciao a tutti, mi stavo per prendere il thread :slight_smile:

Come ha già scritto @steko molti di questi dati provengono dalle vecchie schede di Catalogo, alcuni sono stati estratti direttamente dalle schede più recenti su SIGECWEB, lo posso dire con sicurezza perché conosco l’autore delle schede. Lasciando perdere la georeferenziazione, è interessante vedere come la compilazione di alcuni campi, sopratutto MATERIA e TECNICA siano compilati con criteri diversi.

Ad ogni modo, non so se volutamente o meno, in quanto non è dichiarata la licenza (almeno io non l’ho trovata) anche nel Catalogo online http://www.catalogo.beniculturali.it, si possono consultare, scaricare le schede in pdf, ma sopratutto si possono scaricare le foto dei reperti ad una buona risoluzione.


(P L Buttiglione ) #11

Credo i termini di uso del Catalogo siano quelli riportati in questa pagina


(Stefano Costa) #12

4 posts were split to a new topic: Vincoli in Rete / Carta del Rischio


(piersoft2) #16

Grazie a tutti per avermi taggato. leggo un pò e mi faccio un’idea.
Al volo concordo con @marco.montanari per Asoc per la georeferenzazione.
Per il resto sto osservando alcuni dati della Basilicata e mi accordo che manca tanta roba.
Chi mi aiuta a capire il flusso di popolamento di questi dati?
Sono le singole Sovrintendenze?
thanks


(Anna Maria Marras) #17

Ciao brevemente i passaggi principali
Questi dataset vengono dalle campagne di Catalogazione ICCD e sono legate alla richiesta di “n” numeri di catalogo NCTN con cui numerare le schede. Le campagne di catalogazione possono essere anche ad opera degli Enti Schedatore accreditati all’ICCD (nella maggiorparte dei casi Università e Regioni) e poi controllati dal referente regionale e dal funzionario di catalogo della Soprintendenza che è l’ente Competente. Le schede sono inserite direttamente du SIGECWEB e una volta validate dal funzionario sono controllate dai responsabili ICCD, se le schede non sono compilate secondo le indicazioni richieste vengono chieste delle integrazioni.

Qui la situazione della catalogazione in tempo reale

http://www.catalogo.beniculturali.it/sigecSSU_FE/stampaStatisticheSSU.action?nomeBread=Beni%20culturali&sbiancaBreadCrumbs=yes


(Stefano Costa) #18

Ad integrazione della panoramica fatta da Anna aggiungo: questa è la modalità operativa attuale, ma la maggior parte dei dati contenuti in SIGEC (di cui gli open data in questione sono un sottoinsieme) sono il risultato di schedature fatte a partire dal 1970, perciò l’idea di “correggere gli errori” è un po’ semplicisitica, da un lato perché quasi tutti i beni sono all’interno di strutture museali quindi il numero di localizzazioni da correggere è molto inferiore a quello delle schede, dall’altro perché anche il processo di correzione dei dati è formalizzato e passa attraverso la procedura di revisione che principalmente è responsabilità degli enti competenti.

Comunque, scrivendo queste righe e leggendo le vostre domande piene di entusiasmo mi sembra evidente che la prima grande azione da fare sarebbe una grande campagna di informazione e documentazione sui flussi informativi dietro questa e altre banche dati. Al tempo stesso direi che questi dati sono un ottimo strumento operativo per farlo!


(piersoft2) #19

ciao a tutti. è in linea https://telegram.me/archeoartebot leggetevi la sezione info. per ora legge beni catalogati in open iccd per puglia e basilicata. l’idea è creare un blog, wiki o qualsiasi cosa con gli esperti del settore. per ogni bene ricercato, se ci sono aggiunte, curiosità, studi ect , nel bot (nel database insomma) inserisco il link all’approfondimento.
cosi l’utente oltre a leggere la parte formale e catalogativa, legge il contributo della comunità. giusto cosi, un contributo free alla causa.
addendum: http://www.piersoft.it/?p=917 ho scritto sul mio blog qualcosina
piersoft


(piersoft2) #20

ho finito di importare tutta l’italia. ho aperto www.archeoarte.it ed una restauratrice Maria Giovanno Romana ha scritto il suo primo pezzo. siete tutti invitati a scrivere nel blog. sia per avvicinare questo mondo ai cittadini aprendo il concetto culturale di bene, piuttosto che a fare proprio da redattori su un singolo bene catalogato nell’iccd e quindi nel bot. in questo caso metto il link nel bot al pezzo di approfondimento


(piersoft2) #21

ehm ha scritto anche Ledo Prato… a chi tocca ora? :slight_smile: