I formati


I formati dei file

Il formato CSV

Il formato CSV (sigla che sta per comma-separated values) è un formato di file basato su file di testo utilizzato per l'importazione ed esportazione di una tabella di dati.

Non esiste uno standard formale che lo definisca, ma solo alcune prassi più o meno consolidate inoltre il formato CSV non specifica una codifica di caratteri, né la convenzione per indicare il fine linea.
Nel caso più semplice solitamente valgono le seguenti regole:

  1. i campi sono separati da virgola e vengono racchiusi tra doppi apici se contengono virgole;
  2. le linee sono separate da un carattere 'a capo';
  3. è preferibile non lasciare spazi prima e dopo i campi (se intenzionali, tali spazi vanno racchiusi tra doppi apici);
  4. per rappresentare un carattere di doppio apice in un campo occorre raddoppiarlo e racchiudere il campo tra doppi apici: " diventa "";
  5. per rappresentare un’interruzione di riga in un campo, occorre racchiudere il campo tra doppi apici.

Per un approfondimento si veda anche:

https://it.wikipedia.org/wiki/Comma-separated_values


Il formato XML

L’XML (sigla di eXtensible Markup Language) è un metalinguaggio per la definizione di linguaggi di markup, ovvero un linguaggio marcatore basato su un meccanismo sintattico che consente di definire e controllare il significato degli elementi contenuti in un documento o in un testo.

Il nome indica che si tratta di un linguaggio marcatore (markup language) estensibile (eXtensible) in quanto permette di creare tag personalizzati.

Un documento XML deve essere ben formattato e pertanto deve possedere le seguenti caratteristiche:

  •  un prologo, che è la prima istruzione che appare scritta nel documento: nel caso dell'xml della Corte costituzionale il prologo è costituito da: <xml version="1.0" encoding="UTF-8">;
  • un unico elemento radice (ovvero il nodo principale, chiamato root element) che contiene tutti gli altri nodi del documento: sono radici i tag <pronunce> e <massima> dei rispettivi archivi;
  • all'interno del documento tutti i tag devono essere bilanciati.

Se il documento XML non contiene errori si dice Well Formed (ben formato). Se il documento è well formed e in più rispetta i requisiti strutturali definiti nel file DTD o schema XML associato viene definito Valid (valido).

Naturalmente rispetto all'HTML, l'XML ha uno scopo diverso: l'html definisce una grammatica per la descrizione e la formattazione di pagine web (il layout) e di ipertesti mentre l'xml è un metalinguaggio utilizzato per creare nuovi linguaggi, atti a descrivere documenti strutturati. 

Infine l'HTML ha un insieme ben definito e ristretto di tag mentre con l'XML è possibile definirne di propri a seconda delle esigenze.

Per un approfondimento si veda anche:

http://www.w3.org/TR/rdf-sparql-XMLres/


Il formato Json

JSON, acronimo di JavaScript Object Notation, è un formato adatto all'interscambio di dati fra applicazioni client-server.

È basato sul linguaggio JavaScript Standard e viene usato in AJAX come alternativa all'XML.

La semplicità di JSON ne ha decretato un rapido utilizzo specialmente nella programmazione in AJAX.

Il suo uso tramite JavaScript è semplice, infatti l'interprete è in grado di eseguirne il parsing tramite una semplice chiamata alla funzione eval(). Questo fatto lo ha reso velocemente molto popolare a causa della diffusione della programmazione in JavaScript nel mondo del Web.

Infine va notato che mentre l’XML è un linguaggio di markup JSON è principalmente un formato di interscambio di dati.

Per un approfondimento si veda anche:

http://json.org/json-it.html


Il formato RDF

Il Resource Description Framework (RDF) è lo strumento base proposto da W3C per la codifica, lo scambio e il riutilizzo di metadati strutturati e consente l'interoperabilità tra applicazioni che condividono le informazioni sul Web.

 È costituito da due componenti principali:

  • RDF Model and Syntax: espone la struttura del modello RDF, e descrive una possibile sintassi;
  • RDF Schema: espone la sintassi per definire schemi e vocabolari per i metadati.

Il modello di dati RDF è formato da risorse, proprietà e valori.

Qualunque cosa descritta da RDF è detta risorsa. Principalmente una risorsa è reperibile sul web, ma RDF può descrivere anche risorse che non si trovano direttamente sul web. Ogni risorsa è identificata da un URI, Universal Resource Identifier.

Le proprietà sono delle relazioni che legano tra loro risorse e valori, e sono anch'esse identificate da URI. Un valore, invece, è un tipo di dato primitivo, che può essere una stringa contenente l'URI di una risorsa.

L'unità base per rappresentare un'informazione in RDF è lo statement. 

Uno statement è una tripla del tipo Soggetto – Predicato – Oggetto, dove il soggetto è una risorsa, il predicato è una proprietà e l'oggetto è un valore (e quindi anche un URI che punta ad un'altra risorsa).

Il data model RDF permette di definire un modello semplice per descrivere le relazioni tra le risorse, in termini di proprietà identificate da un nome e relativi valori. Tuttavia, RDF data model non fornisce nessun meccanismo per dichiarare queste proprietà, né per definire le relazioni tra queste proprietà ed altre risorse. Tale compito è definito da RDF Schema.

Per un approfondimento si veda anche:

 http://www.w3.org/RDF/