Utente:Sannita/Aggiornamenti personali: differenze tra le versioni

Da Wikimedia Italia.
Vai alla navigazione Vai alla ricerca
m (fix)
(aggiorno)
Riga 11: Riga 11:
== Modus operandi ==
== Modus operandi ==
# Unificare le due liste di partenza --> {{Fatto}} limitatamente alla lettera A, {{Incorso}} per il resto
# Unificare le due liste di partenza --> {{Fatto}} limitatamente alla lettera A, {{Incorso}} per il resto
# Ottenere una prima lista (ridotta) di schede con cui iniziare a lavorare --> {{Incorso}}
# Ottenere una prima lista (ridotta) di schede con cui iniziare a lavorare --> {{Fatto}}
# Verificare quante delle schede di partenza hanno una voce corrispondente su Wikipedia
# Verificare quante delle schede di partenza hanno una voce corrispondente su Wikipedia
# Trasformare i link a Wikipedia in link a Wikidata
# Trasformare i link a Wikipedia in link a Wikidata
Riga 29: Riga 29:
# parte dei record non sono stati comunicati al VIAF per ragioni a me sconosciute.<ref>E che, tutto sommato, non ci interessa sapere.</ref>
# parte dei record non sono stati comunicati al VIAF per ragioni a me sconosciute.<ref>E che, tutto sommato, non ci interessa sapere.</ref>


Attualmente, sto spulciando – sempre a mano questi 270 record per cercare di ottenere qualche altra identità fra SBN e VIAF. Per il momento, ne ho ottenuti circa una centinaio, ma conto di aumentare sensibilmente l'output.
Dopo aver controllato a mano anche questi record e aver impiegato qualche altro trucco per rosicchiare qualche altro numero, ho ottenuto una lista iniziale di 6539 schede di autorità. Moltissime di queste hanno sicuramente una voce su Wikipedia, anzi molte hanno addirittura un riferimento a essa nel campo "fonte".
 
Indicativamente, avremo una lista di partenza di circa 6500 record con cui passare al punto 3 ("quanti di questi record hanno una voce su Wikipedia?").


== Statistiche ==
== Statistiche ==
Tutte le statistiche sono aggiornate a: 22:44, 14 set 2013 (CEST)
Tutte le statistiche sono aggiornate a: 03:08, 16 set 2013 (CEST)


* 45 codici SBN sono già stati controllati e rimossi dalla lista (tutti fatti a mano);<ref>Per quanto possa interessare, ho anche creato una nuova voce su Wikipedia ([[:it:Mino Argentieri]]), a conferma che possiamo sfruttare questa collaborazione per ampliare il nostro patrimonio di voci.</ref><ref>Dimenticavo: per uno di questi, c'è un problema per cui bisogna informare l'ICCU.</ref>
* 6539 codici SBN sono pronti per essere verificati via bot;
* 6411 codici SBN sono pronti per essere verificati via bot (dato che prevedo crescerà ancora fino a 6500, perlomeno);
* 48 codici SBN sono già stati controllati e rimossi dalla lista (tutti fatti a mano);<ref>Per quanto possa interessare, ho anche creato una nuova voce su Wikipedia ([[:it:Mino Argentieri]]), a conferma che possiamo sfruttare questa collaborazione per ampliare il nostro patrimonio di voci.</ref><ref>Dimenticavo: per uno di questi, c'è un problema per cui bisogna informare l'ICCU.</ref>
* 123 codici SBN sono attualmente sotto scrutinio manuale (e che per il 99% finiranno nelle voci da verificare via bot);
* 13 codici SBN presentano "problemi" di varia natura e sono stati inseriti in una lista a parte;
* 13 codici SBN presentano "problemi" di varia natura;
* 38705 codici SBN necessitano ancora di un nome (dato in lentissima decrescita).
* 38754 codici SBN necessitano ancora di un nome (dato in lentissima decrescita).


== Note ==
== Note ==
<references />
<references />

Versione delle 01:08, 16 set 2013

Obbiettivo

Integrare i codici delle schede di autorità del SBN (e se li abbiamo, i corrispettivi codici VIAF) in Wikidata.

Obbiettivo secondario (come in "se capita, sennò non è affar nostro"): aiutare l'ICCU a uscire dall'isolamento nel VIAF, suggerendo a Max Klein di unificare i record.[1]

Benefici attesi

  • Creazione di un collegamento fra i progetti WMF (tramite Wikidata) e il SBN (che potrebbe diventare fonte per una lunga serie di dati)
  • Creazione di una lista di potenziali voci enciclopediche per Wikipedia (SBN ha anche le fonti nelle sue schede di autorità)
  • Possibilmente, un accordo fra WMI e ICCU per approfondire la collaborazione

Modus operandi

  1. Unificare le due liste di partenza --> Yes check.png Fatto limitatamente alla lettera A, Wip.jpg In corso per il resto
  2. Ottenere una prima lista (ridotta) di schede con cui iniziare a lavorare --> Yes check.png Fatto
  3. Verificare quante delle schede di partenza hanno una voce corrispondente su Wikipedia
  4. Trasformare i link a Wikipedia in link a Wikidata
  5. Ottenere una lista finale (XML?) in cui a ogni codice SBN corrisponde un link a Wikidata (e possibilmente al VIAF)
  6. Far correre il bot
  7. Ripetere le operazioni per ogni successivo aggiornamento dei dati

Situazione

Abbiamo due liste di partenza:

  1. circa 42000 record con identità SBN = VIAF, ma senza nomi (ottenuta da VIAF);
  2. circa 6600 record con identità SBN = nomi, ma senza VIAF (ottenuta da SBN).

Entrambe le liste sono di livello 97, ossia di massimo livello di qualità certificato dall'ICCU.

Con sprezzo del pericolo (e delle possibilità di farmi venire il tunnel carpale a 28 anni), ho unito a mano le due liste. Mentre le univo, mi sono accorto che circa 270 record della seconda lista non avevano un corrispettivo nel VIAF, per due motivi:

  1. parte dei record sono pseudonimi o alias, dunque redirigono alla scheda corretta;
  2. parte dei record non sono stati comunicati al VIAF per ragioni a me sconosciute.[2]

Dopo aver controllato a mano anche questi record e aver impiegato qualche altro trucco per rosicchiare qualche altro numero, ho ottenuto una lista iniziale di 6539 schede di autorità. Moltissime di queste hanno sicuramente una voce su Wikipedia, anzi molte hanno addirittura un riferimento a essa nel campo "fonte".

Statistiche

Tutte le statistiche sono aggiornate a: 03:08, 16 set 2013 (CEST)

  • 6539 codici SBN sono pronti per essere verificati via bot;
  • 48 codici SBN sono già stati controllati e rimossi dalla lista (tutti fatti a mano);[3][4]
  • 13 codici SBN presentano "problemi" di varia natura e sono stati inseriti in una lista a parte;
  • 38705 codici SBN necessitano ancora di un nome (dato in lentissima decrescita).

Note

  1. Questo non dipende da noi, ma dalle possibilità (o più prosaicamente, dalla voglia di lavorare) di Max.
  2. E che, tutto sommato, non ci interessa sapere.
  3. Per quanto possa interessare, ho anche creato una nuova voce su Wikipedia (it:Mino Argentieri), a conferma che possiamo sfruttare questa collaborazione per ampliare il nostro patrimonio di voci.
  4. Dimenticavo: per uno di questi, c'è un problema per cui bisogna informare l'ICCU.