limbo archivistico

Sperando possa tornare utile ai nostri lettori, riportiamo uno scambio di opinioni tra onq e anal cunt (suoi gli interventi in corsivo) sull’archiviazione di discografie in mp3 su DVD

Vorrei ora farti una domanda di teoria dell’archiviazione: tu come backupperesti gli mp3 su dvd? Nota che io scarico solo dischi interi e ne ho già abbastanza da riempirne una dozzina, ma in che ordine? Ora ti illustro a cosa ho pensato:

1) alfabetico: compro 26 dvd-r, ad ognuno assegno una lettera dell’alfabeto e ci registro sopra gli mp3, quando uno finisce ne marco un altro A2, A3 ecc…

2) cronologico: dedico un dvd agli anni 70, uno agli anni 80 ecc, se ho molti titoli posso anche dividere in anni: uno per il 2003, uno per il 2004 ecc, in questo modo dischi diversi dello stesso gruppo si troverebbero su dvd diversi, ma ci sarebbe uniformità di epoca, e se mi va di ascoltare roba anni 70 non la vado a cercare tra i contemporanei.

3) di genere musicale: mi invento una specie di catalogazione dewey per la musica indie e li suddivido così: un dvd per i gruppi che usano la distorsione, uno per quelli che usano l’elettronica ecc… i limiti di questo metodo sono ovviamente le intersezioni tra generi.

4) ibrido: dedico dvd diversi ai generi che sono più a “compartimento stagno”, tipo cantautori italiani, intere discografie di uno stesso gruppo se sono particolarmente vaste, cose degli anni 60 ecc, poi il resto lo archivio in ordine alfabetico o con altri metodi.

L’alfabetico a prima vista sembrerebbe il metodo più pratico, ma bisogna anche pensare che a me non viene in mente “ora ascolto un gruppo con la N” ma magari ho vagamente un’idea di ascoltare cose degli anni 80, e in questo caso dovrei avere i duran duran e le compilation one shot 80 sullo stesso dvd, quindi sembrerebbe migliore una settorizzazione ad epoche o a generi, e comunque anche con l’ordine alfabetico, se per una lettera dovessi superare la lunghezza di un dvd, potrebbe darsi che, aggiungendo roba man mano che la scarico, il nuovo disco di un qualche gruppo longevo mi vada a finire su un diverso dvd rispetto a tutto il resto della sua discografia. Per questo pensavo di usare solo dvd riscrivibili, anche se costano di più, così da poter spostare, nell’eventualità, album da uno all’altro. Tu che hai la mente scientifica, cosa dici? in letteratura qualcuno si è già posto questo problema? Nota che io sto studiando proprio in questi giorni archivistica per un concorso da bibliotecario, ma non trovo la risposta neanche lì.

Uhh onq, mi chiedi poco.. premesso che io backupperei alla rinfusa, userei i dvd per pareggiare un tavolino e poi il bello non sarebbe sentire un disco ma cercarlo, la tua domanda non ha una soluzione semplice: archiviare un work in progress teoricamente senza fine, quale è lo scaricamento, è un’impresa che fa tremare i polsi. Allora, la gente che ha molti dati eterogenei di solito fa così: usa un programmino di indexing che si occupa di tenere traccia di dove va la roba, il programmino stesso masterizza tutto secondo un ordine che minimizzi lo spreco di spazio (quindi alla rinfusa per noi umani), tu etichetti i dischi con “1”,”2″ eccetera, e quando vuoi qualcosa fai una query al programmino che ti risponde “sta roba è nel disco y, directory x”, oppure direttamente clicchi sui file del database che il programmino ha generato e lui ti dice “inserisci il disco y” e ti fa usare/sentire/vedere il/i file che hai richiesto. Non dubito che tu possa stabilire una sorta di sottoordinamento, cioè farlo lavorare in modo che nel disco y ci sia più o meno la stessa roba. Ovviamente puoi aggiornare il database quando vuoi, aggiungendo o togliendo files, e lui fa tutto in automatico, richiedendoti eventualmente un supporto nuovo per scrivere i nuovi dati. Io simpatizzo per questa soluzione, ma io sono anche quello che per sentire una canzone, faccio partire un “cerca” sull’hd col nome della canzone come parametro. Se vuoi posso informarmi sui nomi dei programmi di indexing e sul loro uso (mai avuto il piacere di usarli), ma solo se davvero lo vuoi. Uno di essi cmq dovrebbe essere norton ghost, se hai voglia di dare un’occhiata. Nota che è quello che spesso si fa in biblioteca. Guarda la mazzini, per dire, che è la biblioteca più vecchia di spezia: hanno talmente tante acquisizioni, ormai, che aggiungono stanzette/scaffaletti più o meno a caso (sarebbe troppo oneroso riprogettare tutto l’ordinamento ogni tot anni), e suppliscono a questa mancanza di ordine proprio con l’indicizzazione: la locazione del libro è univoca, quindi, il bybliotecario (di sardelli) sa come arrivare al libro nuovo anche se è disposto in un posto assurdo nei sotterranei (forse non lo sai, ma la mazzini ha tipo 3 piani di sotterranei umidi e solitari – io prendevo le raccolte di “le scienze” del ’79, ed ho visto). Non ti andasse questa soluzione, ti consiglio l’ordinamento cronologico mischiato con l’ibrido: l’ordinamento di genere potrebbe finire per farti impazzire (non tanto per gli album che hai già, ma per quelli che dovrai inserire: le tassonomie si costruiscono a dati acquisiti); l’ordinamento ibrido te lo consiglo solo se hai cose “a compartimento stagno” molto grosse: una discografia di un autore prolifico/un genere fine a sé stesso ti occupano due dvd? Dedicaglieli e ciao. L’ordinamento alfabetico è pratico da realizzare ma estremamente scomodo da utilizzare; in effetti, è difficile che ti venga voglia di ascoltare solo gruppi che stanno vicini nell’alfabeto. C’è anche da considerare l’aspetto dell’inserimento. tu mi dici: ogni volta che inserisco un album nuovo, riformo l’ordinamento in modo che sia consistente, quale che sia il tipo di ordinamento stesso. Quindi uso supporti riscrivibili. Secondo me, alla lunga, ci vai a diventare scemo. Inserire una cosa in un dvd quasi pieno significa spostare della roba che già c’era in un altro dvd, e così via. Quando di supporti ne hai tanti, magari inserire tre o quattro album nuovi significa ripercuotere il cambiamento su una decina di dischi. E’ come se in biblioteca corressero a spostare gli scaffali ogni volta che acquisiscono una ventina di libri. Potrebbero farlo, ma non avrebbero tempo per restare aperti. Io sono più per l’idea degli snapshot: ora che hai l’hard disk gonfio, prendi la roba che hai ed ordinala intelligentemente sui supporti. Poi aspetta che l’hard disk sia di nuovo pieno e fai la stessa identica operazione: avrai due set di dischi che contengono, che so, anni ’80, uno fatto al primo “sgravarsi” dell’hard disk, uno fatto al secondo. Ciò necessiterà di una piccola indicizzazione (niente di incredibile, solo scrivere i nomi degli album sulla copertina), ma ti risparmierà un buon esaurimento nervoso.

Nella nostra conversazione sull’archiviazione di mp3 vengono fuori le nostre differenze: io sono quello ordinato nel dentro, tu sei l’informatico che mette le cose a cazzo e poi si aiuta col computer. In effetti nelle biblioteche i libri sono numerati con l’ordine di arrivo in archivio, e collocati in modo casuale o quasi (per dimensioni, ad esempio), poi si affida a cartoncini in schedari ordinati alfabeticamente per autore (o col computer, nelle biblio che ce l’hanno) il compito di andare a ritrovare la collocazione di un volume. Questo metodo è però buono per una visione A LUNGO TERMINE dell’archiviazione, è l’unico metodo che può andare avanti per decine di anni. Qui invece siamo davanti ad un metodo di archiviazione di dati che potrebbero subire un brusco arresto entro qualche mese (se dovessi disdire il contratto adsl per qualsiasi motivo, o se soulseek chiudesse o chissà che altro) o, inevitabilmente, qualche anno (quando verranno commercializzati per il grande pubblico dischi fissi da diversi terabytes, o i famosi dvd da 100 giga, o la linea permetterà di scambiarsi i wav, ecc). insomma è certo che non andrò avanti indefinitivamente ad archiviare mp3 con il rate attuale, ma la cosa avrà un termine, e per certi versi il termine è prevedibile. Per tutti gli anni 90 ho accumulato cassette, preoccupandomi per la loro mole crescente, ma arrivati al 2000, quando mi sono comprato il masterizzatore (che solo 3 anni prima ritenevo cosa impensabile) mi sono assestato su circa 400 cassette, per un totale di circa 600 titoli, e le nuove acquisizioni sono pressoché azzerate. Poi sono arrivati i CDR, altro media che ho cominciato ad accumulare famelicamente, ma che ora hanno subito un brusco arresto visto che mi scarico gli mp3, ma nel frattempo, in 4 anni, ne ho accumulati circa 800 pezzi. Ora arrivano gli mp3 con cui riempio i dvd, in circa 3 mesi ho già accumulato circa 1000 album completi. Tutto lascia pensare, però, che non manterrò il rate attuale di 10 album al giorno, anzi ho già rallentato parecchio, probabilmente mi assesterò sotto i 50 album al mese. Io credo che questo metodo di archiviazione debba resistere per un tempo variabile tra gli 1 e i 4 anni, e devo quindi mettere in conto di dover archiviare da un minimo di 2000 ad un massimo di 5000 album (standoci molto larghi, alla fine probabilmente non supererò i 3000), e considerando che su un DVD vergine ci stanno una media di 70 album a 192 kbps, è ragionevole pensare che, quando cambierò metodo in favore di dio sa cos’altro, avro comunque meno di 100 dvd. Mi segui? (scusa se la mail è molto lunga, ma è destinata alla pubblicazione, non solo ai tuoi occhi). Il problema è ora trovare un nome a questa archiviazione: possiamo chiamarla BACKUP, in attesa dei dischi fissi da 100 terabyte, o in vista di masterizzare su normali cdr i dischi che mi piacciono di più, diciamo un 5% del totale, nel qual caso un certo disordine (masterizzazione in ordine di arrivo) sarebbe tollerabile, o possiamo chiamarla COLLEZIONE DI DISCHI, fatta per essere usufruita con il lettore dvd ogni giorno, quando ascolto musica (il che capita ogni giorno e tutto il giorno), e allora c’è bisogno di un metodo ordinato e pratico, che risponda alle mie esigenze di ascolto, c’è bisogno di mettere vicini dischi degli stessi artisti o di artisti simili, e in questo caso un ordinamento alfabetico o ibrido (alfabetico + macro-divisione in generi) sarebbe necessario, al costo di non ottimizzare il numero dei dvd impiegati perché, per esempio, il DVD dedicato alla lettera X o Z resterebbe per anni quasi vuoto, mentre alla B verrebbero dedicati 5 o 6 volumi, con conseguente aumento dei dvd impiegati. Nonostante poi il metodo alfabetico sia il più pratico per trovare un disco preciso, si può obiettare che molto spesso non ho voglia di ascoltare un preciso artista, ma qualcosa che suoni così o cosà. Per esempio se voglio ascoltare colonne sonore anni 70, potrei sì gettarmi sicuro sul dvd delle compilation, dove trovo tutte le compilation dedicate al genere, ma rischierei di non ascoltare mai i dischi di un micalizzi o di un bacalov, che invece ascolterei se mettessi su un unico dvd sia le compilation che i vari micalizzi e bacalov. Vero è, pure, che se parliamo di micalizzi e bacalov il compito è piuttosto semplice, trattandosi di un genere ben definito e “stagno”, ma cosa succederebbe se volessi estendere la divisione in generi anche all’elettronica, ai gruppi degli anni 80, ai gruppi di una certa etichetta? Tutti gli insiemi intersecano creando casini. È forte la tentazione di una divisione alfabetica “pura” o di un semplice raggruppamento in ordine di arrivo, dedicandosi poi a un database elettronico per sapere in quale volume si trova questo o quel disco. Ogni metodo ha i suoi gravi svantaggi, ma pure uno dovrò sceglierlo.

Chiamiamola collezione di dischi, visto che la userai e che gli hard disk da un tera sono ancora lontani. Quello che volevo richiamare all’attenzione è che, comunque tu li ordini, rischi di pagare un costo alto di aggiornamento. Mettiamo che tu abbia 100 divudì, in ordine alfabetico, e nel primo dvd, pieno, ci stanno tutti i gruppi con la “a”. Primi di tutti gli abba. Ora mettiamo che ti scarichi la discografia completa degli aardvark, che non so nemmeno se esistano. Devi metterli nel primo dvd perché sei ordinato nel dentro, e adesso tutti i gruppi con la “a” debordano nel secondo dvd, che deborderà nel terzo e così via. Nel caso peggiore devi fare 100 operazioni di rewriting, che è maniacale. Stessa cosa con l’ordinamento per data/periodo. Certo, potresti sempre iniziare un dvd vuoto, che chiamerai “A2”, che adesso contiene solo gli aardvark e conterrà in futuro tutti gli altri gruppi con la “a” che scaricherai. Ma questo soddisfa la tua esigenza malata di ordine?

Altrimenti, ordinali secondo un albero binario o qualche altra struttura dati che ha un tempo di inserimento logaritmico. Poi vengo e ti stringo la mano. Se hai voglia, ti posso prestare testi sulle strutture dati. Una adatta al caso tuo la troverai di sicuro. Per quanto riguarda la classificazione in generi, è una pazzia, per le ragioni che hai espresso anche tu a fine mail. Potresti però indicizzare tutto il contenuto di tutti i dvd (a questo punto ordinati come vuoi o anche non ordinati) e classificare l’indice secondo generi multipli, cioè in modo che ad un singolo album corrispondano uno o più autori, una data, un titolo ed infine uno o più generi e che tu possa fare ricerche sull’indice dato il/i genere/i, l’anno, il titolo, lo/gli autore/i o tutto questo insieme. Ho appena dato basi di dati, creare un database con queste caratteristiche è triviale. Poi ti manca un robot che selezioni automaticamente i dischi, ovviamente comandato da un’applicazione che traduce le richieste dell’utente in query al database, e sei a posto per i prossimi mille anni. Ma creare un ordinamento per generi “a mano” è chiedere troppo alla sorte ed alla teoria dell’archiviazione, secondo il mio umile parere. Rimango comunque favorevole all’approcio ibrido ordinamento per periodo/accorpamento degli album degli autori molto prolifici, come ti dicevo nell’ultima mail.



Credo che siamo di fronte ad un aut-aut molto preciso: o un alfabetico puro, ma tenendo conto solo della prima lettera, o un disordine (cioè in ordine di download) richiamabile da un database fatto anche con excel, senza bisogno di cagate consumistiche tipo norton ghost. Il primo metodo (alfabetico) è più pratico quando si tratta di rintracciare un certo disco preciso, ma ha gli svantaggi di sprecare un sacco di spazio (il dvd dedicato alla Z per ora avrebbe un solo album dentro, e non credo che arriverei mai a 70) ed è anche un ditino nel culo avere dischi dello stesso artista magari su due dvd diversi, ma certamente se io cerco un disco con la A dovrò andarlo a cercare al massimo in 2 o 3 DVD e lo troverei quasi subito. Ordinando solo con la prima lettera eviterei anche travasi e cazzate varie, l’ordine nel dentro sarebbe limitato a livelli accettabili e simile a quello che uso già ora per i CDR, ordinati solo secondo la prima lettera. Sarebbe un buon compromesso tra sbattimento per costruire l’archivio e comodità nel reperire elementi archiviati. Il metodo di mettere i dischi a caso e poi cercarli con excel avrebbe un più alto punteggio in comodità (ed economia in termini di dvd impiegati) di archiviazione, ma un punteggio decisamente più basso in reperimento di elementi archiviati: dovrei accendere il computer e aprire excel ogni volta che cerco un disco, anche se è pur vero che, essendo leggibili solo dal computer, i dvd verrebbero sempre fruiti con il computer acceso a portata di mano. Perciò ad una economicità molto maggiore corrisponderebbe uno sbattimento solo di poco maggiore per reperire un particolare album. Caro mio, tu hai certamente studiato il dilemma del prigioniero e la teoria dei giochi, avrai quindi dimestichezza con gli schemi di payoff:

………Econ………..Prat.

Alfab…..-1………….+1

Random….+1………….-1

Vedi quindi che, ammesso e non concesso che diamo lo stesso peso ai due criteri di selezione (economicità e praticità nel reperimento dati) e lo stesso punteggio ai drawbacks, cosa per altro non scontata (è peggio avere qualche DVD inutile in più o essere costretti ad aprire excel per cercare un disco in una collezione di 20, 30 dvd?) siamo in una situazione di sostanziale parità. Per questo motivo mi accingo a trovare un sistema ibrido, che si appoggi a excel ma non lo renda sempre indispensabile, un sistema che si appoggi alla grande capienza del mio hard disc che può permettersi di archiviare i dati in un limbo archivistico anche per mesi prima che io decida come e con cosa formare un nuovo dvd. Insomma potrei formare i dvd con criteri molto arbitrari e opinabili, riservandomi di affidarmi ad excel per quando non dovessi trovare un disco. Per esempio potrei fare un dvd solo con album nuovi che ho scaricato perché li ho visti recensiti su blowup, e chiamarlo BLOW1, potrei farne uno pieno di compilation e chiamarlo VA1, uno di musica da cinema e chiamarlo OST1. il contenuto di questi DVD poi verrebbe memorizzato su un foglio excel, così che se un domani cercassi quella certa compilation di musica da cinema vista recensita su blow up, e mi fossi dimenticato in quale dei 3 dvd (tutti possibili candidati) l’avevo archiviata, mi affiderei ad excel, ma sarebbe salva la mia abitudine di prendere un dvd ben preciso quando ho voglia di ascoltare musica di un certo tipo e trovarci album di quel genere lì, insieme magari ad altri che hanno la stessa iniziale e non c’entrano un cazzo. Un metodo del genere mi fa venire i brividi, ma quello che è certo è che ora mi metterò a fare prove su prove di possibili raggruppamenti mentali dei 50 giga già scaricati in pacchetti da 4.7.

1 Responses to limbo archivistico

  1. brullonulla ha detto:

    rileggo solo ora questo vecchio post, e ti informo che io catalogo gli mp3 per genere, in poche categorie molto ampie (“indie” , “metal” , “punk” , “avant”, “canzoni” , “elettronica” , “altro” e un paio di altre che non ricordo).

    alla fin fine funziona meglio di quanto si possa pensare.

Lascia un commento