Flamenco tag e dir

Nel post “la Directory di giorgiotave” si è sviluppata una interessantissima discussione sulle directory, le categorie e i tag. Mi piacerebbe moltissimo se gli autori di quei commenti (ALMENO loro, almeno Matteo, Casper e Giorgio 🙂 ) riprendessero un secondo la cosa qui, perchè forse ho sbagliato e forse ho un’idea.

Io dicevo che i tag e le categorie di una dir non sono fondibili. Casper mi diceva che in fondo non sono poi così diversi. Il nocciolo del problema, secondo me, sta nel fatto che nelle categorie non ci dovrebbero essere elementi duplicati.
Mi fanno notare in ufficio un algoritmo dell’università di Berkeley, chiamato Flamenco. Forse più che un algoritmo in sè è un’interfaccia – gli studiosi la chiamano “navigazione a faccette”, comunque poco importa.
L’implementazione di esempio che prenderemo in considerazione è quella sui premi Noblel.

A prima vista potremmo credere sia una directory a categorie fisse: Sesso, paese d’origine, organizzazione, premio, decennio. Cliccando sul sesso, maschio, però notiamo che effettua una scrematura e ripropone le STESSE restanti categorie. Un ulteriore click su Argentina restringe la consultazione a 5 risultati, che potremo poi eventualmente raffinare con click successivi.

Prima considerazione: i click massimi per avere un risultato (o il massimo livello di scrematura)sono in numero uguale al numero di categorie.
Seconda considerazione: proviamo a cliccare sulla scheda di Bernardo Houssay. Quelli che vediamo accanto, non sono praticamente dei TAG appiccicati alla sua biografia? ve li elenco “alla technorati”: male, argentina, Instituto+de+Biologia+y+Medicina+Experimental, medicine, 1947.

Volendo fare i raffinati, potremmo dire che in realtà è una navigazione a “categorie di tag” – non è un gioco di parole – nel senso che il tag con cui esprimiamo il sesso non potrà mai essere diverso da “maschio” o “femmina”, però in sostanza non è la stessa cosa che ci auto-imponiamo quando usiamo un tag particolare perchè VOGLIAMO che i contenuti che tagghiamo siano aggregati ad un tag preesistente?

Voi come la vedete? E’ davvero una unione dei due concetti, o è solo una modalità di navigazione alternativa a quelle classiche? e allargando il discorso, non potrebbe essere fatta così la directory di domani?

Leave a Reply

11 Comments

  1. Interessante presentazione questa.

    Stiamo parlando di una directory di nicchia. Ancora più interessante perchè pone delle interazioni tra materia, sesso, anno e paese.

    In una directory vasta dovremmo trovare dei comuni denominatori come è stato fatto per il Nobel, ma che prendano tutto il web.

    Quindi un sito si deve riconoscere in vari termini. Prendi un premio Nobel e vedi che avrà tutti i comuni denominatori.

    Ma nel web? E’ possibile farlo….?

  2. tieni conto che quella del nobel è solo una implementazione-demo… ce ne sono anche altre, più vaste, ma mi veniva bene quella per l’esempio.

    secondo me con un buon grado di astrazione si potrebbe pensare a dei denominatori per i siti.

  3. E’ una categorizzazione basata su tag filtrati in AND (e riproposti per ulteriore filtraggio)… O sbaglio?
    Non credo sia un algoritmo così leggero come sembra… Ma è un ottima proposta.
    Solo bisognerebbe consentire di avere qualche risultato prima… Strada facendo.

  4. flexible information access using metadata… affascinante. Berkeley sembra ragionare sulla questione per sintesi piuttosto che per antitesi: simile al concetto che ho provato a suggerire per la directory di Giorgio, ma confesso che non avrei assolutamente saputo concretizzare il mio punto di vista in un’implementazione come Flamenco.

    se riflettiamo un momento sulla necessità per l’utente di rintracciare un’informazione definita in una base di dati per sua natura indefinita e virtualmente illimitata, oltretutto sulla base di una premessa più o meno generica (voglio andare in viaggio: dove vado? mi serve un cellulare nuovo: quale compro? ho una bugna sul piede: che diavolo succede?), si comprende perchè i motori di ricerca abbiano soppiantato le directories. gli algoritmi di Google, piuttosto che quelli di qualunque altro motore, si sforzano di identificare un contenuto definito nel calderone, assegnando una rilevanza più o meno prioritaria alla moltitudine di corrispondenze. in che modo una directory può competere con un approccio di questo tipo? è davvero conveniente per l’utente addentrarsi in una struttura categorizzata in modo per forza di cose rigido, per ritrovarsi con un risultato a) limitato dalla relativa esiguità della base di dati b) limitato dall’inflessibilità delle categorie c) viziato dal giudizio arbitrario di un editor umano, qualora questo esista e si occupi di assegnare rilevanza ai contenuti della directory, e potrei continuare…

    se Giorgio crede nel progetto che ha proposto, lo spunto fornito da Tambu indica una strada innovativa: categorie che indirizzano il percorso e metadati (i tag non sono altro che questo) che definirei ricombinanti, in grado di espandere o comprimere la quantità e qualità dei risultati ad ogni click successivo dell’utente. associato ad un meccanismo tradizionale di selezione affidata a editor umani, ulteriormente arricchito dalla possibilità per il visitatore di esprimere un giudizio sul risultato. è un inizio, ma ancora non abbiamo nulla di “nuovo” sotto il sole.

    concludo: non sarà sfuggito a nessuno, immagino, il lavoro di Ludo su un algoritmo di ranking dei blog italiani [ http://top100.qix.it/metrics/ ]. qui non interessa l’applicazione specifica, ma la metodologia: usare API di fonti diverse per “bilanciare” un risultato. ecco, trovo che sarebbe davvero innovativa una web directory che domandi al visitatore cosa sta cercando (in linguaggio naturale), usi questa informazione per proporre una serie di categorie di partenza, rese dinamiche dall’implementazione del principio alla base di Flamenco, i cui risultati vengano organizzati e ottengano priorità in virtù di un algoritmo analogo a quello elaborato da Ludo. se dovessi vedere qualcosa del genere online, griderei al miracolo.

  5. casper: mi fai paura 🙂 ma ti ho appena aggiunto al mio aggregatore 😛

    matteo: mi pare che già al primo click, alla prima scrematura, ci siano tutti i risultati possibili MENO quelli esclusi dal click stesso, e via così. o no?

  6. zuck

    Sottoscrivo il dottor Casper. Secondo il mio modestissimo parere, non si puo’ confondere quello che fanno i motori di ricerca con la funzione dei raggruppamenti di siti (o come vogliamo chiamarli), siano esse directory a categorie (yahoo) o a tags (technorati del.icio.us).
    Essenzialmente, la necessita’ di un intervento umano insita nel concetto di directory o di tagging limita il numero di porzione del web analizzabile.
    Se vogliamo fondere i concetti di tag e categorie l’interfaccia Flamenco mi sembra lo faccia egregiamente.
    Il passo successivo dovrebbe essere fare un robo che AUTOMATICAMENTE vada in giro per la rete e aggreghi i contenuti secondo i tags e li gerarchizzi secondo le categorie.
    A questo punto il problema principale, a parte quello di estrarre i tags significativi dai siti, sarebbe quello della gerarchizzazione delle categorie.
    Puo’ essere fatta in maniera automatica?
    Esistono algoritmi che minimizzano l’intervento umano?
    E’ una via percorribile?
    Quante cazzate ho scritto?

  7. Faccio notare, riguardo al lavoro di Ludo (lavoro cui collaboro), che la top100 ha preso la strada, tutt’altro che scontata e anzi direi rischiosamente innovativa, di valutare le azioni dei blogger per definire la qualità dei blog stessi.
    Il primo passo è la valutazione pesata di chi usa FeedBurner.

  8. Un algoritmo del genere è difficile da fare, non mi occupo di programmazione a questi livelli, ma metto a disposizione i dati del DB per lavorarci.

    Appena ci siamo sistemati e finito con tutte le migliorie, proveremo a sviluppare un algoritmo in quel senso, ma servono anche programmatori con le 00 😀

    Il lavoro di Ludo è davvero eccezionale, presto dovremmo riuscire a portare il nostro contributo anche li 🙂

    Speriamo 🙂

  9. @Matteo: rischiosamente innovativa è dir poco. io aggiungerei quasi suicida… è anche per questo che funzionerà, e probabilmente aprirà la strada ad un concetto un po meno soggettivo di ranking. si capisce anche dal chiasso infernale che ultimamente sale da certe pagine di periferia, lo sentite il digrignare dei denti? invidie e livori colano a bulacchi (per la traduzione, citofonare Tambu) 😀

    @Tambu: di persona sono anche peggio, guarda che siamo vicini di casa e si rischia di beccarsi per strada da qualche parte 😉

  10. si, me l’ha detto Bilbo 🙂

Next ArticleCiao, io sono un MAC