Voglio qui esprimere pubblicamente, e magari ampliare, un concetto espresso durante il talk di ludo e soci sulla nuova top100;
Ho detto che se prima il lavoro mi sembrava serio e ammirevole, con le novità introdotte lo elevo al rango di VENERABILE.
Ci troviamo di fronte, a mio avviso, a un progetto articolato e non semplice, certamente perfettibile, ma a crescita rapida. Io ho a che fare in qualche modo con i motori di ricerca, e vedo nel lavoro dietro alla top100 molti dei concetti usati da chi i motori di ricerca li studia per benino:
Il peso dato ai vari fattori che compongono il ranking, e che produce un numero come 3.95620 (cioè quello che oggi è associato al numero #1 della classifica, macchianera) è o non è nel suo piccolo un algoritmo di [[page_rank]]?
il crawler della top100, in grado di estrapolare i link dai post e di immagazzinare il contenuto dei post è o no un Googlebot in erba?
il fatto di spingere a usare feedburner e abilitare l’autodiscovery, piuttosto che mostrare il feed completo, fa parte o no di una serie di linee guida al pari di quelle di Google che i webmaster seguono scrupolosamente?
E se è vero che l’efficacia, quindi il successo, di un motore di ricerca si misura in base alla pertinenza dei risultati con l’aspettativa di chi esegue la ricerca (per tacere del supporto ai caratteri speciali come stringhe tra virgolette, più, meno, eccetera), il fatto che praticamente tutti dicono che tira fuori solo risultati buoni e che molti iniziano a linkare i risultati della ricerca della top100 invece di quella di technorati è o no una conferma di quel che dico? 🙂
Peraltro non ho avuto il coraggio di dirlo in sala perché temevo il linciaggio ma ho l’impressione che quella nuvola, quella grossa al centro della galassia-blogosfera, sia la prova visiva che effettivamente c’è una forte autoreferenzialità nei blogger 🙂
Questo però non significa che la nuvola non crescerà. Sta solo e soltanto a noi inglobare anche le periferie…
ADDED: Gli editor, che controllano i blog prima di includerli per non far entrare spamblog o ammassi di template, non sono dei Quality rater?
Tambu grazie dei complimenti, fanno davvero piacere. Per ora è l’unica moneta che ripaga gli sforzi fatti.
Come giustamente dici il nostro servizio è perfettibile, ci sono infatti tantissime cose da fare tra aggiustamenti, refactoring e nuove funzionalità. Però forse siamo sulla strada buona…
Io conosco poco i motori di ricerca, ma credo di avere abbastanza idea di cosa sia un blog e come siano le relazioni tra blog, e la classifica è un tentativo di quantificarle in maniera oggettiva e misurabile. In questo senso il nostro ranking è una sorta di pagerank, o di “meta pagerank” dato che usa altri indici tra cui il pagerank di Google.
Il motore di ricerca è scritto da un russo, c’è voluto un po’ a scovarlo ma effettivamente funziona bene, ed è incredibilmente veloce. Va migliorato anche questo, soprattutto per consentire ricerche con operatori simili a quelli di google, che ormai posso essere considerati uno standard.
Sulla autoreferenzialità, beh non ci vedo niente di male, in fin dei conti quando arriva qualcuno di nuovo che ha cose interessanti da dire il cerchio di solito si allarga e lo include.
no, nemmeno io ci vedo troppo di male, purché la nuvola cresca e non rimanga stabile nel tempo 🙂
per il motore di ricerca va bene il codice delle query, ma se sotto non hai un buon db dal quale prendere i dati…
quando avete iniziato a crawlare i post, non avevo nemmeno lontanamente intuito cosa avreste potuto farne di quei dati 🙂
Beh, a usare i dati siamo solo all’inizio, mica sono tutte qui le idee che abbiamo 🙂
Ti faccio anche io i miei complimenti!
[…] Vi spiega tutto Tambu […]
autoreferenziale?
forse, ma ludo potrebbe spiegarci meglio come viene generata quella nuvola: se, come credo, si prendono in considerazione solo i link fra blog escludendo eventuali link esterni alla “blogsfera italiana”, è facile immaginare che la “nube” presenti pochi nuclei di aggregazione, se invece si considerano anche i link esternei alla “blogsfera italiana” mi aspetto di trovare anche nuclei di aggregazione esterni tipo, per esempio flickr
Beh, la nube al centro significherebbe autoreferenzialità se nei link esaminati ci fossero anche non-blog e se questi fossero al margine. Ma non essendoci questa analisi la nube al centro significa solo che ci alcuni blog che si linkano spesso.
se ci fossero siti esterni che senso avrebbe? se tutti linkano una sito, che per sua natura non linka nessuno, sempre a margine resta 🙂
[…] Sono appena entrato, dopo due giorni dalla mia segnalazione, nella migliore classifica dei blog italiani, e il numero nel titolo è la mia attuale posizione. Molto bassa, come è logico (i blog iscritti sono oggi 2201), ma pensavo anche peggio. Stare in classifica non serve a gareggiare ma ad avere sempre sott’occhio una metrica seria e scientifica che dà l’idea di quale sia la posizione di un blog, intesa non come valore assoluto ma come quantità e qualità di rapporti con il resto della blogosfera. Io so di non aver mai fatto molto per aumentare il ranking: lascio pochi commenti e sempre, più o meno, sugli stessi blog, ho un blogroll abbastanza scarno e non costruito con l’intenzione di essere più visibile. E soprattutto i miei post sono delle pizze mostruose che giusto gli amici leggono per simpatia, e occasionalmente qualche altro disgraziato con il gusto dell’orrido Scherzo, ma non troppo. So di non essere popolare (in senso tecnico), e non è fondamentale esserlo. Fondamentale è per me capire i meccanismi della popolarità, quindi userò lo strumento di blogbabel (non ho ancora capito, anche dopo la presentazione al barcamp, se devo chiamarlo così o no) e proverò a sperimentare qualcosa di diverso. I grafi presentati al barcamp sono entusiasmanti, come entusiasmante è il metodo che si sta mettendo a punto per avere una fotografia reale dei rapporti tra i blog italiani: Tambu ha descritto bene le ragioni di questo entusiasmo. Una cosa, a prima vista, non capisco: perché Technorati mi dà solo due link da blog se sono sicuramente almeno il doppio (e direi qualcosa di più)? Posso ipotizzare che la mia posizione su Technorati (e di conseguenza anche su blogbabel) sia sottostimata, seppure di poco? […]