novelli google crescono :)

Voglio qui esprimere pubblicamente, e magari ampliare, un concetto espresso durante il talk di ludo e soci sulla nuova top100;

Ho detto che se prima il lavoro mi sembrava serio e ammirevole, con le novità introdotte lo elevo al rango di VENERABILE.
Ci troviamo di fronte, a mio avviso, a un progetto articolato e non semplice, certamente perfettibile, ma a crescita rapida. Io ho a che fare in qualche modo con i motori di ricerca, e vedo nel lavoro dietro alla top100 molti dei concetti usati da chi i motori di ricerca li studia per benino:

Il peso dato ai vari fattori che compongono il ranking, e che produce un numero come 3.95620 (cioè quello che oggi è associato al numero #1 della classifica, macchianera) è o non è nel suo piccolo un algoritmo di [[page_rank]]?

il crawler della top100, in grado di estrapolare i link dai post e di immagazzinare il contenuto dei post è o no un Googlebot in erba?

il fatto di spingere a usare feedburner e abilitare l’autodiscovery, piuttosto che mostrare il feed completo, fa parte o no di una serie di linee guida al pari di quelle di Google che i webmaster seguono scrupolosamente?

E se è vero che l’efficacia, quindi il successo, di un motore di ricerca si misura in base alla pertinenza dei risultati con l’aspettativa di chi esegue la ricerca (per tacere del supporto ai caratteri speciali come stringhe tra virgolette, più, meno, eccetera), il fatto che praticamente tutti dicono che tira fuori solo risultati buoni e che molti iniziano a linkare i risultati della ricerca della top100 invece di quella di technorati è o no una conferma di quel che dico? :)

Peraltro non ho avuto il coraggio di dirlo in sala perché temevo il linciaggio ma ho l’impressione che quella nuvola, quella grossa al centro della galassia-blogosfera, sia la prova visiva che effettivamente c’è una forte autoreferenzialità nei blogger :)
Questo però non significa che la nuvola non crescerà. Sta solo e soltanto a noi inglobare anche le periferie…

ADDED: Gli editor, che controllano i blog prima di includerli per non far entrare spamblog o ammassi di template, non sono dei Quality rater?

Tambu grazie dei complimenti, fanno davvero piacere. Per ora è l’unica moneta che ripaga gli sforzi fatti.

Come giustamente dici il nostro servizio è perfettibile, ci sono infatti tantissime cose da fare tra aggiustamenti, refactoring e nuove funzionalità. Però forse siamo sulla strada buona…

Io conosco poco i motori di ricerca, ma credo di avere abbastanza idea di cosa sia un blog e come siano le relazioni tra blog, e la classifica è un tentativo di quantificarle in maniera oggettiva e misurabile. In questo senso il nostro ranking è una sorta di pagerank, o di “meta pagerank” dato che usa altri indici tra cui il pagerank di Google.

Il motore di ricerca è scritto da un russo, c’è voluto un po’ a scovarlo ma effettivamente funziona bene, ed è incredibilmente veloce. Va migliorato anche questo, soprattutto per consentire ricerche con operatori simili a quelli di google, che ormai posso essere considerati uno standard.

Sulla autoreferenzialità, beh non ci vedo niente di male, in fin dei conti quando arriva qualcuno di nuovo che ha cose interessanti da dire il cerchio di solito si allarga e lo include.

no, nemmeno io ci vedo troppo di male, purché la nuvola cresca e non rimanga stabile nel tempo :)

per il motore di ricerca va bene il codice delle query, ma se sotto non hai un buon db dal quale prendere i dati…
quando avete iniziato a crawlare i post, non avevo nemmeno lontanamente intuito cosa avreste potuto farne di quei dati :)

Beh, a usare i dati siamo solo all’inizio, mica sono tutte qui le idee che abbiamo :)

Ti faccio anche io i miei complimenti!

autoreferenziale?
forse, ma ludo potrebbe spiegarci meglio come viene generata quella nuvola: se, come credo, si prendono in considerazione solo i link fra blog escludendo eventuali link esterni alla “blogsfera italiana”, è facile immaginare che la “nube” presenti pochi nuclei di aggregazione, se invece si considerano anche i link esternei alla “blogsfera italiana” mi aspetto di trovare anche nuclei di aggregazione esterni tipo, per esempio flickr

Beh, la nube al centro significherebbe autoreferenzialità se nei link esaminati ci fossero anche non-blog e se questi fossero al margine. Ma non essendoci questa analisi la nube al centro significa solo che ci alcuni blog che si linkano spesso.

se ci fossero siti esterni che senso avrebbe? se tutti linkano una sito, che per sua natura non linka nessuno, sempre a margine resta :)