Oggi è ripartito alla grande il meme l’algoritmo per la classifica dei blog è fallace perchè [aggiungete la vostra…] .
Partendo dal presupposto che è tendenzialmente vero, in quanto creato da esseri umani, perchè prende dati statistici, quindi per loro natura non reali ma che rispecchiano un trend, e ci fa sopra una statistica ed in ultimo perchè tutti sanno che gabbare un motore di ricerca non è certo impossibile, anzi.
E per amor di chiarezza tutto ciò viene spiegato da alcune settimane esaurientemente da una FAQ scritta dal sottoscritto insieme agli altri editori della Top100.
Ma la cosa che mi ha dato un pochino fastidio oggi non è tanto questo (trito e ritrito in ML) ma un passaggio (il grassetto è mio) di Tony Siino che spiegando la sua versione dell’errore ne spara una allucinante…
Cito:
La classifica aggregata esclude i blog che forniscono template e secondo me è un errore. Il blog è un CMS, quindi se io volessi riportare ogni giorno (esempio) il mio abbigliamento e i lettori mi leggessero e linkassero non trovo motivi per un’esclusione.
Allora… sarò un maledetto tecnico, puntiglioso e rompicollioni… ma non si può scrivere “Il blog è un CMS“. CMS?! Come si fa a dire che il blog è un Content Management System? Al massimo un blog può usare un cms, ma potrebbe anche essere una banalissima pagina html aggiornata con vi
di tanto in tanto…
Ma non focalizziamoci su queste frivolezze e leggiamo anche il contorno, (imho) il vero errore di fondo.
La classifica aggregata esclude i blog che forniscono template e secondo me è un errore.
[cut]
quindi se io volessi riportare ogni giorno (esempio) il mio abbigliamento e i lettori mi leggessero e linkassero non trovo motivi per un’esclusione.
La classifica elimina i siti di template (non li definisco blog) perchè, dopo una lunga discussione tra gli editori, si è deciso di non considerare blog quei siti che non esprimono un parere personale, non aiutano la discussione, e soprattutto sono dei meri archivi di *qualcosa*. Escludere i siti-archivi di template è simile ad escludere dalla top100 siti come la sezione script php di html.it, la galleria delle immagini di bastardidentro e cose del genere.
Se poi si inizia a spargere l’idea che, in media, per blog si intendono i siti presi in considerazione dal premio WWW allora siamo veramente a posto…
Per quel che riguarda l’articolo/esperimento di Prove Tecniche di Trasmissione:
Premesso che secondo noi lo scopo principale di queste “classifiche” dovrebbe essere quello di far crescere “l’autostima” del blogger [cut]
Una assoluta verità.
E per quel che riguarda i network di amici ed i risultati del tuo “Technorati Bombing” adesso abbiamo la conferma che Technorati non è questo granchè… Ma anche Google a questo punto non si salva, no?
Inoltre siccome mi sento chiamato in causa per un certo paragrafo vorrei ripetere qui quello che qualcun altro ha spiegato in ML.
Basta navigare sui blog di alcuni autori e balza immediatamente all’occhio che il risultato è dopato [cut]
L’algoritmo è di pubblico dominio e chiunque con un poco di pazienza può fare i test di confronto per valutarne la bontà.
Sul resto del paragrafo avevo scritto un tema, poi l’ho riletto prima di pubblicare e siccome oggi di “trollate” ne ho fatte abbastanza ho deciso di tagliare e passare oltre.
Nota di colore… la top100 dei blog italiani è di (estrema) sinistra.. uaz uaz uazu auz.. scusatemi.. ho i lacrimoni…
ciuaz
12 replies on “Il blog è un CMS?!”
. Non mi riferivo all’accezione strettamente software. Per il resto rimaniamo delle nostre opinioni.
Ciao Fullo,
apprezzo il vostro impegno nel creare uno strumento “ideale” per stilare una classifica e vi sostengo nel tentativo di arginare eventuali problemi nel classificare i vari dati raccolti.
Noto però una frase di apertura decisamente fuori luogo ed è abbastanza semplice capire perché visto che mi conosci:
Qui ci sono grossi problemi nella raccolta dei dati e nella definizione di categorie/classi di misurazione, problemi che hai segnalato anche tu nel post. Le parole “dati statistici” sono sbagliate: i dati sono dati, le tecniche di analisi statistica si applicano sui dati per produrre informazioni ma sono due cose distinte. Se sono scazzati i dati è difficile produrre informazioni utili. Condizione simile agli exit-pool politici di qualche mese fa.
Altra frase insolita è “quindi per loro natura non reali ma che rispecchiano un trend”, susseguente alle due parole citate sopra. Qual è il senso? Se hai dei dati sensati e fai “un trend”, che in termini formali può essere una regressione lineare, questo rappresenta i dati a disposizione in una forma molto semplice ma spesso sufficiente per descrivere gli aspetti in esame.
Focalizziamoci sui dati.
La tua domanda qui è “Il blog è un CMS?”. IMHO un blog è un sistema di gestione dei contentuti da punto di vista tecnico, ma il punto di vista tecnico è fuori luogo. Un blog è un diario personale, rispecchia una persona a mio avviso, rispecchia opinioni e desideri. In un blog a mio avviso è già discutibile avere attivo il meccanismo dei commenti, figuriamoci avere un sistema “blog” che permette a più persone-utenti di lasciare messaggi.
Il vero problema per misurare l’importanza di un blog è capire “cosa sia un blog”, dare una definizione univoca e definitiva e poi procedere con la raccolta dati e l’analisi statistica.
Oh, finalmente un approccio scientifico! Daniele il punto è che non c’è un accordo su che cosa sia un blog. È un problema ontologico e quindi di difficile soluzione. Detto questo, nell’impossibilità di concordare, noi optiamo per una logica più inclusiva.
Non sono d’accordo sul discorso blog di Template. Gli elementi caratterizzanti di un blog sono cinque:
1 i permalink
2 l’ordine cronologico dei post
3 un aggiornamento frequente
4 i feed RSS
5 la presenza di un archivio
(cit.Mantellini)
Seguendo questi 5 punti “pannasmontata” (per citarne uno) rientra appieno nella definizione di blog. Inoltre non è assolutamente vero quello che dici riguardo ai commenti e ai post di questi blog. Secondo me nemmeno li avete guardati:un bel zac a tavolino. Vai a rivedere i post ed i commenti di pannasmontata (seconda posizione dopo Grillo su Technorati) e poi dimmi qualcosa.
Per esempio:
http://www.pannasmontata-templates.net/2006/07/14/css-tools/
http://www.pannasmontata-templates.net/2006/07/27/361/
Tanto per citarne un paio non mi sembrano un mero elenco di template ne tantomeno una lista di template da scaricare.
@daniele: stiamo cercando nuove formule per eliminare possibili errori provenienti dai vari motori di ricerca, è ormai assodato che questi rappresentano una fotografia frammentaria della blogosfera. Purtroppo pero’ i dati che analizziamo ed utilizziamo (ora) sono gli unici a nostra disposizione su cui mettere le mani.
@simone: ripeto un sito che offre template, script, ed altro in maniera impersonale non è un blog. Altrimenti anche fileforum.com che ha permalink, ha post in ordine cronologico, archivi, aggiornato più volte al giorno, permette di lasciare commenti ed ha i feed dovrebbe essere un blog. Ed invece è un archivio di file.
Nel tentativo di circoscrivere la blogsfera ho definito le seguenti variabili che, utilizzate come filtri, potranno accontentare molteplici interessi informativi e generare altrettante classifiche.
Variabile per il tipo di “comunicazione”:
– “personale”: manifestazione di una singola persona;
– “gruppo”: manifestazione di 2 o più persone;
Variabile per il tipo di “informazione”:
– “noprofit”: blog senza scopo di lucro;
– “segmento”: blog diretto esclusivamente a valorizzare azioni e prodotti di particolari settori di mercato, senza legami aziendali;
– “aziendale”: blog diretto esclusivamente a valorizzare azioni e prodotti di un’azienda;
In merito ai punti indicati da Samuele, più che escludere o meno un blog per l’assenza dei punti indicati, valuterei l’introduzione delle seguenti variabili dummies:
– permalink (presenza/assenza): non è necessariamente vero che un blog senza permalink non sia un blog, ma è un’informazione utile da sapere o quanto meno raccogliere.
– archivio (presenza/assenza): non è necessariamente vero che un blog senza archivio non sia un blog, ma può risultare utile sapere se è possibile consultare i post passati navigando in un archivio.
Per le variabili dummies “permalink” e “archivio” c’è un carattere temporale. Se l’intenzione è fare una fotografica della blogosfera poco importa, se è intenzione monitorare la cosa nel tempo.. nel tempo potrebbe cambiare. Un blog potrebbe disabilitare o meno la presenza di permalink o la consultazione dell’archivio.
Il punto 2 a mio avviso è scarsamente informativo nel senso che la pubblicazione segue inevitabilmente un ordine cronologico o quanto meno non riesco a identificare al momento una situazione differente.
Il punto 3 parla di “aggiornamento frequente”: che vuol dire? quanto aggiornato? Definizione incerta che crea confusione e va inevitabilmente tagliata.
Il punto 4, la presenza di feed (RDF, RSS, …) la darei come un requisito base per l’inserimento di un blog, insieme all’indirizzo web.
Una cosa sulla quale abbandonerei ogni “pippa” è l’utilizzo o meno di sistemi di gestione dei contenuti o particolari tecnologie. Queste cambiano nel tempo abbastanza rapidamente e non influenzano i contenuti/comunicazioni dei post.
PATCH
nella variabile “informazione”, sostituire l’etichetta “noprofit” con “personale”. Questo per evitare eventuali dubbi tra informazioni di tipo “segmento” e “aziendale” che possono risultare altresì senza scopo di lucro, non direttamente almeno.
Mi meraviglio che non vi foste preparati ad una critica così spietata.
Solitamente quando le cose si fanno bene, se ne parla molto. Sia nel bene che nel male. Non voglio entrare nel merito della questione, ma sicuramente il risultato ha suscitato un discreto interesse. Ma togliete quegli orribili tooltip neri!!! ahr ahr ahr! =’D
Sono d’accordo sulla difficoltà di definizione di cos’è un blog, dalla discussione però si sta via via profilando una caratterizzazione che può avere una larga base di consensi tipo quando scritto da Daniele Medri.
Da parte mia quando si parla di statistiche c’è una frase che mi ha sempre colpito e che ricordo ogni volta che devo produrre una interpretazione di numeri:
“Tortura abbastanza a lungo i dati ed essi confesseranno qualunque cosa(Torture the data long enough and they will confess to anything)”
Con questa frase si può affermare che la TOP100 è di sinistra e che L’aumento delle entrate del Fisco è merito sia del nuovo governo sia del precedente :-D
Alla prossima
Samuele, ho visto i post di Pannasmontata che citi e, mentre il primo potrebbe andare (è una lista di risorse non dissimile da altre), il secondo è una noterella “non sono sparita, sono qui”. A parte questi due esempi, che ci potrebbero stare ma di per sè non bastano a dare carattere di conversazione al blog, non vedo molto altro in termini di contenuti. E i commenti sono tutti del tipo “HI, I love your templates!”, “Nice work!”. Io resto sulle mie posizioni. :)
Daniele, secondo me permalink e archivi (in qualche forma) sono elementi tanto essenziali che nemmeno ci avevo pensato, al fatto che potessero mancare. L’ordine cronologico mi sembra invece non abbia nessuna importanza, ci sono fior di blog di designer che in prima pagina hanno una selezione dei post più letti e/o interessanti, e rimandano al feed ed agli archivi l’ordine cronologico.
In merito alle classifiche dei blog, invito a leggere con attenzione questo post di BlogGoverno:
http://www.bloggoverno.net/2006/08/07/how-to-be-a-blogstarstat/
Saluti,
Luca
Non riuscendo a fare il trackback, segnalo questo nuovo post sull’argomento…
http://www.simonemorgagni.it/blog/?p=95