Voce marcata come ‘indicizzazione’
Tradizionalmente, la ricerca delle pagine web si basa sull’utilizzo di parole chiave, e lo stesso meccanismo viene utilizzato dai motori nella ricerca per immagini. Il nuovissimo progetto TinEye della Idée.inc è un particolare motore di ricerca per immagini che non utilizza parole chiave o metadati, ma ricerca immagini attraverso le immagini stesse!

Basato su algoritmi di identificazione delle immagini e sulla tecnologia di ricerca Piximilar, TinEye analizza, indicizza e permette di completare efficacemente la ricerca all’interno di un indice che al momento conta 487 milioni di immagini, caratterizzate da un’ “impronta digitale” basata sull’analisi di colore, forma, trama, luminosità, complessità, oggetti e regioni.
Così, allo stesso modo in cui si inserisce in un motore di ricerca del testo per trovare tutte le pagine indicizzate che lo contengano, con TinEye è possibile inserire un’immagine dal proprio computer o da URL ed ottenere tutte le pagine web nelle quali compaiono immagini uguali, versioni modificate della stessa e persino selezionare una gamma di colori e trovare le immagini in cui siano presenti.
Per ora ne esite una versione beta chiusa (attraverso un link presente sulla home del progetto è possibile richiedere un invito e in qualche ora si è inseriti nel programma) ed anche un’estensione per firefox (!).
Vi apparirà così:

Categorie: Uncategorized
Messo il tag: cercare, immagini, indicizzazione, video
GoogleHacks è un programma che consente di fare ricerche avanzate su Google senza dover studiare per giorni e notti i comandi chiave da utilizzare. Con GoogleHacks si possonoricercare link diretti a musica, video, applicazioni, torrent, proxy, cache, programmi, libri, testi di canzoni, fonts, hacks e web hosting.
Si presenta così

Per fare un esempio, cercando “Oscar Wilde” tra i libri, il programma lancia una ricerca avanzata su Google che solo con tanto sudore della fronte potrei riuscire ad elaborare autonomamente…
-inurl:(htmhtmlphp) intitle:"index of" +"last modified" +"parent directory" +description +size +(.txt.lit.doc.rtf.zip.rar.pdf.chm) "oscar wilde"
Categorie: Uncategorized
Messo il tag: cercare, google, indicizzazione, musica, tool, video
Ho trovato un articolo sui sistemi di indicizzazione delle pagine web che forse potrebbe interessarci. Ve ne riporto un estratto:
Il PageRank, algoritmo, sul quale si basa l’indicizzazione di Google, assegna un punteggio ad ogni pagina, basandosi sul numero di link che puntano ad essa. Il PageRank di un sito aumenta in relazione alla qualità delle pagine web che linkano il sito. Purtroppo il PageRank non garantisce la qualità reale dei siti indicizzati.
Il TrustRank invece cerca di definire la qualità di una pagina in base alla valutazione umana.
Da questo è possibile comunque generare un semplice algoritmo che assegna una valore binario pari a 0 se la pagina contiene spam (bad page), oppure pari a 1 se la pagina è da considerarsi di buona qualità o senza spam (good page).
Risulta evidente quindi che non è più il link che definisce la qualità di una pagine, ma l’intervento umano che istruisce l’algoritmo.
Qui trovate l’articolo: http://www.officialsm.net/articoli/trustrank_for_dummies.pdf
Categorie: Uncategorized
Messo il tag: funzionamento, indicizzazione, trustrank