Πριν λίγες ημέρες οι μηχανικοί της Google ανακοίνωσαν πως ο αριθμός των μοναδικών διευθύνσεων (URL) ιστοσελίδων στο διαδίκτυο ξεπέρασε το φράγμα των 1 τρισεκατομμυρίων (1,000,000,000,000)! Κάθε μέρα, δισεκατομμύρια νέες ιστοσελίδες δημιουργούνται, σε blogs, σε ειδησεογραφικές πύλες κοκ.
Σύμφωνα με το Google, το 1998, το σύστημά τους είχε καταχωρημένες 26 εκατομμύρια σελίδες, ενώ το 2000 αυτές είχαν ξεπεράσει το ένα δισεκατομμύριο. Σήμερα, εκτιμάται πως 40 δισεκατομμύρια σελίδες περιέχονται στο ευρετήριο της Google, εξαιτίας του ψηλού κόστους επεξεργασίας του τεράστιου όγκου δεδομένων.
Στις 28 Ιουλίου ξεκίνησε τη λειτουργία της μια καινοτόμα μηχανή αναζήτησης, η Cuil (“γνώση” στα ιρλανδικά). Φέρεται πως έχει πετύχει τη μείωση του αντίστοιχου κόστους στο 1/10 και τη δημιουργία ευρετηρίου με περισσότερες από 120 δισεκατομμύρια σελίδες. Πίσω από αυτή τη νέα εταιρία κρύβονται πρώην υπάλληλοι της Google, οι οποίοι προσεγγίζουν το πρόβλημα αναζήτησης με εντελώς νέα προσέγγιση. Αυτή τη στιγμή φαίνεται να αποτελούν τους πιο σοβαρούς ανταγωνιστές της Google στο θέμα αναζήτησης.
Από τεχνικής απόψεως, η διαφορά του με το Google είναι στο ότι δεν βάζει ένα βαθμό (Pagerank) σε κάθε σελίδα ανάλογα με το αν είναι δημοφιλης (για το οποίο υπάρχουν πολλές μέθοδοι που μπορεί να επηρεαστεί. Αντίθετα, το Cuil αναλύει τις ιστοσελίδες σημασιολογικά, έτσι σελίδες για τα hot-dogs και σκύλους θα εμφανίζονται στα αποτελέσματα, αλλά ως ξεχωριστές κατηγορίες και όχι μαζεμένα. Έτσι αποφεύγει ο χρήστης να επαναδιατυπώνει το ερώτημά του, αφού πλέον υπάρχει μεγαλύτερη πληροφορία στις απαντήσεις που λαμβάνει. Επιπρόσθετα, σύμφωνα με τους μηχανικούς του Cuil, δεν αποθηκεύκουν κανένα προσωπικό δεδομένο στους server τους, παρά μόνο αυτά που έχουν σχέση με τα ερωτήματα (όχι δηλαδή τα IP).
Το Cuil θέλει ακόμη αρκετή δουλειά φυσικά, αλλά λόγω του ότι είναι μόλις 1 ημέρας, θα αναμένουμε να δούμε την εξέλιξή του. Τα αποτελέσματα του στα ελληνικά δεν είναι πάντα τα καλύτερα, όπως και μερικά ερωτήματα στα αγγλικά. Ίσως όμως είμαστε επηρεασμένοι από το τρόπο αναζήτησης στο Google.com, όπου οι σελίδες “πάλεψαν” πολύ για φτάσουν εκεί που έφτασαν…
Η ανακοίνωση της Google, για το μέγεθος του διαδικτύου, μόλις λίγες μέρες της δημοσιοποίησης του Cuil, θεωρείται από διάφορους αναλυτές ως ένδειξη ότι εκλαμβάνουν το Cuil σαν μια σοβαρή προσπάθεια. Σίγουρα, πάντως, ο ανταγωνισμός δεν έβλαψε ποτέ κανένα!