Вселенную и тем самым сделать доступными все источники информации занимала умы многих людей, но никто не решался приступить к ее практическому осуществлению. А они уже сделали первые шаги в этом направлении, успешно устранив возникшие на их пути препятствия. И я уверен, что у них все получится».
Для Брина и Пейджа, без пяти минут бизнесменов, эта встреча была хорошей возможностью представить свои разработки большой аудитории и получить обратную связь в университетской среде – альма-матер многих научных открытий. Многие их предупреждали о необходимости тщательно оберегать от пронырливых конкурентов информацию о финансовых показателях, стратегиях и производственных секретах компании. Поэтому даже собравшихся в 380-й аудитории они не собирались посвящать во все нюансы, зная, что этим запросто могут породить новых конкурентов.
– Я Сергей Брин, а это Ларри Пейдж. Итак, приступим, – непринужденно произнес Брин. Он начал с примера: сотрудник компании едет в командировку в другой город, где ему понадобится машина. Он заходит на сайт известного поискового ресурса и набирает в строке запроса слова «машина напрокат». Однако среди результатов поиска на первой странице не оказывается сайтов компаний, предоставляющих такую услугу. Проблема в том, что результаты представлены в порядке убывания суммарного количества слов «машина» и «напрокат» на веб-странице. А если бы этот сотрудник набрал «машина напрокат» в строке запроса на сайте Google, он бы получил результаты, упорядоченные по степени соответствия запросу. В подтверждение своих слов Брин ввел это словосочетание в окно поиска Google и нажал на кнопку «Поиск». Первые позиции списка результатов занимали адреса официальных веб-сайтов компаний Avis, National, Dollar, Alamo и др., за доли секунды выхваченные из миллионов адресов страниц Всемирной сети.
– Главной задачей было сделать так, чтобы наш поисковый сервер выдавал результаты не в порядке убывания количества слов в тексте, а в порядке убывания степени соответствия запросу, – пояснил Брин. – Изучением этой темы мы занялись около трех лет назад. В процессе исследования мы сформировали концепцию значимости веб-страницы и разработали алгоритм PageRank, являющийся основным компонентом поискового сервера Google, о котором я хотел бы вам сегодня рассказать.
Выяснить, каким образом веб-сайты связаны друг с другом, было довольно просто. Гораздо сложнее было создать поисковую систему, которая выдавала бы релевантные результаты, для чего нужно было изучить «линии связи» (или ссылки) между сайтами и ряд других факторов. С какой целью операторы веб- сайтов размещают ссылки на веб-страницах? Они делают это для того, чтобы пользователи могли обращаться к другим источникам полезной информации в Интернете, и надеются, что это, в свою очередь, привлечет новых посетителей на их сайты.
– Самой сложной задачей для нас, разработчиков, – продолжал Брин, – было проиндексировать всю Всемирную паутину. Море информации. Мы покажем вам, как мы это делали. Мы расскажем вам, что мы делаем для того, чтобы пользователи могли получать максимально релевантные результаты, чего мы добились за прошедшие почти три года, а также затронем вопросы социального характера.
Тем, у кого было желание и время ознакомиться с техническими подробностями, Брин предложил записаться на курс по поисковым системам, который они с Пейджем вели в начавшемся семестре, но обещав студентам доступ к «источникам, которых вы не найдете больше нигде в мире». Ну а в течение ближайшего часа Брин и Пейдж собирались в общих чертах разъяснить собравшимся, как они разработали поисковый сервер Google.
– Итак, благодаря чему функционирует поисковая система? – спросил Брин.
Вопрос риторический, поэтому докладчик ответил на него сам:
– Во Всемирной сети сегодня функционируют миллионы веб-сайтов и сотни миллионов веб-страниц – по последним данным, триста миллионов. Так как же нам разработать поисковую систему? Впрочем, все не так плохо. На нашей стороне закон Мура.
Закон Мура был главной движущей силой развития высоких технологий. В середине 1960-х годов Гордон Мур, один из основателей компании Intel, спрогнозировал, что производительность процессоров будет удваиваться каждые полтора-два года. Именно поэтому на смену гигантским суперкомпьютерам, которыми тогда располагали лишь крупные компании, университеты и правительственные учреждения, пришли удобные и доступные ПК. Эта тенденция сохраняется и сегодня. Брин пояснил, как закон Мура связан с созданием поисковой системы, способной в поисках информации «просматривать» весь Интернет.
– Каждый год создается масса текстов и материалов, но и компьютерные диски становятся все более вместительными. Мы сможем вложить все знания, всю информацию, накопленные человечеством, вам в карман – за исключением видеоносителей, разумеется, – через пару десятилетий. Это вполне осуществимо. И тогда вся, абсолютно вся информация будет собрана на одном-единственном носителе, и вы сможете работать с ней, анализировать ее, как это делали мы. Правда, есть одна проблема: человек не может обрабатывать результаты поиска за доли секунды. На людей закон Мура, к сожалению, не распространяется – они развиваются несколько медленнее. Нам нужно серьезно заняться этой проблемой.
При этих словах аудитория рассмеялась.
Поскольку Брин решил на время прервать учебу в докторантуре Стэнфордского университета и всецело посвятить себя разработке поисковика, он считал необходимым пояснить собравшимся, в каком направлении они с Ларри движутся.
– Мы собираемся перевести Google на коммерческие рельсы. Как именно – вы увидите в ближайшем будущем на Google.com. Мы также работаем над рядом моментов, которые позволят нам усовершенствовать наше детище.
Слушая Брина, Эллисон вдруг осознал, что безупречно выполнить все это было гораздо сложнее, чем могло показаться из его рассказа. Однако если кому-то это и было под силу, то только им – разработчикам Google.
При поиске Google учитывала больше факторов, чем любая другая поисковая система. Она не просто подсчитывала слова или ссылки и выдавала результаты. Она сочетала информацию о словах и ссылках с другими переменными таким образом, чтобы предоставляемые результаты были как можно более релевантными. Учитываются, например, такие факторы, как расстояние между отдельными словами или фразами на веб-странице, шрифт, которым они набраны, вид букв (прописные или строчные).
– Мы стараемся использовать всю возможную информацию, – продолжал Брин. – Мы смотрим на весь процесс глазами пользователя. Понятно, что для такого поиска требуются значительные объемы памяти, и мы ими располагаем.
Эффективный поиск обеспечивается не только правильностью математических формул и уравнений, но и, самое главное, наличием гораздо более мощного оборудования, нежели у их конкурентов. Ларри и Сергей, в отличие от разработчиков других поисковых систем, быстро поняли, что единственно возможный путь к обеспечению максимально релевантных результатов – инвестиции в оборудование. В их планы входило не только создание ПО, но и полное сопровождение работы компьютерной сети: программное и