аппаратное обеспечение неразрывно связаны друг с другом, и потому очень важно оптимизировать их функционирование. Они знали, что непременно извлекут выгоду из того, что цены на запоминающие устройства и другие компьютерные комплектующие неуклонно снижаются, а их характеристики постоянно улучшаются. Лучше покупать отдельные комплектующие и самим собирать ПК, решили они, поскольку с самого начала проповедовали максимально целостный подход.
Пока Деннис Эллисон слушал пояснения Брина, у него в памяти всплывали различные эпизоды из университетской жизни с участием Брина и Пейджа. Он был о них очень высокого мнения. Им можно было доверять. Ребята действительно хотели создать нечто полезное. К тому же они были молоды и с характером. Эти качества особенно важны: в сфере высоких технологий доверие потребителей к продуктам зиждется на доверии к разработчикам. К тому же Ларри и Сергей компьютерные фанаты с невероятно широким кругом интересов – качество, присущее цельным натурам. Они – приверженцы прогрессивных взглядов. А применительно к Силиконовой долине это означает, что они сторонники открытых систем программного обеспечения, а не закрытых, которым отдавали предпочтение Билл Гейтс и его Microsoft. И еще ребята не стеснялись высказывать свое мнение по тем или иным вопросам. «Им не нравятся кое-какие аспекты жизни деловой Америки, и они не боятся громко заявлять об этом», – отмечает Эллисон.
Тем временем эстафету у Брина перехватил Пейдж. Эллисон его тоже очень уважал. Ларри был прекрасным преподавателем, поскольку обладал способностью ухватить основную идею и преподнести ее простым и понятным языком – способностью, которая отличает людей с ясным умом, досконально знающих свое дело.
– Ссылка в Интернете сродни ссылке в научной литературе, – пояснил Пейдж. – Но если вы просто будете подсчитывать количество ссылок в Сети, что делает большинство поисковых систем, у вас возникнут проблемы. Всемирная паутина – это не научная литература, здесь создать веб-страницы может любой желающий.
Программа PageRank – это, в принципе, модель пользования Интернетом. Скажем, у нас есть пользователь, который просто бродит по Сети. Он немного смахивает на обезьяну: сидит часами перед компьютером и тупо кликает на ссылки. Знакомая картина, не правда ли?
Аудитория дружно хохотнула.
– PageRank говорит: если какой-то значимый сайт указывает на тебя, ты получаешь частицу его значимости, – продолжил Пейдж. – Предположим, что на тебя указывает какой-то действительно стоящий сайт. Он для тебя намного ценнее любой «левой» веб-страницы. К примеру, если на главной странице Yahoo! есть на тебя ссылка, это просто здорово. Наличие на главной странице сайта Yahoo ссылки на твою веб- страницу говорит о том, что либо ты заплатил кому-то кучу денег, либо твоя страница действительно хороша. А вот наличие ссылки на твою веб-страницу на главной странице моего веб-сайта никому ни о чем не говорит. – И Пейдж разъяснил, как он разработал рецепт получения ранжированных результатов поиска. – Мы присвоили всем веб-страницам числа, примерно соответствующие степени их важности. Ранг отдельно взятой страницы – это сумма показателей всех веб-страниц, на которых есть ссылки на нее.
Но существует серьезная проблема. Некоторые, пытаясь обмануть поисковые механизмы, делают так, чтобы адреса их веб-сайтов располагались в списках результатов как можно выше. Поисковая система должна выиграть эту кибервойну: она должна стать «умнее» всех этих «хитрых» веб-сайтов.
– Доводилось ли вам сталкиваться с адресами порносайтов на страницах с результатами поиска? Те, кому доводилось, поднимите руки! – предложил Пейдж. – О, некоторые признались. На самом деле это большая проблема для поисковиков. Дельцов, стремящихся заработать любой ценой, мало волнует, какую информацию вы ищете, их вообще мало что волнует. Они просто хотят, чтобы на их веб-страницы заходило как можно больше пользователей.
Сформулировав проблему, Пейдж заметил, что он уже работает над возможными путями ее решения. Наиболее эффективным из них представляется разработка программы определения степени важности веб- сайтов, которая не позволит их операторам манипулировать поисковой системой. Google, ориентированная исключительно на пользователя, обеспечит наличие только релевантных адресов на страницах с результатами поиска.
Пейдж не преминул пустить пару критических стрел в адрес других поисковых систем:
– Поисковые механизмы функционируют отнюдь не блестяще. Если вы наберете, скажем, слово «AltaVista» в строке запроса другой поисковой системы, получите ли вы адрес главной страницы сайта AltaVista? Скорее всего, нет. А вот на Google вы гарантированно получите его в числе первых результатов. Всю соответствующую работу мы делаем сами. Объемы очень большие.
Ключевым принципом разработчиков Google стало разбиение сложных задач на отдельные подзадачи, которыми можно было бы заниматься параллельно. С помощью соответствующих математических уравнений и множества компьютеров ребята создали что-то вроде производственной линии для сбора, занесения в индекс и представления информации, руководствуясь при этом законом Мура, что позволяло приобретать компьютерное оборудование с меньшими затратами.
– Мы ползаем по Всемирной паутине – то есть заходим туда и загружаем весь Интернет. Мы загружаем приблизительно по сто страниц в секунду, – сообщил Пейдж. – Процесс этот довольно сложен. Все загруженные копии веб-страниц мы сохраняем на жестких дисках компьютеров, они нам нужны для анализа. Веб-страницы хранятся почти на всех компьютерах в нашей комнате.
Ларри рассказал о новшестве, обеспечившем Google превосходство над другими поисковыми машинами. Профессора и студенты Стэнфорда не пропускали ни слова.
– Когда в строке запроса набрано не одно слово, а словосочетание, наша система анализирует расстояние между словами <на скопированной веб-странице>. Для этого в соответствующую программу мы ввели систему уравнений. В другие поисковые системы заложен более примитивный подход, и потому они не в состоянии поспевать за темпами расширения Сети. На их фоне Google с ее программным обеспечением, позволяющим загружать веб-страницы максимально оперативно, явно выделяется. Если вы хотите набрать больше материала, вам просто нужно «ползать» по большему количеству сайтов. Как видите, все очень просто.
Ларри и Сергей раскрыли далеко не все технические подробности функционирования PageRank и Google: в аудитории вполне могли быть «шпионы» из других компаний, и ребятам, понятное дело, не хотелось, чтобы кто-либо воспользовался плодами их трудов.
По мнению Брина, настал момент несколько оживить презентацию. «Ползание» по Интернету и индексация веб-страниц – чисто технический процесс, сказал он, однако на самом деле все отнюдь не так просто, как кажется. Дело в том, что некоторые владельцы веб-сайтов считают их «паука» незваным гостем.
– Вообще-то, мы получаем огромное удовольствие от ползания по Сети, – сказал Брин. – Вступая в контакт с миллионом веб-сайтов, вы вступаете в контакт с миллионом людей – веб-мастерами этих сайтов.