Просвещение

В интернет как в справочную: как найти правильный ответ на вопрос

Антон Подрезов Антон Подрезов
Учимся гуглить по советам профессионала, разгребаем морфические поля и разбираемся в парадоксе Монти Холла.

Трудно не удивляться тому, как знатоки в передаче «Что? Где? Когда?» находят вопрос даже не за счет своих знаний, а через предположения, логические размышления, используя свою фантазию. В некоторые моменты становится обидно, что сам так не можешь, особенно когда остаешься один на один с поисковой строкой или неожиданным трудным вопросом из теста. Как добраться до информации, о которой раньше никогда не знал?

Задай вопрос


У писателя-фантаста Роберта Шекли есть небольшой рассказ, называющийся «Верный вопрос». В нем существовал некий Ответчик, который знал все о природе вещей, законах этого мира и владел ответами на любые вопросы. Когда к нему пришли очередные путники со своим вопросом, то у них ничего не получилось:

«— Очень хорошо. Ответчик, — обратился Лингман высоким слабым голосом, — что такое жизнь?
Голос раздался в их головах.
— Вопрос лишен смысла. Под «жизнью» Спрашивающий подразумевает частный феномен, объяснимый лишь в терминах целого.
— Частью какого целого является жизнь? — спросил Лингман.
— Данный вопрос в настоящей форме не может разрешиться. Спрашивающий все еще рассматривает «жизнь» субъективно, со своей ограниченной точки зрения.
— Ответь же в собственных терминах, — сказал Морран.
— Я лишь отвечаю на вопросы, — грустно произнес Ответчик».

Так было и с другими вопросами. Заканчивается же рассказ фразой: «Чтобы правильно задать вопрос, нужно знать большую часть ответа». Как бы это парадоксально ни звучало, но, на самом деле, так и есть. Получить ответы на некоторые вопросы невозможно, не задав при этом несколько дополнительных или не изучив другие термины и понятия. Например, очень сложно объяснить, что делает Большой адронный коллайдер, не вдаваясь в физику мелких частиц.

Причем такая философия Ответчика работает и в наших повседневных заботах, даже если мы не задумываемся над смыслом жизни. Работа с обычным поисковиком не всегда бывает простой. Можно спросить его о столице Великобритании, и он тут же выдаст тебе, что Лондон ис зэ кэпитал оф Грэйт Бритэн. Но если тебе нужно будет разобраться в причинах и субъективных мнениях, то запросы уже усложняются. Например, если ты напишешь «упоминание осетров в художественной литературе», то поисковик не выдаст готовый список с названием книг, номерами страниц и фамилиями авторов (если какой-то отчаянный любитель осетров не составлял его однажды). Тебе нужно будет сделать несколько больше, чтобы добраться до истины: искать библиотеки, использовать более ограниченный поиск, делать более точечные запросы.

Советы по подобного рода поиску дает Даниэль Томсон — автор вопросов для передачи «Кто хочет стать миллионером?», занимавшаяся также поиском информации для шоу Дэвида Леттермана и для TED. Вот что она рекомендует:

1. Не бывает новых вопросов. Все, о чем мы хотим узнать, уже кто-то спрашивал до нас. Можно поместить свой вопрос в кавычки, и поисковик будет искать ответ на него по цитатам — в этом случае алгоритмы работают немного иначе.

2. Если не получили ответ, стоит попробовать действовать от обратного. Представьте, как должен выглядеть ваш ответ. Если вы ищете сведения о том, «какая часть океана исследована?», то попробуйте в поиске писать «процент океана», так как, скорее всего, ответ будет представлен именно в таком виде.

3. Если вы ищете что-то менее конкретное, то постарайтесь думать как автор искомой статьи. Если нужно узнать, сколько авторов начали сотрудничать, встретившись на TED, то используйте в поиске соответствующие фразы: «когда посетили TED», «встретились после лекции TED».

4. Nexis — это хорошо, но Google лучше. Существуют платные базы данных по поиску информации, но, по мнению Даниэль, Google справляется со своими задачами лучше, если дело касается текущих новостей.

5. Не нашли что-то в Google? Используйте Google Books. Ищите в онлайн-библиотеках, если не получилось что-то обнаружить в обычном поиске. А при поиске по содержанию книг используйте советы 1, 2 и 3.

6. Не останавливайтесь на первой странице в поиске, листайте результаты до 6-7 страницы, ведь не самые популярные сайты могут содержать нужную для вас информацию или хотя бы дополнительные подсказки для поиска.

7. Используйте форумы. Как бы старомодно это ни звучало, но ответ можно найти на тематических форумах — кто-то мог уже задаться вашим вопросом. К тому же всегда можно самому спросить у участников этого форума.

8. Если вам становится неловко, то вы на верном пути. Это больше касается поиска информации о публичных личностях. Чем больше вам известно странных фактов о человеке, тем лучше. Это значит, что вы собираете информацию по кусочкам, избавляясь от пробелов, которые были до этого (автор советов вышла так на настоящее имя осведомителя по Уотергейтскому скандалу).

9. Используете разные источники, даже если они предлагают практически идентичную информацию. Не стоит отказываться от ресурсов, которые, казалось бы, предлагают такую же информацию, которую вы находили до этого. Они могут отличаться друг от друга всего на 5%, но это может быть важный пункт, которого не было до этого.

10. Нужен чей-то адрес электронной почты? Вы можете его угадать. Если вы знаете имя человека и организацию, в которой он работает, то на сайте компании, введя «@___» с названием компании после собаки, вы можете увидеть типовое имя электронных почтовых ящиков: это может быть просто фамилия или инициалы, или фамилия и имя, а после этого можно попробовать подставить свои данные, чтобы отправить письмо. Вернулось обратно — пробуем новый вариант.

Перенасыщение информацией


Но надо понимать, что за любой машиной стоит код, написанный человеком, и этот же человек или другие люди могут в любой момент вмешаться в ход ее работы. Шведский журналист Андреас Экстрем призывает нас соединять гуманитарные науки и технологии, рассказывая историю, в которой влияние человека на машину не делает поиск полностью объективным. Он вспоминает ситуацию, когда Мишель Обама подверглась расистской атаке с использованием Google. Все дело в алгоритмах, которые при поиске по картинкам выдает те результаты, которые в сети подписаны так же, как и в запросе, или те файлы, которые загружались в сеть с названиями, близкими к искомому. В итоге злоумышленники стали загружать фотографию обезьяны, подписывая ее «Мишель Обама». В конце концов поисковик по запросу стал выдавать в популярных ответах фотографию животного. Работникам Google пришлось вмешаться и вручную корректировать эти результаты. Но в другой похожей ситуации они не стали ничего делать. Это касалось известного норвежского преступника Андерса Брейвика, чья личность подверглась такой же атаке после его преступлений. Пользователи тогда загружали фотографии собачьих экскрементов, подписанные его именем. В том случае дополнительная модерация не производилась. Как видишь, даже у Google могут быть свои моральные принципы.

Используя поисковики, мы работаем с нереальным количеством информации практически одновременно. С каждым годом ее объем в интернете неуклонно растет: к середине 2015 года, по примерной оценке, интернет хранил в себе 6,5 зеттабайт данных (гигабайт — терабайт — петабайт — эксабайт и только потом уже — зеттабайт). Вся эта информация где-то хранится, а потом обрабатывается по запросам. Но опять же, ее становится все больше, нужно больше места и более мощные компьютеры, которые должны будут уметь обработать еще больше данных.

С этой проблемой сталкивались и продолжают иметь дело специалисты ЦЕРН (Европейский центр ядерных исследований), ученые которого в далеких 60-70-х годах вынуждены были работать на одном и том же компьютере или локальной сети, чтобы иметь возможность пользоваться информацией, полученной от всех ученых и экспериментов. Настоящим спасением для них стало появление интернета. Теперь у них есть возможность не только хранить большие количества информации и работать с ними, но и получать гораздо больше новых данных. На участке коллайдера, расположенного в ЦЕРН, где происходит столкновение частиц, установлено огромное количество датчиков, которые фиксируют столкновения, возникшие новые частицы и следы от них, делая при этом 14 миллионов кадров в секунду! Теперь представь, сколько это информации и как непросто ее обрабатывать.

Теперь представь, что будет, когда машины смогут быстро анализировать все эти данные и учиться на них? Смогут ли они предсказывать будущее? Определенно, да. Ведь, по сути, прогноз погоды или стратегия экономического развития — тоже своего рода предсказание будущего: анализ определенных факторов с попыткой спрогнозировать изменения в будущем. Так же считают и канадские ученые из DeepMind, которые уже разработали искусственный интеллект Dreamer, способный делать своего рода предсказания. Он учился на своих ошибках, прогнозировал и проверял свои предположения о будущем. Он исследует свой новый опыт, помещая себя во все более нестандартные ситуации. Пока что он учится только на предсказывании положения хаотично двигающихся предметов. Но что если он научится работать с гораздо большими объемами информации, прогнозируя наше общее будущее?

Морфический резонанс


Некоторые околонаучные теории говорят, что будущее не так уж трудно прочитать, а значит, и найти необходимые ответы на поставленные вопросы. Руперт Шелдрейк утверждает, что весь наш мир пронизан морфическими полями, которые хранят в себе всю информацию, организовывающую жизнь Вселенной. Эту идею он назвал теорией морфического резонанса. По этой идее существует такое понятие, как коллективная память, но не только в отношении людей, но и всех атомов, тканей и даже галактик. То есть однажды произошедшая случайность, создавшая жизнь на земле, будет повторяться и дальше с большей периодичностью, просто потому что это уже случилось однажды. Иными словами, природа, один раз научившись ездить на этом велосипеде, повторит это с легкостью еще несколько раз. Этой же теорией Шелдрейк объясняет одновременное появление схожих изобретений или научных открытий в разных частях мира (мы же, рассказывая об этом, предполагаем, что это все малтиплы). Причем здесь поиск информации?

При том, что, согласно этой теории, ответ, найденный на какой-то вопрос, будет проще обнаружить следующей волне спрашивающих. Так, Руперт Шелдрейк проводил эксперимент с кроссвордом, который показал, что люди, разгадывающие кроссворд в газете на следующий день после ее выхода, в большинстве делают это быстрее, чем те, которые принялись делать это сразу же после того, как его напечатали. Шелдрейк объясняет это еще одним примером морфического резонанса: ответы появились в коллективном морфическом поле, значит, следующим читателям будет легче получить уже известные ответы. Но не стоит зацикливаться на этих идеях, ведь их, как и многие другие идеи Руперта Шелдрейка, считают ненаучными.

Парадокс Монти Холла


Напоследок расскажу тебе о принципе, который помогает с принятием решений, касающихся выбора из нескольких вариантов, — о парадоксе Монти Холла. Это одна из задач теории вероятностей. Представь, что ты участвуешь в простой игре: перед тобой три двери, за одной из них находится автомобиль, за другими двумя — ничего. Ты выбираешь одну из дверей (допустим, 1). Ведущий, который знает местонахождение приза, в ответ на твое решение открывает одну из двух других дверей (допустим, 3), обязательно без автомобиля (одна из них или обе при любом раскладе будут скрывающими пустоту). После этого ведущий предложит тебе изменить свой выбор (с 1 на 2) или оставить все как есть (открыть дверь под номером 1). Оказывается, что намного выгоднее изменить свой выбор. Ведь в таком случае шанс выиграть автомобиль выше в 2 раза! Объясню почему.

Шанс открыть дверь и узнать, что там был автомобиль, в начале игры равен всего лишь 1 к 3, или около 33%. Это логично. Но ситуация сильно меняется, когда одна дверь открывается, а за ней нет главного приза. В этом случае, если ты не будешь менять дверь, то выиграешь его, только если изначально угадал (шанс на это был 1 к 3, как ты помнишь). А если ты поменяешь свой выбор, то станешь победителем, только если изначально выбрал пустую дверь, потому что шансы на это были равны 2 к 3, или почти 67%, то есть больше в два раза. Решение кажется нелогичным, ведь хочется сказать, что в итоге все сводится к 50 на 50, но с точки зрения математики все очевидно.

Загрузить еще