Эпоха открытий. Возможности и угрозы второго Ренессанса - читать онлайн книгу. Автор: Йен Голдин, Крис Кутарна cтр.№ 48

читать книги онлайн бесплатно
 
 

Онлайн книга - Эпоха открытий. Возможности и угрозы второго Ренессанса | Автор книги - Йен Голдин , Крис Кутарна

Cтраница 48
читать онлайн книги бесплатно

Ни одно из этих начинаний или форумов не могло бы существовать десять лет назад. Теперь они являются неотъемлемой частью нашей жизни, с их помощью мы общаемся, учимся, создаем, обмениваемся, делаем и помогаем, и делаем все это быстрее, эффективнее, с большим размахом и (иногда) негласно.

Однако самые амбициозные коллективные усилия нашего времени менее известны. Их цель – не помочь нам в повседневной жизни, а победить давно устоявшиеся ограничения, сковывающие человеческую цивилизацию и науку, – рубежи, которые не смогли раздвинуть даже наши неуклонно растущие вычислительные ресурсы.

Первый рубеж – это язык, который делит человеческую культуру и знания на обособленные острова. Английский, сегодняшнюю lingua franca, понимают лишь 25 % населения мира, причем с разной степенью успеха [13]. Чтобы внятно объясниться с половиной человечества, вы должны говорить на четырнадцати языках, а чтобы вас поняли три четверти человечества – на сорока языках [14]. Интернет, главное средоточие человеческого общения и общая сокровищница знаний, точно так же разделен языковыми стенами: то, что мы видим, зависит от языка, которым мы пользуемся. Англоговорящие пользователи имеют доступ к более богатому резервуару. Половина твитов в мире и бо́льшая часть научных исследований в интернете написаны на английском [15]. Английская версия Википедии, насчитывающая 5 миллионов статей, в 2,5 раза превосходит следующую по величине немецкую Википедию, насчитывающую 1,9 миллиона статей, и более чем в 15 раз превосходит в среднем 50 других ведущих изданий [16]. С другой стороны, английские пользователи почти ничего не знают о крупных явлениях и событиях неанглоязычного интернета, таких как китайские социальные сети (основные платформы обмена сообщениями Weibo и Weixin намного опережают Twitter по количеству пользователей и объемам общения) [17] или Нолливуд (Голливуд Нигерии, чье мобильное видео помогло ему вырасти во второй по величине центр кинопроизводства в мире, уступая лишь индийскому Болливуду). В совокупном итоге, хотя международный трафик с 2005 г. вырос примерно в двадцать раз, лишь половина этих потоков покидает регионы, в которых они были созданы [18]. Это намного меньше международного оборота товаров (68 %) – материальным предметам в меньшей степени препятствуют языковые и культурные расхождения [19].

Полностью многоязычный интернет станет для цивилизации по-настоящему бесценным подарком. К сожалению, это до сих пор находится за пределами наших возможностей. Для того чтобы перевести хотя бы один фрагмент интернета, например полную англоязычную Википедию, всего на один широко используемый язык, потребуется не менее 100 миллионов долларов и более 10 тысяч человеко-лет [20]. Даже если кто-то готов за это заплатить, мы вряд ли найдем достаточно переводчиков, согласных сделать такую попытку, в зависимости от языка перевода. Системы компьютерного перевода отчасти помогают решить проблему, позволяя нам в общих чертах понять, что означает то или иное иностранное выражение. Но пользователи всех онлайн-переводчиков начиная с 1990-х гг. (AltaVista, Babelfish и сегодняшний Google Translate) могут подтвердить, что при машинном переводе всегда теряется часть смысла, львиная доля связности и полностью пропадает стиль. Это происходит потому, что живые переводчики сначала вникают в смысл первоисточника, а затем пытаются как можно точнее передать его на другом языке, а компьютер начинает с распознавания отдельных слов (в лучшем случае фраз) и затем склеивает их аналоги без какой-либо общей концепции. Пройдет еще несколько лет, прежде чем он научится делать это действительно хорошо.

Тем не менее идея многоязычного интернета постепенно начинает выглядеть все более правдоподобной. Раньше мы не принимали в расчет того, насколько широко среди людей распространено стремление изучать другие языки, – по недавним оценкам, таких людей в мире 1,2 миллиарда [21]. Выяснилось, что перевод фрагментов интернета – полезная практика для изучающих иностранные языки, и студенты с удовольствием пользуются ею и готовы делать это бесплатно. В результате произошел колоссальный скачок наших совокупных возможностей перевода. Особенно сильно это ощущается в сфере развлечений и другого популярного контента. В Китае голливудские блокбастеры и популярные сериалы канала HBO появляются в интернете в тот же день, когда выходят в США, вместе с субтитрами на мандаринском диалекте, которые делают фанаты, практикующиеся в английском. Для образовательного интернет-портала Khan Academy добровольцы перевели более чем на 65 языков почти все шесть тысяч учебных видео. Интернет-портал TED привлек более 22 тысяч добровольцев, чтобы перевести более 80 тысяч выступлений TED Talks более чем на 100 языков. В общей сложности в 2015 г., по нашим оценкам, количество добровольных переводчиков в мире составило от 2 до 4 миллионов человек, и в течение одного года они подарили человечеству от 25 до 50 миллионов часов бесплатных переводческих услуг в таких областях, как развлечения, образование, новости и ликвидация последствий стихийных бедствий (путем перевода твитов жертв в реальном времени для аварийно-спасательных служб).

Умные бизнес-модели определяют новые способы оптимизации наших коллективных переводческих усилий и приложения их к общедоступному контенту, который добровольцы оставляют без внимания (или к частному контенту на платной основе). Один из примеров – платформа Duolingo, разработанная доктором Луисом фон Аном, профессором информатики из Университета Карнеги-Меллон. Учебная платформа доступна в сети и в виде приложения, и она предлагает студентам, изучающим языки, переводить реальные предложения из интернета: фрагменты статей Википедии или новостных лент CNN. Когда несколько студентов переводят одну фразу одинаково, система расценивает такой перевод как достоверный, а затем отдает или продает его обратно владельцу оригинального текста. Этот способ обучения является бесплатным для пользователей, включает в себя игровой элемент и очевидно эффективен, поэтому студенты, изучающие иностранные языки, охотно им пользуются. Duolingo была запущена в июне 2012 г. и первоначально насчитывала 300 тысяч пользователей. Через три года на платформе было зарегистрировано 25 миллионов пользователей (из них 12,5 миллиона активных), изучающих 13 разных языков, еще 8 языков находились на стадии разработки [22]. Если достаточное количество пользователей Duolingo перейдет от уровня новичка до высших уровней владения вторым языком, они в короткие сроки смогут разрушить некогда непреодолимые языковые барьеры интернета. Если число продвинутых пользователей Duolingo достигнет миллиона, они смогут полностью перевести англоязычную Википедию примерно за 100 часов.

Второй масштабный рубеж, который мы коллективно преодолеваем, – анализ научных данных. «Во многих областях науки мы ограничены не тем, какие данные можем получить, а тем, что мы можем сделать с имеющимися у нас данными», – считает астрофизик Крис Линтотт [23]. Информации более чем достаточно – чего нельзя сказать о нашей способности ее обрабатывать. Наши компьютерные устройства все лучше справляются со сбором данных, которые нужны исследователям (в случае Линтотта это изображения далеких галактик), но они по-прежнему плохо умеют распознавать закономерности, которые мы ищем, и отделять значимые сигналы от бессмысленного шума. В результате огромный массив данных, ожидающих обработки, растет не по дням, а по часам. Большой адронный коллайдер ЦЕРН в Швейцарии каждую секунду производит около гигабайта новых данных о поведении фундаментальных частиц [24]. Все машины секвенирования ДНК в мире каждую секунду выдают от одного до двух гигабайт данных о том, как работают наши гены [25]. В НАСА данные буквально льются с неба: различные миссии каждую секунду генерируют около 150 гигабайт новых наблюдений о нашей Вселенной [26]. (Для сравнения, в 2015 г. более полутора миллиардов пользователей Facebook вместе загружали около 5 гигабайт данных в секунду. Можете ли вы быть в курсе новостей целого мира? Проблема НАСА в тридцать раз больше.) Такие же потоки извергаются на головы климатологов, геологов, социологов, экономистов и других исследователей, работающих с данными. Наука уже нашла ответы на многие важные вопросы. Мы просто этого еще не знаем.

Вернуться к просмотру книги Перейти к Оглавлению Перейти к Примечанию