понедельник, 27 мая 2019 г.

Санскрит подходит для работы компьютеров (разъяснение)

Заявление: НАСА объявила санскрит «единственным недвусмысленным разговорным языком планеты», который подходит для работы компьютеров. Эта же мысль была высказана еще в июле 1987 г. журналом «Форбс»: «Санскрит - язык, наиболее подходящий для компьютеров». (обсуждение полностью, источник)

Комментарий от stariy_khren: Само понятие "подходит для компьютеров" требует пояснений. Сам компьютер работает на машинных кодах, а не на человеческих языках. Речь идет о верности интерпретации программой смысла, содержащегося в неком тексте - устном или письменном.

Смысл тезиса в том, что, настроив компьютерную программу (пусть и весьма сложную) на работу с санскритской грамматикой и синтаксисом, программист получает наиболее однозначные интерпретации написанного во вводимом в компьютер тексте. Т.е. ошибиться в содержании текста из-за двусмысленности или недосказанности будет гораздо сложнее, чем интерпретируя текст английский или французский.

Санскрит в этом смысле имеет тройную защиту.

Во-первых, санскрит содержит огромное количество слов, многие из которых синонимичны, но каждый синоним имеет свою смысловую окраску. Т.е. английскому слову red в санскрите будут соответствовать и алый, и красный, и кровяной, и пр. (как, впрочем, и в русском). Компьютеру гораздо проще "выучить" таблицу с подробным описанием таких синонимов с ранжированием всех смысловых оттенков и коннотаций, чем пытаться при помощи сложных алгоритмов искусственного интеллекта вычислять из целой фразы, абзаца и общего контекста конкретный смысл конкретного английского или французского слова, которое может писаться одинаково для сотни различных значений. Санскрит точен, однозначен и подробен в передаче самых тонких смысловых и стилистических оттенков.

Во-вторых, санскрит с его развитой и еще в древности хорошо описанной и однозначной системой падежей, суффиксов, префиксов и окончаний гораздо проще для компьютерной алгоритмизации, чем стихийно возникшая смесь разнородных признаков слов европейских языков, где часть грамматического строя передается порядком слов, часть префиксами/суффиксами, а часть подбором синонима. В этом смысле санскрит более подробен и систематичен. Он не требует додумывания или стереотипных шаблонов интерпретаций, которые в европейских языках частично подменяют письменную грамматику.

В-третьих, санскрит веками бытовал в преобладающе письменном виде, его письмо первично по отношению к устной практике. Он не отражает мимолетные свободные текущие устные языковые переживания, но сам формирует и систематизирует их через письменную форму. Для компьютера это золотое дно.

Характерно, что все вышеизложенное в полной мере относится и к русскому языку. Но есть одно несущественное различие. Санскритская грамматика полностью отражает фонетику - как слышится, таки пишется. Но для санскрита гораздо правильнее сказать несколько иначе - как пишется, так и слышится. В русском, как в языке бытующем в значительной степени в устной форме, связь с грамматикой решается иным способом. Мы сохраняем исторически фиксированные грамматические и синтаксические письменные формы, однозначно сопоставляя их с устными (солнце - сонце, автор - афтар, хлеб - хлеп и пр.). Санскрит, не испытывая давления устной речи, может себе позволить сохранять прямое соответствие устной и письменной речи. Для компьютерного распознавания устной речи и переложения ее в "письменную" форму - это весьма удобно.

По сути, объявляя санскрит "наиболее подходящим для компьютеров", исследователи лишь невольно констатируют его более высокий класс, его так называемое "благородство" по сравнению с букетом европейских "подлых" языков и в первую очередь с английским, слепленным в позднем средневековье на скорую руку.

По большому счету с таким же успехом в качестве "наиболее подходящего" можно было объявить и русский литературный - у него все те же базовые свойства. Но, во-первых, это было бы для них весьма и весьма не политкорректно, а во-вторых, русский в этом качестве, будучи языком живого общения огромных масс людей различных этносов, различного уровня культуры и пр., все же сложней для однозначных компьютерных интерпретаций, чем хрестоматийный санскрит. Русский литературный в большой степени включат в себя диалекты, а санскрит проводит между собой и своими - тоже многочисленными - диалектами (пракритами) весьма четкую границу.

***

В рамках прикладных программ, обладающих зачатками искусственного интеллекта, двусторонний диалог с человеком - устный и письменный - проще реализовать на санскрите. Формальный, упрощенный диалог можно организовать и на смайликах, и на наборе символов, включающем стандартные фразы, но глубокий когнитивный диалог уместнее реализовывать на санскрите - проблем возникновения ошибок, связанных с неверной интерпретацией - и человеком, и программой - в этом случае будет меньше. И при переходе от баз данных к базам знаний это становится все более актуальным.

Это на первом этапе - на этапе анализаторов и синтезаторов речи, интеллектуальных переводчиков и пр. А в дальнейшем, когда искусственному интеллекту потребуются рабочие модели когнитивного описания мира с элементами самообучения и самоструктуризации, парадигма санскрита дает гораздо большие перспективы, нежели смайлики и английский. Т.е., например, автономный человекоподобный робот, обладающий искусственным интеллектом и "думающий" в рамках парадигмы санскрита, будет совершать меньше ошибок и в общении, и в поведении, и в формировании внутренней рабочей модели окружающего мира.

***

Санскрит, будучи литературным языком высокого класса, очень подходит для когнитивных аспектов формирования математической модели мира в контексте искусственного интеллекта.

Но подходит не только он, но и русский литературный - его родной брат. Надо только его слегка "засушить" (сделать письменный вариант первичным относительно устного) и разграничить с диалектами. Т.е., говоря образно, русский надо слегка "кристаллизовать", и в отношении искусственного интеллекта он станет равным санскриту.

Кстати, интересный процесс в наши дни набирает все большие обороты в Индии. Видя бедность и убогость английского, индийские ученые (весьма разных отраслей знания) все чаще в качестве научных терминов вводят в научный оборот санскритские слова и понятия. И эта тенденция сегодня получает поддержку и одобрение со стороны правительства. Это уже не "кришнаиты", но именно позитивная наука, находящаяся в парадигме научного мировоззрения и методов познания.

Нечто подобное было и у нас в СССР, когда Академия наук хоть как-то сопротивлялась засилью англоязычной терминологии. С тех пор у нас весьма многие научные термины и понятия имеют два варианта - русскоязычный и англоязычный. И результат тот, что для обсуждения (особенно в кулуарах) самых передовых сфер науки - ядерная физика, искусственный интеллект и пр. - русские термины оказываются более уместны и емки, чем английские, поскольку в самом термине позволяют выявить самые тонкие смысловые оттенки самых абстрактных понятий.

Комментарии

comments powered by HyperComments