Как бы нам не хотелось раболепствовать перед искусственным интеллектом, он всё ещё плохо справляется с распознаванием и анализом естественного языка. Вот почему Google открывает исходный код своей новой модели анализа английского языка под названием Parsey McParseface.
Опережая ваш вопрос, скажем, что в названии нет смысла. Когда компания пыталась придумать название новой технологии, кто-то просто предложил Parsey McParseface, прямо как в ситуации с Liam от Apple, у которого тоже нет особой предыстории. Сама же модель называется SyntaxNet, а Parsey только для английского языка.
Объединяя техники машинного обучения и поиска, Parsey McParseface точен на 94%, заявляет Google. Он также полагается на фреймворк нейронной сети SyntaxNet для анализа лингвистической структуры предложения или утверждения, который анализирует функциональную роль каждого слова в предложении.
Если вы совсем запутались, то вот вкратце: Parsey и SyntaxNet – фактически, пятилетние дети, которые учат нюансы языка.
В примере выше «saw» это корневое слово (глагол) в предложении, а «Alice» и «Bob» — подлежащие (существительные). Область исследования Parsey может стать и немного шире:
И если вы задумываетесь, зачем вообще нужен Parsey McParseface, то вот объяснение Google:
Одна из главных проблем, что так усложняет анализ, заключается в том, что человеческие языки невероятно двусмысленны. Вполне возможно, что предложения средней длины, скажем, из 20 или 30 слов, могут обладать сотнями, тысячами или даже десятками тысяч возможных синтаксических структур. Анализатор естественного языка должен каким-то образом перебрать все эти альтернативы и найти самую вероятную структуру, учитывая контекст.
Parsey McParseface и SyntaxNet – не являются решением, но Google считает их первым шагом на пути к лучшему AI анализу языка.