Компания Meta разработала алгоритм искусственного интеллекта Sphere, автоматически проверяющий сноски в «Википедии». Он также может предложить альтернативы, если отрывок оказался неточным.
(1/2) Today, we're announcing the first model capable of automatically verifying hundreds of thousands of citations at once. Read more: https://t.co/c0nnvhuQx7 pic.twitter.com/UTSEYUmCRZ
— Meta AI (@MetaAI) July 11, 2022Sphere использует модель преобразования понимания естественного языка (NLU), которая пытается понять различные отношения слов и фраз в предложении.
База данных Sphere состоит из 134 млн веб-страниц. Алгоритм понимания естественного языка анализирует сноски в статьях энциклопедии и ищет единый источник для проверки каждого утверждения.
По словам представителей компании, Sphere может анализировать «десятки тысяч» цитат одновременно. В Meta отметили, что электронная энциклопедия пополняется 17 000 статьями одновременно, содержащими множество сносок, которые сложно проверить вручную.
Чтобы проиллюстрировать возможности ИИ, Meta показала пример неполной цитаты, найденной моделью на странице «Википедии» о коренном американском народе черноногих. В разделе «Известные личности» (в англоязычной версии статьи) упоминается Джо Хипп — первый представитель нации, который боролся за титул чемпиона мира по версии WBA в супертяжелом весе.
Однако на связанном веб-сайте найти подтверждение этого факта не удалось. Поискав в базе данных Sphere, модель выявила более подходящую цитату в статье 2015 года в Great Falls Tribune. Алгоритм отметил следующий отрывок:
«В 1989 году, на закате своей карьеры, [Марвин] Кэмел дрался с Джо Хиппом из нации черноногих. Хипп, который стал первым коренным американцем, бросившим вызов чемпиону мира в супертяжелом весе, сказал, что этот бой был одним из самых странных в его карьере».
В найденном отрывке напрямую не упоминается бокс. Sphere обнаружила подходящую ссылку благодаря возможностям естественного языка, подчеркнули разработчики.
В компании считают, что в будущем инструмент поможет бороться с дезинформацией в Facebook.
«В более общем плане мы надеемся, что наша работа может быть использована для проверки фактов и повышения общей достоверности информации в интернете», — заявили создатели модели.
Кроме этого, Meta планирует создать платформу, которую редакторы «Википедии» смогут использовать для систематической проверки и исправления сносок.
Исходный код модели доступен на GitHub.
Напомним, в июле Meta представила ИИ-переводчик, поддерживающий 200 языков.
В апреле техгигант рассказал о разработке языковой модели OPT-175B с открытым исходным кодом.
Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!