Привет, Гость!

Мы разрабатываем лингвистический сервис с открытым API и возможностью обращаться к функциям из любого языка программирования по протоколу HTTP/HTTPS. Сегодня всем желающим доступна для тестирования альфа-версия API с подробной документацией и примерами использования на языках Python и PHP.

  • Закрыт для гостей Краснодарский Край их отдохнуть на море в разгар пандемии не получится, пребывающих ждет самоизоляция
  • Закрыт для гостей Краснодарский Край их отдохнуть на море в разгар пандемии не получится, пребывающих ждет самоизоляция
  • Закрыт для гостей Краснодарский Край их отдохнуть на море в разгар пандемии не получится, пребывающих ждет самоизоляция
  • Закрыт для гостей Краснодарский Край их отдохнуть на море в разгар пандемии не получится, пребывающих ждет самоизоляция
  • Одна песня про изначально эта песня не для меня и потом еще придумали новый поэтический прием стали петь и как не для тебя, и таким образом у нас твоя народный

Корпус парафраз

Мы собираем корпус для перефразирования и строим с его помощью систему, распознающую похожие по смыслу предложения. В данный момент предложения автоматически извлекаются из заголовков новостей и размечаются участниками проекта.

Чтобы собрать качественный корпус, необходимо правильно обучить систему. Имея такой корпус, можно строить статистические модели для автоматического перефразирования. Это, в свою очередь, упростило бы решение таких задач в области автоматической обработки текста как извлечение информации, машинный перевод, информационный поиск, синонимизация текста и т.д.

Пользователь      Размечено пар
Nina8250
kat6115
anton2098
tanaya1624
Apelsin832
tatyana_bykova816
seagullteacup758
Йозеф687
rojoil508
CyberCat505

Парафразы как данные для обучения

AINL 2016 На базе собранного корпуса в рамках конференции AINL 2016, посвященной искусственному интеллекту и естественным языкам, была проведена дорожка по распознаванию парафраз, в которой участникам предлагалось установить класс соответствия двух предложений. Списки участвовавших команд и результаты дорожки размещены на нашей странице.

У вас есть задача?

Наша команда готова индивидуально исследовать вашу проблему в области обработки текстов и предложить ее решение. У нас есть успешный опыт решения задач по тематической кластеризации текстов и выделению ключевых сущностей и их атрибутов.



Стать участником

Всех желающих мы приглашаем присоединиться к нам и внести свой вклад в создание корпуса


Тестировать API

Примите участие в тестировании нового сервиса для русского и английского языков


Скачать корпус

Вы можете свободно cкачать корпус и использовать его в своих проектах

Также доступен для скачивания большой корпус кластеров парафраз, который можно использовать для генерации парафраз. Скачать ParaPhraser+.

Gudkov, V., Mitrofanova, O. and Filippskikh, E. Automatically Ranked Russian Paraphrase Corpus for Text Generation. Proceedings of the Fourth Workshop on Neural Generation and Translation, ACL, 2020, pp. 54-59


Рассказать о нас

Вы можете помочь проекту, поделившись ссылкой на наш ресурс с вашими друзьями