Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания



Скачать 29.15 Kb.
Дата11.07.2014
Размер29.15 Kb.
ТипЗадача
Полуавтоматическое определение заимствованных элементов текста

Тарануха Владимир Юрьевич

Международный Научно-Учебный Центр Информационных Технологий и Систем НАН Украины и МОН Украины

Киев, Украина

taranukha@mail.ru

Необходимость решения задачи определения заимствованных элементов текста обусловлена огромным числом легкодоступных текстов в сети Интернет. Задача проверки уникальности текста вручную очень затратна по времени даже при наличии мощных поисковых систем.

Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания. Проверяющие инстанции часто обращают внимание лишь на процент элементов, отмеченных как «заимствование», что приводит к абсурдным результатам. Существующие системы Антиплагиат.Ру[1] и «Антиплагіат»[2] склонны к избыточной чувствительности. Например, Антиплагиат.Ру может отметить как заимствование очевидно необходимые конструкции вида «работа состоит из трех разделов».

Разработанная модель текста позволяет решать задачу определения заимствованных элементов текста. Текст будет считаться последовательностью тематических или сюжетных элементов.



,

где – отдельный текст, – множество абзацев, – отношение следования, определенное на абзацах и зависящее от того, как и что хотел донести до читателя автор.

Абзац разбивается на совокупность предложений, каждое из которых вводит, уточняет или связывает некоторые смыслы.

,

где – i-й абзац, – множество предложений в абзаце, – отношение следования, определенное на предложениях и зависящее от того, как и что хотел донести до читателя автор. Между предложениями одного абзаца действуют смысловые связки и языковые указатели.

Дополнительно вводится структура предложения, для оперирования словами, а не отдельными предложениями.

,

где – j-е предложение, i-го абзаца, – множество слов в абзаце, – множество синтаксических отношений между словами.

Выполнение условия - подозрение на плагиат.

Данное отношение раскрывается как:





– функция, которая возвращает предложение, на которое есть указатели, – функция, которая возвращает предложения, к которым есть смысловые связи.

Учет структуры таких отношений позволяет маркировать возможные заимствования, надежно ранжировать вероятные заимствования по правдоподобности плагиата. Это позволяет отсеивать малоправдоподобные случаи.



ЛИТЕРАТУРА

  1. http://www.antiplagiat.ru/forum/

  2. http://www.iit.nau.edu.ua/uk/research/antiplagiat/

Похожие:

Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания iconИнтеграция меры близости в логико-марковской сети в задаче извлеченния временной информации с текста
Например, мы, возможно, будем интересоваться, когда и за сколько время одно событие, описано в новости случилось. Эта задача связана...
Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания iconПовествовательной идентичностью
Кант. Задача скорее состоит в том, чтобы исследовать многочисленные возможности установления связей между постоянством и изменением,...
Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания iconЗадача состоит в минимизации тепловых потерь трубопровода горячей воды
Методика расчета автоматизирована путем применения программных пакетов MathCad и WaterSteamPro
Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания iconТребования к набору текстов в редакторе ms word
Для подготовки текста используйте только системный шрифт Times New Roman. Не применяйте никаких других шрифтов, это может привести...
Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания iconСоздание и обработка информационных объектов Редактирование текстовых документов. Редактирование текста
Из каждого текста можно вырезать куски, соединять их, вставлять в рабочий материал части из других текстов, менять их местами и пр....
Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания iconПонятие совершенного шифра для других криптоатак
Это так, поскольку при заданном подмножестве открытых текстов получение множества криптограмм возможно лишь при зашифровании на некотором...
Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания iconО логико-семиотических проблемах теории понимания текстов
У. Эко. В статье предлагается несколько логических понятий, которые могут быть использованы в семиотической теории понимания текстов...
Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания iconСовокупность всех мыслимых элементов какого-нибудь типа определяемого классом решаемых проблем
Пересечение – множество, состоящее из тех элементов множества А, которые являются также элементами в (А ∩ В)
Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания iconРадиация: основные понятия, единицы измерения, влияние на человека
При этом в подавляющем большинстве случаев ядра атомов (а значит, и сами атомы) одних химических элементов превращаются в ядра атомов...
Задача установления плагиата состоит из определения элементов текста, которые, возможно, являются заимствованными из других текстов и минимизации случаев ложного положительного срабатывания iconСборник текстов для домашнего чтения составители: соловьева т. И
Упражнения, предлагаемые после текстов, позволяют организовывать последовательную работу над лексикой, обеспечить контроль понимания...
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org