Тридцать лет назад, будучи студентом, я искал пособие, в котором в сжатой и понятной форме излагается техника быстрого написания исследовательской работы. Скоростной методики не нашлось, зато были классические правила: набрать тонну литературы, почитать источники, расставить в книжках закладки, сделать выписки, конспекты, скомпилировать текст, вычитать и связать логически.
Идея разработки технологии скоростного написания работ нашла свое продолжение в 2009 г. К этому времени в рамках деятельности научного объединения «ГУМАНИТАРИЙ» была собрана довольно приличная научная электронная библиотека (ЭБ), которая, по объему фонда, в несколько раз превосходила классические университетские библиотеки.
Компания «СерчИнформ» ныне ведущий российский разработчик средств информационной безопасности, резидент Инновационного центра «Сколково», входящая в АРПП «Отечественный софт» и НП «Руссофт», в 2008-2010 гг. разрабатывала локальную поисковую систему промышленного класса: стресс-тестирование поисковика проводили на базе фонда ЭБ НИО «ГУМАНИТАРИЙ» (рис. 1).
Рисунок 1 – Пресс-релиз СёрчИнформ
В 2010 г. идея скоростного написания научных исследований получила свое развитие с новой силой. «СерчИнформ» не только предлагал возможность разнообразного поиска в локальных файлах, но и реализовывал функцию «поиска похожих» – поиск больших текстов на основании маленьких. Используя продукт СерчИнформ, мы научились извлекать необходимые данные из текстовых неструктурированных массивов, добавляя к заимствованиям библиографическую запись. Это позволяло компилировать теоретические разделы исследований за считанные часы. Генезис антиплагиата несколько замедлил развитие компилятивной технологии, поскольку все тексты, извлекаемые из фонда ЭБ, были плагиатом. Библиотеки сразу из источника знаний стали источником плагиата. Решение было найдено и представлено Интернет-общественности в 2021 г.
КонтрПлагиат, академическая нейронная сеть. Цель проекта – повышение уникальности академических текстов методом глубокого перефразирования (рерайтинг), перегенерация текстов (копирайтинг).
В 2022 г. КонтрПлагиат научился работать с файлами, имеющими сложную структуру, текст, математический аппарат, таблицы, рисунки, подстрочный ссылочный аппарат.
В 2023 г. антиплагиат РУ вывел на рынок решение – детектор генеративных текстов, созданных с помощью больших языковых моделей (LLM). На следующий день КонтрПлагиат объявил, что умеет работать с большими текстами, имеющими статус: «Внимание, документ подозрительный: в документе присутствует сгенерированный текст».
Этот статус КонтрПлагиат убирает благодаря перефразированию и компилятивным умениям, доставшимся в наследство от НИОО «ГУМАНИТАРИЙ». Технология вызвала неподдельный интерес, и статья набрала за два месяца 44 570 просмотров (рис. 2).
Рисунок 2 – Статья КонтрПлагиат: «Внимание, документ подозрительный: в документе присутствует сгенерированный текст – Антиплагиат.ВУЗ выявляет тексты, созданные AI (ИИ)»
Как видно из краткого исторического экскурса, проблема скоростного написания исследовательских работ не нова, появление GPT заметно оживило этот процесс, наполнив академическую среду паническими настроениями. Паникуют все, профессорско-преподавательский состав, который захлестнула волна генеративных работ. Студенты, которые сгенерировали примитивные работы и не могут пройти проверку в антиплагиат версии ВУЗа.
Большие языковые модели (LLM) приходят к нам надолго и проникают во все инструментальные среды, интерфейсы, приложения и практики. Правильным, по нашему мнению, является не запрет их применения, а приобретение навыков их использования в исследовательской деятельности, что снижает рутинную составляющую и дает достаточно времени для творческого процесса.
Примером применения ИИ GPT и КонтрПлагиат выступает данное пособие, которое обобщает практический опыт и рассматривает процесс написания исследований с точки зрения – как упростить, а не с позиции классической методологии – как усложнить.