Вам нужен читательский билет Российской Государственной библиотеки. Заходите в раздел "доступ к базе диссертаций" https://dvs.rsl.ru, где вы уже можете можете выяснить, у кого из интересующих вас лиц имеются работы, на какую тему.
А также можете просматривать сканы первых 10% всех работ. По этим признакам можно вполне определить "клиентскую базу": как правило, погуглив десяток фраз из введения диссертации, уже определяешь, есть плагиат или нет. Важным косвенным признаком является время защиты диссертации и тема. Все, сделанное в советские времена - вне подозрений; как правило, вне подозрений и то, что ваш "клиент" сделал прежде начала активной карьеры.
Не нужно пытаться искать плагиат в работах по точным наукам - физике, химии, математике, биологии.
Когда подозрения на плагиат по первым 10% сформированы, можно переходить к полному тексту. Годовой полный доступ http://store.rsl.ru/ к текстам диссертаций (до 15 штук в месяц) в Ленинке стоит 3000 рублей, он покупается здесь , что я думаю вполне разумно, по сравнению с теми сайтами, где за отдельный документ вам придется выложить 500 рублей.
Получив полный доступ, вы уже можете сделать выводы, сравнив полный текст с источниками, с которых он списан. Тем, кому сложно записаться в Ленинку или есть проблемы с оплатой полного доступа, замечу, что на самом деле даже на бесплатных ресурсах к некоторым диссертациям бывает открыт частичный доступ, поэтому можете пользоваться и ими.
Далее нужно обзавестись программами:
- 1. ScanKromsator версия 5.6
- 2. SCREENSHOT CAPTOR
- 3. ABBYY Finereader
Запeскаем и настраиваем SCREENSHOT CAPTOR : идем в edit\preferences:
\saving and loading files
указываем ему, в какую папку сохранять файлы, больше ничего не меняем
\image file format
- Выбираем png.
- Цветность - у меня truecolor, но я не уверен, что это правильно.
- Важно! разрешение ставим 96 dpi! Для скриншотов фиксировано количество пикселей, а не физический размер (в отличие от сканов). Поэтому выставив большее разрешение вы качество не улучшите, а размер картинки уменьшите.
\interface options 1
- выбираем Stay minimized - чтобы при изготовлении скрина не выскакивал диалог
Проверяем, что все работает: делаем несколько скриншотов кнопкой принтскрин, идем в указанный каталог, и смотрим, что там возникли файлы, поименованные временем их создания
Теперь открываем документ на весь экран (нажимаем значок в браузере ленинки справа). На экране есть также кнопка перехода к ландшафтному режиму страницы, когда практически все пространство экрана занято текстом. Ею пользоваться не надо, так как придется вращать КАЖДУЮ страницу. Вместо этого переводим весь компьютер в ландшафтный режим. Это делается там же в настройках экрана, где меняеться разрешение экрана. При этом монитор придется повернуть на 90 градусов, или самому перейти из положения сидя/стоя в положение лежа на боку. Ставим масштаб 140% в Ленинке. На немного неформатных диссерах можно выставить 120%. Важно проверить, что при листании нет ситуации, когда на части страниц буквы обрезаются, и что изображение не надо таскать мышкой. Если есть такая проблема, надо уменьшить масштаб. Важно, чтобы все файлы были сделаны в одном масштабе, и картинка лежала в одной и той же области экрана
Делаем скриншоты всех страниц документа. Листать быстрее, чем 1 страница в 10-15 сек нельзя, поэтому есть смысл пролистывая читать каждую странцу - так находятся всякие смысловые несообразности в тексте, глупости и перлы.
Ну вот, у нас есть несколько сотен страничек. Но от них, прежде сшивки в электронную книгу, надо отрезать элементы управления и поля. Делается это ScanKromsator.
- Открываем все файлы сразу с помощью file\open. На белом поле слева вверху появляется их список. Проверяем, что они упорядочились по алфавиту (= по времени создания, т.к. мы в скриншоткэпторе задавали такую опцию). На первый файл ставим зеленую галку. Выставляем слева во вкладках опции:
\pages убираем галки из deskew, despeckle, split
- automargins OFF
\book проверяем, что page width, page height auto, стоит галка use average width
\files указываем, куда сохранять файлы
- можем указать output prefix, тогда файлы будут именоваться prefix 0001 итд.
- Outputformat tiff uncompress (можно экспериментировать, я не пробовал другие)
- dpi - я ставлю original, хотя наверное это неправильно и надо ставить 300. Подумаю.
- color - ни в коем случае не чернобелый, я ставлю original, и не советую экспериментировать.
\options 2 "ONLY CUT" (абсолютно важно!)
Дальше самое главное: ВВЕРХУ СТРАНИЦЫ ВЫСТАВИТЬ ЧЕТЫРЕ ГАЛКИ против: Xl (две галки), Yt, Yb - это фиксирует вручную одинаково для всех страниц четыре резака. Дальше ВЫСТАВЛЯЕМ РЕЗАКИ: резаки по ширине находятся СНИЗУ, резаки по высоте - справа и слева. Ездящие штуки СВЕРХУ - НЕ НУЖНЫ, не знаю, что они такое и зачем.
Потом ставим курсор на первый файл в списке файлов вверху и листаем стрелочкой вниз файлы. Проверяем при этом, что:
- резаки стоят на одном месте и не съезжают
- текст на всех страничках в них попадает
- нумерация страниц верная
- нет лишних и нет пропущенных страниц
Проверили - можно нажать снизу кнопку apply up to current, и настройки обрезки тогда распространятся на все файлы. Все! теперь жмем Process наверху. Получаем через пару минут несколько сотен аккуратно обрезанных файлов. Проверяем, что у них нет лишних полей. Загоняем их в прогамму типа finereader, который сделает всю работу сам - в нем ничего не меняем.
После чего остается самая интересная часть работы.
Отзывы и комментарии
< Предыдущая | Следующая > |
---|
Комментарии
Пархоменко также помнил о самых известных случаях плагиата, которые были обружены проектом «Диссернет». Это диссертации уполномоченного по правам ребенка при президенте России Павла Астахова и бывшего префекта Северного административно го округа Москвы Сергея Митволя.
RSS лента комментариев этой записи