Изменения

Перейти к навигации Перейти к поиску
м
Строка 1: Строка 1: −
{{raw:t-ru-pool:Содержание справа}}
+
#перенаправление [[:t-ru-lib:Справка:Добавление_изображений_и_текстов_источников]]
Доступ к исходной информации – это хорошее подспорье для исследователя. И это одна из основных изначальных задач [[Теопедия:Вехи|Теопедии]].
  −
 
  −
Для примера рассмотрим добавление изображений и текстов источников [[:t-en-lib:HPB SB|Личного архива Е.П.Блаватской]] в англоязычной части Теопедии.
  −
 
  −
=Работа с изображением=
  −
==Подготовка файла==
  −
* '''Используем оглавление для нахождения названия периодики'''. Заодно приводим названия к единообразию (артикли убраем в конец):
  −
: -- The Daily Graphic --> ''Daily Graphic, The''
  −
: -- Daily Graphic --> ''Daily Graphic, The''
  −
: -- London Spiritualist --> ''Spiritualist, The (London)''
  −
 
  −
 
  −
* '''Единообразное оформление имён файлов''': Название_периодического_издания_Номер_Дата
  −
: Например: ''Spiritualist, The (London) No.179 1876-01-28.pdf''
  −
 
  −
* '''Правила наименования''' опубликованы на странице:
  −
https://en.teopedia.org/lib/Category:Blavatsky_H.P._Scrapbooks
  −
 
  −
 
  −
==Загрузка в Теопедию==
  −
* '''Загружаем через специальную страницу''', которая автоматически добавит файл в нужную категорию:
  −
https://en.teopedia.org/lib/Special:BatchUpload/HPB-SB-sources
  −
 
  −
* '''Добавляем изображения на страницу ЛА ЕПБ''', предваряя служебным шаблоном:
  −
<pre>{{HPB-SB-footer-sources}}
  −
[[File:Spiritualist, The (London) No.179 1876-01-28.pdf|page=10|400px|The Spiritualist, No. 179, 1876-01-2, p. 44]]
  −
[[File:Spiritualist, The (London) No.179 1876-01-28.pdf|page=11|400px|The Spiritualist, No. 179, 1876-01-2, p. 45]]
  −
</pre>
  −
 
  −
 
  −
=Работа с текстом=
  −
 
  −
Для подготовки текста нам понадобится следующее бесплатное ПО (далее приведено больше ссылок по этим программам):
  −
* '''[https://ru.libreoffice.org/download/ LibreOffice]''' - офисные программы, мы будем использовать текстовый редактор Writer
  −
* '''[https://sysadminwiki.ru/w/images/b/b0/Altsearch.zip Altsearch]''' - расширение к LibreOffice, улучшенный поиск и замена
  −
* '''[https://sysadminwiki.ru/w/images/3/3f/Writer2wiki-0.13.oxt.zip Writer2Wiki]'''  - расширение к LibreOffice, экспорт в вики формат
  −
 
  −
 
  −
== Распознавание текста==
  −
Для распознавания текста из изображения (OCR) можно использовать следующие способы (отличаются по качеству):
  −
* [https://www.abbyy.com/ru/ Abby FineReader] -- платное приложение, дающее наилучший результат на сегодняшний день
  −
 
  −
* онлайн сервисы OCR (их много), например:
  −
** https://www.onlineocr.net/ru/
  −
** https://translate.yandex.ru/ocr
  −
 
  −
* Расширение [https://www.mediawiki.org/wiki/Extension:Proofread_Page Proofread Page] для вычитки распознанных текстов имеет собственное приложение для распознавание, но оно ещё очень слабое. В Теопедии оно установлено для улучшения вычитки (см. далее).
  −
 
  −
 
  −
== Автоматическая обработка текста ==
  −
После распознавания текста необходима его вычитка. В этом процессе некоторые исправления можно автоматизировать. Для этой работы рекомендую использовать '''LibreOffice''' ([https://ru.libreoffice.org/download/ скачать]) c расширением '''Altsearch''' ([https://sysadminwiki.ru/w/images/b/b0/Altsearch.zip скачать], [http://myooo.ru/content/view/39/29/ читать], см. чуть подробнее на [https://sysadminwiki.ru/wiki/LibreOffice#.D0.A1.D0.BA.D0.B2.D0.BE.D0.B7.D0.BD.D0.BE.D0.B9_.D0.BF.D0.BE.D0.B8.D1.81.D0.BA_.D0.B8_.D0.B7.D0.B0.D0.BC.D0.B5.D0.BD.D0.B0 Сисадминвики]).
  −
 
  −
Итак, в текстовом редакторе делаем следующую обработку текста:
  −
* заменяем принудительный перенос строки на пробел;
  −
* заменяем два пробела на один.
  −
* другие автозамены, смотря по особенностям текста
  −
 
  −
 
  −
== Экспорт в вики формат ==
  −
Доустанавливаем в LibreOffice расширение '''Writer2Wiki''' (скачать [https://sysadminwiki.ru/w/images/3/3f/Writer2wiki-0.13.oxt.zip подготовленное расширение] или [https://github.com/teopedia/writer2wiki/archive/master.zip исходный дистрибутив], читать)
  −
 
  −
 
  −
==Загрузка в Теопедию==
  −
 
  −
Полученный при экспорте текст (в формате вики) вставляем в соответсвующую страницу.
  −
 
  −
 
  −
==Вычитка==
  −
В зависимости от выбранного способа вычитку можно делать:
  −
* '''В LibreOffice''' до экспорта в вики формат. Открываем паралельно изображение и сверям текст.
  −
 
  −
* '''На странице расширения вычики''' (если таковая делается средствами сайта), например, см вычитку одного из выпусков лондонского журнала  [https://en.teopedia.org/lib/Page:Spiritualist,_The_(London)_No.179_1876-01-28.pdf/10 "Спиритуалист"]. Доп информация:
  −
**  [https://www.mediawiki.org/wiki/Extension:Proofread_Page Proofread Page] -- описание расширения
  −
** [https://ru.wikisource.org/wiki/Справка:Вычитка Помощь по вычитке] на проекте WikiSource.org.
  −
 
  −
* '''На страницах Теопедии''', когда текст уже загружен на нужную страницу. Открываем паралельно изображение и сверям текст.
  −
 
  −
[[Категория: Справка]]
 

Навигация