linewb.ru

linewb.ru - Ответы на вопросы
The FAQ » Компьютеры/Интернет » Как извлечь текст из файла в формате PDF?

Как извлечь текст из файла в формате PDF?

Метки ответа: PDF, файл, текст, формат
Как извлечь текст из файла в формате PDF? Преобразование документа в формате PDF в редактируемый текст

1. Функция «Сохранить как текст» («Save as text»).

В последних версиях Adobe Reader в меню «Файл» существует функция «Сохранить как текст». Если в исходном файле отсутствуют защиты текста, используя эту функцию можно за один клик преобразовать все страницы исходного файла в открытый для редактирования текст.

2. Функция «Выделение текста» («Text Select»).

Также в Adobe Reader имеется простой инструмент «Text Select» («Выделение текста»), который хорошо работает с отдельными строками текста. Чтобы выделить нужный фрагмент текста, нужно вытягивать прямоугольник выделения до конца отрывка текста, скопировать выделенный фрагмент в буфер обмена и вставить в любую программу-редактор текстов.

3. OCR-программы.

Если установлена защита от копирования или при копировании текст сохраняется в виде вопросов и символов, можно воспользоваться специализированным программным обеспечением для распознавания текста. Это так называемые OCR-программы (Optical Character Recognition — оптическое распознавание знаков), которые преобразуют PDF-файл в редактируемый текст для последующей работы с ним.

Эти программы и их подробные характеристики можно найти по следующим ссылкам:

abbyy - программа ABBYY FineReader
irislink - программа ReadIris
cuneiform - программа CuneiForm,
nuance - программа OmniPage.

4. Программы- конверторы PDF- файлов и их характеристики можно найти по следующим ссылкам:

abbyy - программа ABBYY PDF Transformer (конвертирование в Word, Excel);
toppdf - программа PDF2Word (конвертирование в Word);
verypdf - программа VeryPDF PDF2Word (конвертирование в Word);
hellopdf - программа Free PDF to Word Converter (конвертирование в Word);
soliddocuments - программа Solid Converter PDF(конвертирование в Word, Excel);
tweakpdf - программа Tweak PDF Converter (конвертирование в Word).

5. Бесплатные онлайн- сервисы для конвертации файлов:

zamzar - сервис ZamZar — бесплатный онлайн конвертор файлов, способный преобразовать PDF документ во многие графические и текстовые форматы. Сервис работает через электронную почту. Лимит на размер исходного файла — 100 мБ. Файл хранится на сервере в течение 24 часов;
freepdfconvert - сервис FreePDFConvert — конвертация PDF в Word (doc), Excel (xls) или RichText (rtf), извлечение картинок из PDF. После конвертации сервис предоставляет возможность скачать файл, отправить его на указанный почтовый ящик, удалить файл с сервера. Интервал до отправки следующего файла — 30 минут;
pdfonline - сервис PDFOnline — преобразование документов PDF в Word (RTF). Сервис не требует указания почтового ящика и не накладывает ограничений на размер файла и количество загрузок по времени;
freepdftoword - бесплатный сервис от производителей программного обеспечения Solid. Для конвертации файла PDF в отформатированный документ Word разработчики предлагают предварительно отправить им PDF документ по электронной почте, обратно придёт конвертированный в Word документ.

Присоединяйся к нам

Введите ваш eMail:

Нас уже

Наши друзьяНаши друзья

Случайный ответСлучайный ответ

как редактировать pdf-документы?
Во избежание потерь качества и удобства печати многие документы сейчас передаются в виде pdf-файлов. Однако иногда их надо отредактировать, и сделать...
Читать далее