whycomputer.com >> Интернет познания >  >> Софтуер

Как да извлечете текст от PDF документ

Може да бъде много разочароващо да се опитате да извлечете текст от PDF файл за използване в друго приложение. Не е необичайно графиките да се превърнат в начин или за оформление на документа, за да затруднят прехвърлянето на теста в смислени изречения. Въпреки че не е невъзможно да се извлече текст с копиране и поставяне, той може да отнеме много време и не позволява извеждането на PDF файл в различен формат. Има, обаче, няколко начина за извличане на текст от PDF файл.

Извличане на текст с помощта на Acrobat Reader

Стъпка 1
Отворете файла в Acrobat Reader. В Windows изберете "Файл -> Експортиране на документ в текст", наименовайте документа и го запазете.

Стъпка 2
Копирайте текста на Mac или Linux OS, като влезете в менюто Изглед и изберете " Непрекъснато или непрекъснато. (Първият ще ви даде текста в една колона, докато последният ще форматира текста като странични страници.) ​​Отидете на "Редактиране -> Избери всички" и след това "Редактиране -> Копиране." Използвайте инструмента за избор, ако искате да извлечете само част от текста. Щракнете върху инструмента "Избор на текст" и след това изберете информацията, която искате. В документ, форматиран в няколко колони, първо трябва да използвате инструмента "Избор на колони". Отидете на "Редактиране -> Копиране."

Конвертиране на PDF в HTML

Стъпка 1
Използвайте Gmail като пряк път. Прикачете PDF файла към имейл и го изпратете в профила си в Gmail. Когато отворите имейла, ще видите няколко опции до прикачения файл. Изберете "Преглед като HTML" и запишете файла, който се отваря в отделен прозорец. Въпреки че няма да можете да видите никакви графики, HTML файлът ще запази форматирането на текста на документа.

Стъпка 2
Извличане и конвертиране на файлове в командния ред. Потребителите на Linux могат да използват основна команда за преобразуване, която ще промени .pdf файл в .txt файл: "pdftotext filename.pdf." Не забравяйте да замените името на файла с името на PDF файла.
Изтеглете програма за конвертиране на PDF в текст. Има редица отворени и безплатни програми, като PDFBox и Easy PDF to Text Converter (виж Ресурси по-долу). Много от тези програми също могат да конвертират PDF файлове в HTML.

Съвети
Определете дали документът е форматиран така, че да съдържа текст и графики. Подходът Adobe Acrobat ще работи само ако PDF файлът съдържа и двете; няма да работи само за файлове с изображения. В някои случаи текстът в PDF документ всъщност е форматиран като изображение. Това често се случва, когато се сканира оригинален документ и се създава PDF файл от сканираното изображение.
Бъдете готови да преформатирате част от текста, когато използвате Acrobat Reader. Този начин на извличане просто изнася PDF файла в текстов файл - той няма да запази задължително запазването на форматирането. Въпреки това, ако просто трябва да използвате думите, това не би трябвало да е проблем.

Необходими артикули

  • PDF файл
  • Adobe Acrobat Reader
  • профил в Gmail (по избор)
  • PDF към софтуер за преобразуване на текст (по избор)


    URL:https://bg.whycomputer.com/soft/100200187.html

  • Софтуер
    • Как да направите документ в Word в PDF

      Форматът на преносимите документи на Adobe е предназначен да поддържа форматирането на документ, без значение къде се преглежда или отпечатва. Microsoft Word не включва опция за създаване на PDF файлове по подразбиране. Съществуват обаче няколко начина за създаване на PDF файлове от документи на Wor

    • Как да премахнете защитата от PDF файл

      Ако имате защитен PDF файл на компютъра, така че да не можете да го отваряте или редактирате, ще трябва да премахнете защитата от този PDF файл. Ако първоначално не сте създали PDF файла, ще трябва да използвате софтуер на трети страни, за да премахнете ограниченията върху файла. GuaPDF е програма,

    Интернет познания © https://bg.whycomputer.com